1. soundfile 库的使用 soundfile库是一个Python库,主要用于读取和写入音频文件。它支持多种音频格式,包括WAV、AIFF、FLAC和OGG等。通过soundfile库,用户可以方便地将numpy数组存储到音频文件或者将
1. soundfile 库的使用soundfile库是一个Python库,主要用于读取和写入音频文件。它支持多种音频格式,包括WAV、AIFF、FLAC和OGG等。通过soundfile库,用户可以方便地将numpy数组存储到音频文件或者将音频文件加载到numpy数组中。此外,soundfile库还提供了一些函数,用于处理音频数据。它的使用简单且灵活,方便进行音频处理和分析的工作。 1.1 read 读文件读取音频文件数据
可通过dtype将任意的音频文件数据格式转为float64,float32,int16,int32 的numpy型数据,其中float64,float32是归一化后的结果。dtype 默认值为float64。 1.2 write 保存文件保存音频文件数据
支持写入的数据也为float64,float32,int16,int32,并保存相应格式的数据 2. torchaudio 库的使用torchaudio是PyTorch深度学习框架的一部分,主要用于处理和分析音频数据。它提供了丰富的音频信号处理工具、特征提取功能以及与深度学习模型结合的接口,使得在PyTorch中进行音频相关的机器学习和深度学习任务变得更加便捷。通过使用torchaudio,开发者能够轻松地将音频数据转换为适合深度学习模型输入的形式,并利用PyTorch的高效张量运算和自动梯度功能进行训练和推理。此外,torchaudio还支持多声道音频处理和GPU加速,以满足不同应用场景的需求。 2.1 load 读文件加载音频文件数据
主要说明:
2.2 save 保存文件保存音频数据到文件
根据waveform的格式自动保存为float32、int16或者int32 3. from scipy.io import wavfile 库的使用scipy.io.wavfile库是SciPy科学计算库中的一个模块,主要用于读取和写入WAV格式的音频文件。该库提供了函数用于将音频数据存储为WAV文件或者将WAV文件加载为numpy数组,方便进行音频数据的处理和分析。用户可以使用scipy.io.wavfile库来读取音频文件的采样率和数据,以及将音频数据写入WAV文件。此外,该库还提供了一些函数用于处理音频数据,如获取音频数据的声道数、比特深度等信息。通过scipy.io.wavfile库,用户可以方便地进行音频文件的读写操作,并结合其他Python库进行音频数据处理和分析。 3.1 read 读文件
返回的是float32、int16、int32型numpy数据,具体格式根据file_name文件的音频格式 3.2 save 保存文件
根据wav_data的格式自动保存为float32、int16或者int32。 注:以上float32、float64数据是归一化后的结果,与其他转换为int16 / 2 ** 15,int32 / 2 ** 31 附: soundfile安装报错与解决①问题描述 在终端使用pip install soundfile安装soundfile时报错。 ②问题解决 python处理音频文件经常要使用soundfile库。ubuntu系统在pip安装soundfile库时报错,是因为缺乏依赖包libsndfile1,所以要先安装依赖包,然后再安装soundfile。命令如下: step1:终端输入sudo apt-get install libsndfile1 step2:终端输入pip install soundfile |
2019-06-18
2019-07-04
2021-05-23
2021-05-27
2021-05-27