python中常见的几种音频数据读取、保存方式_F11 - 专业站长和开发者的学习网站

分享到

python中常见的几种音频数据读取、保存方式

python 来源：互联网作者：佚名发布时间：2024-06-22 22:06:29 人浏览

摘要

1. soundfile 库的使用 soundfile库是一个Python库，主要用于读取和写入音频文件。它支持多种音频格式，包括WAV、AIFF、FLAC和OGG等。通过soundfile库，用户可以方便地将numpy数组存储到音频文件或者将

1. soundfile 库的使用

soundfile库是一个Python库，主要用于读取和写入音频文件。它支持多种音频格式，包括WAV、AIFF、FLAC和OGG等。通过soundfile库，用户可以方便地将numpy数组存储到音频文件或者将音频文件加载到numpy数组中。此外，soundfile库还提供了一些函数，用于处理音频数据。它的使用简单且灵活，方便进行音频处理和分析的工作。

1.1 read 读文件

读取音频文件数据

import soundfile as sf

# wav numpy 型数据，sr是采样率

filename = "xx/xx.wav"

wav, sr = sf.read(filename, dtype='float64)

可通过dtype将任意的音频文件数据格式转为float64,float32,int16,int32 的numpy型数据，其中float64,float32是归一化后的结果。dtype 默认值为float64。

1.2 write 保存文件

保存音频文件数据

1 2	# save_filename, 保存的音频文件路径，data保存的数据，samplerate是采样率 sf.wrtie(save_filename,data,samplerate)

支持写入的数据也为float64,float32,int16,int32，并保存相应格式的数据

2. torchaudio 库的使用

torchaudio是PyTorch深度学习框架的一部分，主要用于处理和分析音频数据。它提供了丰富的音频信号处理工具、特征提取功能以及与深度学习模型结合的接口，使得在PyTorch中进行音频相关的机器学习和深度学习任务变得更加便捷。通过使用torchaudio，开发者能够轻松地将音频数据转换为适合深度学习模型输入的形式，并利用PyTorch的高效张量运算和自动梯度功能进行训练和推理。此外，torchaudio还支持多声道音频处理和GPU加速，以满足不同应用场景的需求。

2.1 load 读文件

加载音频文件数据

import torchaudio

file_path = "xx/xx.wav"

waveform, sr = torchaudio.load(file_path, normalize=True)

主要说明：

可以读取float32, int16, int32类型数据，返回的是torch.tensor类型的数据；
normalize=True时，返回的数据是归一化到(-1,1)的float32数据；
normalize=False时，返回的是float32、int16或者int32数据，具体需要看file_path本身是什么类型的音频数据；
normalize默认值为True。

2.2 save 保存文件

保存音频数据到文件

1 2	# out_path, 保存的音频文件路径，waveform保存的数据，sr是采样率 torchaudio.save(out_path, waveform, sr)

根据waveform的格式自动保存为float32、int16或者int32

3. from scipy.io import wavfile 库的使用

scipy.io.wavfile库是SciPy科学计算库中的一个模块，主要用于读取和写入WAV格式的音频文件。该库提供了函数用于将音频数据存储为WAV文件或者将WAV文件加载为numpy数组，方便进行音频数据的处理和分析。用户可以使用scipy.io.wavfile库来读取音频文件的采样率和数据，以及将音频数据写入WAV文件。此外，该库还提供了一些函数用于处理音频数据，如获取音频数据的声道数、比特深度等信息。通过scipy.io.wavfile库，用户可以方便地进行音频文件的读写操作，并结合其他Python库进行音频数据处理和分析。

3.1 read 读文件

from scipy.io import wavfile

file_name = "xx/xx.wav"

sr, wav_data = wavfile.read(file_name)

返回的是float32、int16、int32型numpy数据，具体格式根据file_name文件的音频格式

3.2 save 保存文件

1 2	# filename, 保存的音频文件路径，wav_data保存的数据，sr是采样率 wavfile.wrtie(filename, sr, wav_data)

根据wav_data的格式自动保存为float32、int16或者int32。

注：以上float32、float64数据是归一化后的结果，与其他转换为int16 / 2 ** 15，int32 / 2 ** 31

附： soundfile安装报错与解决

①问题描述

在终端使用pip install soundfile安装soundfile时报错。

②问题解决

python处理音频文件经常要使用soundfile库。ubuntu系统在pip安装soundfile库时报错，是因为缺乏依赖包libsndfile1，所以要先安装依赖包，然后再安装soundfile。命令如下：

step1：终端输入sudo apt-get install libsndfile1

step2：终端输入pip install soundfile

您可能感兴趣的文章 :

原文链接 :

Tag : python(877)

jupyter的安装与使用以及运行卡顿问题及解决

jupyter安装与使用及运行卡顿问题话不多说，直接上步骤 1.安装好python后，打开cmd，输入pip install jupyter即可。 2.运行，在cmd输入jupyter noteb
python中常见的几种音频数据读取、保存方式

1. soundfile 库的使用 soundfile库是一个Python库，主要用于读取和写入音频文件。它支持多种音频格式，包括WAV、AIFF、FLAC和OGG等。通过soundfile库
Python中实现xls文件转xlsx的4种方法

在 Python 中，可以采用 pandas、pyexcel、win32com 和 xls2xlsx 这四个模块，实现 xls 转 xlsx 格式。以 Excel 示例文件 test_Excel.xls 为例，具体内容如下
fastapi框架异步执行踩坑记录

fastapi框架异步执行踩坑问题与背景在公司项目中，使用了python作为中间件实现的主语言，项目是中间件性质的需要并行的为第三方提供服
python实现WebP格式转成JPG、PNG和JPEG的方法

为什么在网页上常常搜到的图片是WebP格式？ WebP的高效属性体积小，加载迅速：WebP 的核心优势在于其高压缩率。与 JPEG 相比，在保证相似
python3.9不支持pillow包解决办法

概述：我之前的项目是在centos服务器上跑着，centos服务器用的python版本是3.6.6，今天放到pycharm开发工具里安装依赖包的时候pip install -r req
python转换pkl模型文件为txt文件问题介绍

python转换pkl模型文件为txt文件 1、待转换的模型文件 2、代码实现 1 2 3 4 5 6 7 8 9 10 11 12 13 import pickle import numpy as np np.set_printoptions(threshold=np
Python将Office文档(Word、Excel、PDF、PPT)转为OFD格式的

OFD（Open Fixed-layout Document ）是我国自主制定的一种开放版式文件格式标准。OFD文档具有不易被篡改、格式独立、版式固定等特点，目前常用
python使用MkDocs自动生成文档的操作方法

python代码注释风格有很多，比较主流的有reStructuredText风格、numpy风格、Google风格。自动生成文档的工具也有很多，常见的有： Pydocs python环
python打印exception信息的方法

一直以为掌握以下内容就够了。 1 2 3 4 5 6 7 8 9 10 11 try: #正常执行语句 pass except: #如果正常执行语句不对，执行替代语句 pass finally: 不论正常

python中常见的几种音频数据读取、保存方式

1. soundfile 库的使用

1.1 read 读文件

1.2 write 保存文件

2. torchaudio 库的使用

2.1 load 读文件

2.2 save 保存文件

3. from scipy.io import wavfile 库的使用

3.1 read 读文件

3.2 save 保存文件

附： soundfile安装报错与解决

您可能感兴趣的文章 :

jupyter的安装与使用以及运行卡顿问题及解决

python中常见的几种音频数据读取、保存方式

Python中实现xls文件转xlsx的4种方法

fastapi框架异步执行踩坑记录

python实现WebP格式转成JPG、PNG和JPEG的方法

python3.9不支持pillow包解决办法

python转换pkl模型文件为txt文件问题介绍

Python将Office文档(Word、Excel、PDF、PPT)转为OFD格式的

python使用MkDocs自动生成文档的操作方法

python打印exception信息的方法

python批量下载抖音视频

利用Pyecharts可视化微信好友的方法

python爬取豆瓣电影TOP250数据

基于tensorflow权重文件的解读

解决Python字典查找报Keyerror的问题