音频压缩方法、解压缩方法及其计算机设备和存储介质技术

技术编号：35153061 阅读：46 留言：0更新日期：2022-10-05 10:32

本发明专利技术适用于音频处理技术领域，提供了一种音频压缩方法、解压缩方法及其计算机设备和存储介质，音频压缩方法包括：获取音频数据；计算音频数据对应的梅尔频率倒谱系数；根据梅尔频率倒谱系数，通过预设的音素识别模型确定音频数据对应的音素流，从而将音频数据压缩为音素流，音素流为包含音频数据对应音素特征信息的字符串。本方案通过计算音频数据对应的梅尔频率倒谱系数可以提取人的听力能够听到频段的音频数据，滤除无效音频数据，减少数据量，同时通过音素识别模型识别音频数据对应的音素特征信息，以得到的音素流作为压缩后的音频数据，音素可以看成对音频信息的矢量化，其相比于波形特征的矢量化更抽象，相比于现有技术有效提高压缩比。效提高压缩比。效提高压缩比。

全部详细技术资料下载

【技术实现步骤摘要】
音频压缩方法、解压缩方法及其计算机设备和存储介质

[0001]本专利技术属于音频处理
，尤其涉及一种音频压缩方法、解压缩方法及其计算机设备和存储介质。

技术介绍

[0002]对于音频的传输或存储，一般都需要对音频数据进行压缩以及解压缩，其中，音频压缩指的是对原始数字音频信号流(PCM编码)运用适当的数字信号处理技术，在不损失有用信息量，或所引入损失可忽略的条件下，降低(压缩)其码率，也称为压缩编码，同时压缩编码必须具有相应的逆变换，称为解压缩或解码。
[0003]目前，现有技术中对于音频压缩的方案一般主要是利用语音波形的相关性，使用线性预测编码(LPC)及类似技术，实现语音信号的压缩和重建。
[0004]但是，现有的音频压缩方案对音频数据的压缩比较低。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种音频压缩方法，旨在解决现有的音频压缩方案对音频数据的压缩比较低的问题。
[0006]本专利技术实施例是这样实现的，所述音频压缩方法包括：
[0007]获取音频数据；
[0008]确定所述音频数据对应的梅尔频率倒谱系数；
[0009]根据所述梅尔频率倒谱系数，通过预设的音素识别模型确定所述音频数据对应的音素流，从而将所述音频数据压缩为所述音素流，所述音素流为包含所述音频数据对应音素特征信息的字符串。
[0010]本专利技术实施例的另一目的在于提供一种音频解压缩方法，所述音频解压缩方法，包括：
[0011]获取音频压缩数据和所述

【技术保护点】

【技术特征摘要】
1.一种音频压缩方法，其特征在于，所述音频压缩方法包括：获取音频数据；确定所述音频数据对应的梅尔频率倒谱系数；根据所述梅尔频率倒谱系数，通过预设的音素识别模型确定所述音频数据对应的音素流，从而将所述音频数据压缩为所述音素流，所述音素流为包含所述音频数据对应音素特征信息的字符串。2.根据权利要求1所述的一种音频压缩方法，其特征在于，根据所述梅尔频率倒谱系数，通过预设的音素识别模型确定所述音频数据对应的音素流，包括：根据所述梅尔频率倒谱系数确定所述音频数据中的音频特征信息，所述音频特征信息至少包括音素特征信息；对所述音频特征信息进行分类处理，从所述音频特征信息中获取所述音素流。3.根据权利要求1所述的一种音频压缩方法，其特征在于，所述预设的音素识别模型的训练方法，包括：获取若干音频样本以及所述音频样本对应的标注音素流；通过所述音素识别模型对所述音频样本进行音素识别，确定所述音频样本对应的预测音素流；根据所述标注音素流和所述预测音素流，通过损失函数确定所述音素识别模型的预测误差。4.根据权利要求3所述的一种音频压缩方法，其特征在于，所述音素识别模型包括Wavenet网络模型。5.根据权利要求1所述的一种音频压缩方法，其特征在于，所述音频压缩方法还包括：将所述音频数据的音量信息进行量化，并统计所述音频数据中量化后的所述音量...

【专利技术属性】
技术研发人员：周士杰，周学武，
申请(专利权)人：周学武，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人