音频特征处理方法及装置、存储介质及电子设备制造方法及图纸

技术编号：29407450 阅读：37 留言：0更新日期：2021-07-23 22:47

本发明专利技术提供了一种音频特征处理方法及装置、存储介质及电子设备，该方法包括：获取待处理音频的目标音频帧的音频特征，所述音频特征由多个维度的子特征数据组成；在所述音频特征的各个维度的子特征数据中确定出所述音频特征的目标子特征数据；对所述目标子特征数据进行增强，获得增强子特征数据；将所述音频特征中的目标子特征数据替换为所述增强子特征数据，获得目标音频特征。应用本发明专利技术提供的音频特征处理方法，能够对音频特征的部分特征维度的子特征数据进行增强，从而获取到新的目标音频特征数据，能够极大的减少扩充音频特征的所花费时间，节约计算资源，提升音频特征的扩充效率。

全部详细技术资料下载

【技术实现步骤摘要】
音频特征处理方法及装置、存储介质及电子设备
本专利技术涉及音频数据处理
，特别涉及一种音频特征处理方法及装置、存储介质及电子设备。
技术介绍
随着科学技术发展，语音识别模型已广泛应用到各行各业，在各个场景发挥着非常重要的作用。语音识别模型需要大量音频特征进行训练，而在音频特征的数量不足的情况下会导致模型的训练效果不好。目前，为了增加音频特征的数量，通常会通过对原始音频增加速度扰动、音量扰动以及增加噪声的方式扩充音频的数量，从而增加音频特征的数量，然而，采用现有的方式来扩充音频特征的数量，会导致需要处理的音频的数量增多，进而增加了音频特征的提取时间，计算资源消耗大。
技术实现思路
本专利技术所要解决的技术问题是提供一种音频特征处理方法，能够有效的减少扩充音频特征的时间。本专利技术还提供了一种音频特征处理装置，用以保证上述方法在实际中的实现及应用。一种音频特征处理方法，包括：获取待处理音频的目标音频帧的音频特征，所述音频特征由多个维度的子特征数据组成；在所述音频特...

【技术保护点】
1.一种音频特征处理方法，其特征在于，包括：/n获取待处理音频的目标音频帧的音频特征，所述音频特征由多个维度的子特征数据组成；/n在所述音频特征的各个维度的子特征数据中确定出所述音频特征的目标子特征数据；/n对所述目标子特征数据进行增强，获得增强子特征数据；/n将所述音频特征中的目标子特征数据替换为所述增强子特征数据，获得目标音频特征。/n

【技术特征摘要】
1.一种音频特征处理方法，其特征在于，包括：
获取待处理音频的目标音频帧的音频特征，所述音频特征由多个维度的子特征数据组成；
在所述音频特征的各个维度的子特征数据中确定出所述音频特征的目标子特征数据；
对所述目标子特征数据进行增强，获得增强子特征数据；
将所述音频特征中的目标子特征数据替换为所述增强子特征数据，获得目标音频特征。

2.根据权利要求1所述的方法，其特征在于，所述获取待处理音频的目标音频帧的音频特征，包括：
基于已设定的采样点数量以及移动步长对所述待处理音频进行分帧，获得所述待处理音频的各个音频帧；
在所述各个音频帧中确定所述待处理音频的目标音频帧；
对所述目标音频帧进行特征提取，获得所述目标音频帧的音频特征。

3.根据权利要求2所述的方法，其特征在于，所述对所述目标音频帧进行特征提取，获得所述目标音频帧的音频特征，包括：
对所述目标音频帧进行预加重处理，获得第一音频帧；
为所述第一音频帧添加汉明窗，获得的第二音频帧；
对所述第二音频帧进行快速傅里叶变换，获得所述第二音频帧的频域数据；
基于所述频域数据获得所述目标音频帧对应的梅尔频谱；
依据所述梅尔频谱获得各个已设定的特征维度对应的三角滤波器；
将所述频域数据对应的能量输入至各个所述三角滤波器，获得所述目标音频的音频特征。

4.根据权利要求1所述的方法，其特征在于，所述对所述目标子特征数据进行增强，获得增强子特征数据，包括：
确定所述目标子特征数据对应的增强倍数；
基于所述增强倍数对所述目标子特征数据进行增强，获得所述增强子特征数据。

5.根据权利要求1所述的方法，其特征在于，还包括：
应用所述目标音频数据对预设的语音识别模型进行训练。

6.一种音频特征处理装置，其特征在于，包括：
获取单元，用于获取待处理音频的...

【专利技术属性】
技术研发人员：岑吴镕，李骊，
申请(专利权)人：北京华捷艾米科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人