一种音频处理方法、装置、设备及可读存储介质制造方法及图纸

技术编号：22848343 阅读：20 留言：0更新日期：2019-12-17 23:09

本发明专利技术实施例提供了一种音频处理方法、装置、设备及可读存储介质，该方法包括：预先依据获取到的各语音频段误差对应的权重信息，训练语音增强模型；在接收到混合语音信号后，依据所述语音增强模型中各语音频段对应的权重偏置参数，对所述混合语音信号进行语音增强，得到目标语音信号，其中，所述权重偏置参数为依据所述权重信息训练得到的；依据所述目标语音信号进行输出。本发明专利技术实施例解决了现有语音增强模型对各语音频段一视同仁导致降噪效果差的问题，提升了语音增强效果。

An audio processing method, device, device and readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
一种音频处理方法、装置、设备及可读存储介质
本专利技术涉及通信
，特别是涉及一种音频处理方法、一种音频处理装置、一种设备和一种可读存储介质。
技术介绍
随着通信技术的快速发展，诸如手机、平板电脑等终端越来越普及，给人们的生活、学习、工作带来了极大的便利。这些终端可以通过麦克风收集语音信号，使用语音增强技术对收集到的语音信号进行处理，以降低噪声干扰的影响。其中，语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后，从噪声背景中提取有用的语音信号，抑制、降低噪声干扰的技术。
技术实现思路
本专利技术实施例所要解决的技术问题是提供一种音频处理方法，以提升语音增强效果。相应的，本专利技术实施例还提供了一种音频处理装置、一种设备以及一种可读存储介质，用以保证上述方法的实现及应用。为了解决上述问题，本专利技术实施例公开了一种音频处理方法，包括：预先依据获取到的各语音频段误差对应的权重信息，训练语音增强模型；在接收到混合语音信号后，依据所述语音增强模型中各语音频段对应的权重偏置参数，对所述混合语音信号进行语音增强，得到目标语音信号，其中，所述权重偏置参数为依据所述权重信息训练得到的；依据所述目标语音信号进行输出。可选地，所述依据所述语音增强模型中各语音频段对应的权重偏置参数，对所述混合语音信号进行语音增强，得到目标语音信号，包括：对所述混合语音信号进行特征提取，得到带噪语音数据，所述带噪语音数据包括至少一个语音频段数据；将所述带噪语音信号输入到所述语音增强模型；通过所述语...

【技术保护点】
1.一种音频处理方法，其特征在于，包括：/n预先依据获取到的各语音频段误差对应的权重信息，训练语音增强模型；/n在接收到混合语音信号后，依据所述语音增强模型中各语音频段对应的权重偏置参数，对所述混合语音信号进行语音增强，得到目标语音信号，其中，所述权重偏置参数为依据所述权重信息训练得到的；/n依据所述目标语音信号进行输出。/n

【技术特征摘要】
1.一种音频处理方法，其特征在于，包括：
预先依据获取到的各语音频段误差对应的权重信息，训练语音增强模型；
在接收到混合语音信号后，依据所述语音增强模型中各语音频段对应的权重偏置参数，对所述混合语音信号进行语音增强，得到目标语音信号，其中，所述权重偏置参数为依据所述权重信息训练得到的；
依据所述目标语音信号进行输出。

2.根据权利要求1所述的方法，其特征在于，所述依据所述语音增强模型中各语音频段对应的权重偏置参数，对所述混合语音信号进行语音增强，得到目标语音信号，包括：
对所述混合语音信号进行特征提取，得到带噪语音数据，所述带噪语音数据包括至少一个语音频段数据；
将所述带噪语音信号输入到所述语音增强模型；
通过所述语音增强模型，按照各语音频段对应的权重偏置参数，对所述带噪语音数据中的各语音频段数据进行降噪处理，得到目标用户对应的目标语音信号。

3.根据权利要求1或2所述的方法，其特征在于，所述预先依据获取到的各语音频段误差对应的权重信息，训练语音增强模型，包括：
针对接收到的语音信号，获取预设的各语音频段误差对应的权重信息；
依据所述各语音频段误差对应的权重信息和所述语音信号进行模型训练，得到语音增强模型。

4.根据权利要求3所述的方法，其特征在于，依据所述各语音频段误差对应的权重信息和所述语音信号进行模型训练，得到语音增强模型，包括：
为所述语音信号添加噪声信号，生成带噪语音信号；
对所述带噪语音信号进行特征提取，得到所述带噪语音数据对应的语音特征；
基于所述语音特征，采用所述带噪语音信号、所述语音信号以及所述各语音频段误差对应的权重信息进行模型训练，得到语音增强模型。

5.根据权利要求4所述的方法，其特征在于，所述采用所述带噪语音信号、所述语音信号以及所述各语音频段误差对应的权重信息进行模型训练，得到语音增强模型，包括：
确定所述带噪语音信号对应的输出估计信号；
依据所述语音信号，确定所述输出估计信号对应的输出预测误差；
依据所述语音频段误差对应的权重信息，对所述输出预测误差进行自适应处理，得到各语音频段对应的语音增强误差...

【专利技术属性】
技术研发人员：文仕学，潘逸倩，
申请(专利权)人：北京搜狗科技发展有限公司，搜狗杭州智能科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人