语音降噪方法、系统、电子设备和存储介质技术方案

技术编号：32888976 阅读：23 留言：0更新日期：2022-04-02 12:27

本发明专利技术公开语音降噪方法、系统、电子设备和存储介质，其中，一种语音降噪方法，包括：将获取的语音信号输入至预处理模块，其中，所述预处理模块包括对所述语音信号进行分帧和信号变换；将所述预处理模块的输出输入至声学特征预测网络得到预测的干净语音的声学特征；将所述干净语音的声学特征输入至神经网络声码器模型中得到干净语音的波形。降噪系统包括数字音频输入模块，音频处理模块和数字音频输出3个模块构成，并且3个模块通过数字链路相互连接，从而可以实现提高降噪性能、减小语音失真和降低算法的复杂度。和降低算法的复杂度。和降低算法的复杂度。

全部详细技术资料下载

【技术实现步骤摘要】
语音降噪方法、系统、电子设备和存储介质

[0001]本专利技术属于语音降噪
，尤其涉及语音降噪方法、系统、电子设备和存储介质。

技术介绍

[0002]语音降噪技术是一种从音频中去除环境噪音的同时保留目标人声的语音处理技术。该技术能够改善听觉体验，提高语音的可懂度以及提高语音识别、音色复刻等后端语音技术的性能。语音降噪技术在移动通话、人工耳蜗、无线耳机、智能音箱、多媒体APP、语音助手等众多产品中有广泛的应用价值。
[0003]按照出现的先后顺序，语音降噪技术方法大致可以分为两大类：基于统计学和信号处理技术的传统降噪方法，基于神经网络机器学习方法的智能降噪方法。传统降噪方法本质上是利用语音、噪声在时频(Time
‑
Frequency，TF)统计特性上的差异，利用信号处理、统计分析等技术实现语音和噪声的分离。基于神经网络机器学习的智能降噪方法是随着神经网络技术的快速发展而新出现的一种数据驱动的方法。
[0004]传统的基于信号处理的降噪方法的大致步骤：首先根据语音和噪声在时频域上的一些特性差异来估计噪声的能量谱，然后利用声学和语音学理论得到频谱掩码，根据掩码和原始语音的频谱得到处理后的频谱，最后利用傅里叶逆变换得到处理后语音的波形。
[0005]基于神经网络的智能降噪方法在流程上一般包括训练和推理两个阶段。训练阶段的主要目标是通过使用语音、噪声数据集和最优化算法对计算过程进行迭代优化，得到最优的模型参数。推理阶段则是利用确定的运算规则和最优参数进行计算，从而从带噪语音数据中...

【技术保护点】

【技术特征摘要】
1.一种语音降噪方法，包括：将获取的语音信号输入至预处理模块，所述预处理模块对所述语音信号进行分帧和信号变换；将所述预处理模块的输出输入至声学特征预测网络得到预测的干净语音的声学特征；将所述干净语音的声学特征输入至神经网络声码器模型中得到干净语音的波形。2.根据权利要求1所述的方法，所述声学特征预测网络通过以下方式训练：将带噪语音经过短时傅里叶变换后得到的幅度、相位信息输入所述声学特征预测网络，经过张量运算得到输出；以所述输出和与所述带噪语音对应的干净语音的声学特征的差异，通过反向传播算法优化所述张量运算的权重；通过反复迭代所述优化的过程来减少所述输出和所述带噪语音对应的干净语音声学特征的差异，直到达到规定的迭代次数或所述差异小于预设值。3.根据权利要求2所述的方法，在训练完所述声学特征预测网络之后，所述方法还包括：对训练好的声学特征预测网络联合训练好的声码器模型进行联合，对联合后的网络模型进行训练和微调。4.根据权利要求3所述的方法，其中，所述对训练好的声学特征预测网络联合训练好的声码器模型进行联合，对联合后的网络模型进行训练和微调包括：以所述带噪语音的幅度、相位信息作为所述联合后的网络模型的输入，以与所述带噪语音对应的干净语音的波形作为目标输出，固定所述联合后的网络模型的某一部分参数，对另一部分张量运算参数进行微调。5.根据权利要求1所述的方法，其中，所述将获取的语音信号输入...

【专利技术属性】
技术研发人员：徐学淼，俞凯，张辉，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人