【技术实现步骤摘要】
降噪模型训练方法、装置以及设备
[0001]本公开涉及人工智能
,具体涉及自然语言处理和深度学习等
技术介绍
[0002]实时语音通话能够为人们的生活与工作带来极大的方便。但随着科技与生活不断地发展,人们对语音通话的质量要求也越来越高。面对各种嘈杂的产品应用环境,语音降噪技术突显出无可取代的地位,其能够抑制语音信号中的背景噪声,提高语音的清晰度与可懂度,进而提高语音交互质量与效率。而在实时通话中,其噪声抑制能力和实时运行能力更是起着至关重要的作用。
[0003]目前,利用谱减法、自适应滤波器降噪等经典降噪算法进行语音降噪。
技术实现思路
[0004]本公开实施例提出了一种降噪模型训练方法、装置、设备、存储介质以及程序产品。
[0005]第一方面,本公开实施例提出了一种降噪模型训练方法,包括:获取样本带噪语音信号;提取样本带噪语音信号的样本频域特征;计算样本带噪语音信号的样本目标频带增益和样本目标时域能量比;将样本频域特征作为输入,将样本目标频带增益和样本目标时域能量比作为监督,对网络进行训练,得到降噪模型。
[0006]第二方面,本公开实施例提出了一种语音降噪方法,包括:获取带噪语音信号;提取带噪语音信号的频域特征;将频域特征输入至降噪模型,得到M个频带增益,其中,M为正整数,降噪模型是采用第一方面所述的方法训练得到的;基于M个频带增益进行降噪,得到干净语音信号。
[0007]第三方面,本公开实施例提出了一种降噪模型训练装置,包括:获取模块,被配置成获取 ...
【技术保护点】
【技术特征摘要】
1.一种降噪模型训练方法,包括:获取样本带噪语音信号;提取所述样本带噪语音信号的样本频域特征;计算所述样本带噪语音信号的样本目标频带增益和样本目标时域能量比;将所述样本频域特征作为输入,将所述样本目标频带增益和所述样本目标时域能量比作为监督,对网络进行训练,得到降噪模型。2.根据权利要求1所述的方法,其中,所述提取所述样本带噪语音信号的样本频域特征,包括:将所述样本带噪语音信号转换到频域,得到样本频域带噪语音信号;从所述样本频域带噪语音信号中提取所述样本频域特征。3.根据权利要求2所述的方法,其中,所述从所述样本频域带噪语音信号中提取所述样本频域特征,包括:将所述样本频域带噪语音信号转换到等效矩形带宽ERB域,得到样本ERB域频点;将所述样本ERB域频点划分为M个样本ERB域子带,其中,M为正整数;将所述M个样本ERB域子带转换到频域,得到M个样本频域子带;分别对所述M个样本频域子带的对数能量和进行离散余弦变换DCT,得到M个样本DCT系数。4.根据权利要求3所述的方法,其中,所述从所述样本频域带噪语音信号中提取所述样本频域特征,还包括:分别计算所述M个样本DCT系数中前N个样本DCT系数的一阶差分和二阶差分,其中,N为正整数,且N≤M。5.根据权利要求2
‑
4中任一项所述的方法,其中,所述从所述样本频域带噪语音信号中提取所述样本频域特征,还包括:计算所述样本频域带噪语音信号的语音基音相关度的P维DCT系数与基音周期,其中,P为正整数。6.根据权利要求2所述的方法,其中,所述获取样本带噪语音信号,包括:获取样本干净语音信号和样本噪声信号;将所述样本干净语音信号与所述样本噪声信号融合,得到所述样本带噪语音信号;以及所述计算所述样本带噪语音信号的样本目标频带增益和样本目标时域能量比,包括:基于所述样本干净语音信号的M个样本频域子带和所述样本带噪语音信号的M个样本频域子带,计算所述样本目标频带增益;基于所述样本干净语音信号和所述样本带噪语音信号,计算所述样本目标时域能量比。7.根据权利要求1
‑
6中任一项所述的方法,其中,所述将所述样本频域特征作为输入,将所述样本目标频带增益和所述样本目标时域能量比作为监督,对网络进行训练,得到降噪模型,包括:将所述样本频域特征输入至所述网络,学习得到样本预测频带增益和样本预测时域能量比;
基于所述样本目标频带增益和所述样本预测频带增益,计算第一损失函数;基于所述样本目标时域能量比和所述样本预测时域能量比,计算第二损失函数;基于所述第一损失函数和所述第二损失函数,调整所述网络的参数,得到所述降噪模型。8.一种语音降噪方法,包括:获取带噪语音信号;提取所述带噪语音信号的频域特征;将所述频域特征输入至降噪模型,得到M个频带增益,其中,M为正整数,所述降噪模型是采用权利要求1
‑
7中任一项所述的方法训练得到的;基于所述M个频带增益进行降噪,得到干净语音信号。9.根据权利要求8所述的方法,其中,所述提取所述带噪语音信号的频域特征,包括:将所述带噪语音信号转换到频域,得到频域带噪语音信号;从所述频域带噪语音信号中提取所述频域特征;以及所述基于所述M个频带增益进行降噪,得到干净语音信号,包括:对所述M个频带增益进行插值,以及对插值后的频带增益的频点进行加权,得到频域干净语音信号;将所述频域干净语音信号转换到时域,得到所述干净语音信号。10.一种降噪模型训练装置,包括:获取模块,被配置成获取样本带噪语音信号;提取模块,被配置成提取所述样本带噪语音信号的样本频域特征;计算模块,被配置成计算所述样本带噪语音信号的样本目标频带增益和样本目标时域能量比;训练模块,被配置成将所述样本频域特征作为输入,将所述样本目标频带增益和所述样本目标时域能量比作为监督,对网络进行训练,得到降噪模型。11.根据权利要求10所述的装置,其中,所...
【专利技术属性】
技术研发人员:梁龙腾,李伟南,黄传辉,
申请(专利权)人:上海小度技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。