降噪模型训练方法、装置以及设备制造方法及图纸

技术编号:36538300 阅读:15 留言:0更新日期:2023-02-01 16:29
本公开提供了一种降噪模型训练方法、装置以及设备,涉及人工智能技术领域,具体涉及自然语言处理和深度学习等技术领域。该方法的一具体实施方式包括:获取样本带噪语音信号;提取样本带噪语音信号的样本频域特征;计算样本带噪语音信号的样本目标频带增益和样本目标时域能量比;将样本频域特征作为输入,将样本目标频带增益和样本目标时域能量比作为监督,对网络进行训练,得到降噪模型。该实施方式训练出的降噪模型具有较好的降噪性能。练出的降噪模型具有较好的降噪性能。练出的降噪模型具有较好的降噪性能。

【技术实现步骤摘要】
降噪模型训练方法、装置以及设备


[0001]本公开涉及人工智能
,具体涉及自然语言处理和深度学习等


技术介绍

[0002]实时语音通话能够为人们的生活与工作带来极大的方便。但随着科技与生活不断地发展,人们对语音通话的质量要求也越来越高。面对各种嘈杂的产品应用环境,语音降噪技术突显出无可取代的地位,其能够抑制语音信号中的背景噪声,提高语音的清晰度与可懂度,进而提高语音交互质量与效率。而在实时通话中,其噪声抑制能力和实时运行能力更是起着至关重要的作用。
[0003]目前,利用谱减法、自适应滤波器降噪等经典降噪算法进行语音降噪。

技术实现思路

[0004]本公开实施例提出了一种降噪模型训练方法、装置、设备、存储介质以及程序产品。
[0005]第一方面,本公开实施例提出了一种降噪模型训练方法,包括:获取样本带噪语音信号;提取样本带噪语音信号的样本频域特征;计算样本带噪语音信号的样本目标频带增益和样本目标时域能量比;将样本频域特征作为输入,将样本目标频带增益和样本目标时域能量比作为监督,对网络进行训练,得到降噪模型。
[0006]第二方面,本公开实施例提出了一种语音降噪方法,包括:获取带噪语音信号;提取带噪语音信号的频域特征;将频域特征输入至降噪模型,得到M个频带增益,其中,M为正整数,降噪模型是采用第一方面所述的方法训练得到的;基于M个频带增益进行降噪,得到干净语音信号。
[0007]第三方面,本公开实施例提出了一种降噪模型训练装置,包括:获取模块,被配置成获取样本带噪语音信号;提取模块,被配置成提取样本带噪语音信号的样本频域特征;计算模块,被配置成计算样本带噪语音信号的样本目标频带增益和样本目标时域能量比;训练模块,被配置成将样本频域特征作为输入,将样本目标频带增益和样本目标时域能量比作为监督,对网络进行训练,得到降噪模型。
[0008]第四方面,本公开实施例提出了一种语音降噪装置,包括:获取模块,被配置成获取带噪语音信号;提取模块,被配置成提取带噪语音信号的频域特征;输入模块,被配置成将频域特征输入至降噪模型,得到M个频带增益,其中,M为正整数,降噪模型是采用第三方面所述的装置训练得到的;降噪模块,被配置成基于M个频带增益进行降噪,得到干净语音信号。
[0009]第五方面,本公开实施例提出了一种电子设备,包括:至少两个处理器;以及与至少两个处理器通信连接的存储器;其中,存储器存储有可被至少两个处理器执行的指令,指令被至少两个处理器执行,以使至少两个处理器能够执行如第一方面中任一实现方式描述的方法或第二方面中任一实现方式描述的方法。
[0010]第六方面,本公开实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面中任一实现方式描述的方法或第二方面中任一实现方式描述的方法。
[0011]第七方面,本公开实施例提出了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如第一方面中任一实现方式描述的方法或第二方面中任一实现方式描述的方法。
[0012]本公开实施例提供的降噪模型训练方法,训练出的降噪模型具有较好的降噪性能与实时性能,对平稳噪声与非平稳噪声均有较好的抑制能力。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显。附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1是根据本公开的降噪模型训练方法的一个实施例的流程图;
[0016]图2是根据本公开的降噪模型训练方法的又一个实施例的流程图;
[0017]图3是图2中的降噪模型训练方法中的训练特征的示意图;
[0018]图4是图2中的降噪模型训练方法中的降噪模型的网络结构图;
[0019]图5是根据本公开的语音降噪方法的一个实施例的流程图;
[0020]图6是根据本公开的语音降噪方法的又一个实施例的流程图;
[0021]图7是图6中的语音降噪方法的流程框图;
[0022]图8是一个降噪效果示意图;
[0023]图9是又一个降噪效果示意图;
[0024]图10是可以实现本公开实施例的降噪模型训练方法和语音降噪方法的场景图;
[0025]图11是根据本公开的降噪模型训练装置的一个实施例的结构示意图;
[0026]图12是根据本公开的语音降噪装置的一个实施例的结构示意图;
[0027]图13是用来实现本公开实施例的降噪模型训练方法和语音降噪方法的电子设备的框图。
具体实施方式
[0028]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0029]需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
[0030]图1示出了根据本公开的降噪模型训练方法的一个实施例的流程100。该降噪模型训练方法包括以下步骤:
[0031]步骤101,获取样本带噪语音信号。
[0032]在本实施例中,降噪模型训练方法的执行主体可以获取样本带噪语音信号。其中,样本带噪语音信号是带有噪声的语音信号,可以是在嘈杂的环境下采集的语音信号,也可以由干净语音信号与噪声信号融合而得到。
[0033]步骤102,提取样本带噪语音信号的样本频域特征。
[0034]在本实施例中,上述执行主体可以提取样本带噪语音信号的样本频域特征。其中,样本频域特征可以包括但不限于:ERB(Equivalent Rectangular Bandwidth,等效矩形带宽)倒谱系数、ERB倒谱系数的一阶差分与二阶差分,以及语音基音相关度的DCT(Discrete Cosine Transform,离散余弦变换)系数与基音周期等等。
[0035]这里,样本带噪语音信号通常是时域信号,需要将其转换到频域,才能提取频域特征。具体地,将样本带噪语音信号转换到频域,得到样本频域带噪语音信号;从样本频域带噪语音信号中提取样本频域特征。
[0036]步骤103,计算样本带噪语音信号的样本目标频带增益和样本目标时域能量比。
[0037]在本实施例中,上述执行主体可以计算样本带噪语音信号的样本目标频带增益和样本目标时域能量比。其中,基于样本带噪语音信号与其对应的样本干净语音信号可以计算样本目标频带增益和样本目标时域能量比。
[0038]步骤104,将样本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种降噪模型训练方法,包括:获取样本带噪语音信号;提取所述样本带噪语音信号的样本频域特征;计算所述样本带噪语音信号的样本目标频带增益和样本目标时域能量比;将所述样本频域特征作为输入,将所述样本目标频带增益和所述样本目标时域能量比作为监督,对网络进行训练,得到降噪模型。2.根据权利要求1所述的方法,其中,所述提取所述样本带噪语音信号的样本频域特征,包括:将所述样本带噪语音信号转换到频域,得到样本频域带噪语音信号;从所述样本频域带噪语音信号中提取所述样本频域特征。3.根据权利要求2所述的方法,其中,所述从所述样本频域带噪语音信号中提取所述样本频域特征,包括:将所述样本频域带噪语音信号转换到等效矩形带宽ERB域,得到样本ERB域频点;将所述样本ERB域频点划分为M个样本ERB域子带,其中,M为正整数;将所述M个样本ERB域子带转换到频域,得到M个样本频域子带;分别对所述M个样本频域子带的对数能量和进行离散余弦变换DCT,得到M个样本DCT系数。4.根据权利要求3所述的方法,其中,所述从所述样本频域带噪语音信号中提取所述样本频域特征,还包括:分别计算所述M个样本DCT系数中前N个样本DCT系数的一阶差分和二阶差分,其中,N为正整数,且N≤M。5.根据权利要求2

4中任一项所述的方法,其中,所述从所述样本频域带噪语音信号中提取所述样本频域特征,还包括:计算所述样本频域带噪语音信号的语音基音相关度的P维DCT系数与基音周期,其中,P为正整数。6.根据权利要求2所述的方法,其中,所述获取样本带噪语音信号,包括:获取样本干净语音信号和样本噪声信号;将所述样本干净语音信号与所述样本噪声信号融合,得到所述样本带噪语音信号;以及所述计算所述样本带噪语音信号的样本目标频带增益和样本目标时域能量比,包括:基于所述样本干净语音信号的M个样本频域子带和所述样本带噪语音信号的M个样本频域子带,计算所述样本目标频带增益;基于所述样本干净语音信号和所述样本带噪语音信号,计算所述样本目标时域能量比。7.根据权利要求1

6中任一项所述的方法,其中,所述将所述样本频域特征作为输入,将所述样本目标频带增益和所述样本目标时域能量比作为监督,对网络进行训练,得到降噪模型,包括:将所述样本频域特征输入至所述网络,学习得到样本预测频带增益和样本预测时域能量比;
基于所述样本目标频带增益和所述样本预测频带增益,计算第一损失函数;基于所述样本目标时域能量比和所述样本预测时域能量比,计算第二损失函数;基于所述第一损失函数和所述第二损失函数,调整所述网络的参数,得到所述降噪模型。8.一种语音降噪方法,包括:获取带噪语音信号;提取所述带噪语音信号的频域特征;将所述频域特征输入至降噪模型,得到M个频带增益,其中,M为正整数,所述降噪模型是采用权利要求1

7中任一项所述的方法训练得到的;基于所述M个频带增益进行降噪,得到干净语音信号。9.根据权利要求8所述的方法,其中,所述提取所述带噪语音信号的频域特征,包括:将所述带噪语音信号转换到频域,得到频域带噪语音信号;从所述频域带噪语音信号中提取所述频域特征;以及所述基于所述M个频带增益进行降噪,得到干净语音信号,包括:对所述M个频带增益进行插值,以及对插值后的频带增益的频点进行加权,得到频域干净语音信号;将所述频域干净语音信号转换到时域,得到所述干净语音信号。10.一种降噪模型训练装置,包括:获取模块,被配置成获取样本带噪语音信号;提取模块,被配置成提取所述样本带噪语音信号的样本频域特征;计算模块,被配置成计算所述样本带噪语音信号的样本目标频带增益和样本目标时域能量比;训练模块,被配置成将所述样本频域特征作为输入,将所述样本目标频带增益和所述样本目标时域能量比作为监督,对网络进行训练,得到降噪模型。11.根据权利要求10所述的装置,其中,所...

【专利技术属性】
技术研发人员:梁龙腾李伟南黄传辉
申请(专利权)人:上海小度技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1