一种语音增强方法、装置、电子设备和存储介质制造方法及图纸

技术编号:32013190 阅读:18 留言:0更新日期:2022-01-22 18:30
本实施例公开了一种语音增强方法、装置、电子设备和存储介质。该方法包括:获取待增强语音信号的功率谱和相位谱,以及待增强语音信号中噪声信号的功率谱估计值,其中,待增强语音信号包括纯净语音信号和噪声信号;根据待增强语音信号的功率谱和噪声信号的功率谱估计值确定纯净语音信号的功率谱估计值;根据纯净语音信号的功率谱估计值确定不同频带下的掩蔽阈值;根据掩蔽阈值和待增强语音信号的功率谱确定纯净语音信号的增强功率谱估计值;根据待增强语音信号的相位谱以及纯净语音信号的增强功率谱估计值,确定增强语音信号。本发明专利技术实施例通过确定掩蔽阈值得到增强语音信号,可以增强噪声抑制结果,提高语音的识别效果。提高语音的识别效果。提高语音的识别效果。

【技术实现步骤摘要】
一种语音增强方法、装置、电子设备和存储介质


[0001]本申请实施例涉及信号处理
,尤其涉及一种语音增强方法、装置、电子设备和存储介质。

技术介绍

[0002]随着信号处理技术和语音识别技术的迅速发展,前端预处理中的语音增强技术也变得越来越重要。一般情况下,当设备播放声音时,噪声都会伴随着语音一起被听到,然而噪声的存在会对语音产生干扰,甚至会影响人耳对语音的感知。通常情况下,会采用语音增强的方法对含有噪声的语音信号进行处理。
[0003]目前,语音增强方法主要有谱减法、小波变换法、维纳滤波法等。其中,谱减法在输入信号的信噪比较高时能较好的抑制噪声,但在信噪比较低时,噪声残留较多,且对于谱减后得到的负值进行半波整流处理,会导致“音乐噪声”的出现,严重影响语音的的识别效果。也就是说,在非平稳环境下,许多语音增强方法会出现跟踪延迟、误差较大的问题。
[0004]因此,如何在非平稳环境下抑制噪声且增强语音效果,是本领域技术人员亟待解决的技术问题。

技术实现思路

[0005]本专利技术实施例提供一种语音增强方法、装置、电子设备和存储介质,可以增强噪声抑制结果,提高语音的识别效果。
[0006]第一方面,本专利技术实施例提供了一种语音增强方法,包括:
[0007]获取待增强语音信号的功率谱和相位谱,以及所述待增强语音信号中噪声信号的功率谱估计值,其中,所述待增强语音信号包括纯净语音信号和噪声信号;
[0008]根据所述待增强语音信号的功率谱和所述噪声信号的功率谱估计值确定纯净语音信号的功率谱估计值;
[0009]根据所述纯净语音信号的功率谱估计值确定不同频带下的掩蔽阈值;
[0010]根据所述掩蔽阈值和所述待增强语音信号的功率谱确定纯净语音信号的增强功率谱估计值;
[0011]根据所述待增强语音信号的相位谱以及纯净语音信号的增强功率谱估计值,确定增强语音信号。
[0012]第二方面,本专利技术实施例还提供了一种语音增强装置,包括:
[0013]参数获取模块,用于获取待增强语音信号的功率谱和相位谱,以及所述待增强语音信号中噪声信号的功率谱估计值,其中,所述待增强语音信号包括纯净语音信号和噪声信号;
[0014]纯音功率谱估计值确定模块,用于根据所述待增强语音信号的功率谱和所述噪声信号的功率谱估计值确定纯净语音信号的功率谱估计值;
[0015]掩蔽阈值确定模块,用于根据所述纯净语音信号的功率谱估计值确定不同频带下
的掩蔽阈值;
[0016]纯音增强功率谱值确定模块,用于根据所述掩蔽阈值和所述待增强语音信号的功率谱确定纯净语音信号的增强功率谱估计值;
[0017]增强语音信号确定模块,用于根据所述待增强语音信号的相位谱以及纯净语音信号的增强功率谱估计值,确定增强语音信号。
[0018]第三方面,本专利技术实施例还提供了一种电子设备,包括:
[0019]一个或多个处理器;
[0020]存储装置,用于存储一个或多个程序,
[0021]当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如本专利技术任一实施例的语音增强方法。
[0022]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术任一实施例的语音增强方法。
[0023]本专利技术实施例公开了一种语音增强方法。该方法包括:获取待增强语音信号的功率谱和相位谱,以及待增强语音信号中噪声信号的功率谱估计值,其中,待增强语音信号包括纯净语音信号和噪声信号;根据待增强语音信号的功率谱和噪声信号的功率谱估计值确定纯净语音信号的功率谱估计值;根据纯净语音信号的功率谱估计值确定不同频带下的掩蔽阈值;根据掩蔽阈值和待增强语音信号的功率谱确定纯净语音信号的增强功率谱估计值;根据待增强语音信号的相位谱以及纯净语音信号的增强功率谱估计值,确定增强语音信号。本专利技术实施例通过确定待增强语音信号不同频带的掩蔽阈值,从而得到增强语音信号,可以增强噪声抑制结果,提高待增强语音信号的信噪比和语音的识别效果。
附图说明
[0024]图1是本专利技术实施例一提供的一种语音增强方法的流程图;
[0025]图2是本专利技术实施例二提供的一种语音增强装置的结构示意图;
[0026]图3是本专利技术实施例三提供的一种电子设备的结构示意图。
具体实施方式
[0027]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
[0028]在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
[0029]实施例一
[0030]图1是本专利技术实施例一提供的一种语音增强方法的流程图,本实施例可适用于对待增强语音信号进行语音增强的情况。该方法可以由语音增强装置来执行,该装置可以采用软件和/或硬件的方式实现,并可配置在电子设备中,例如电子设备可以是后台服务器等
具有通信和计算能力的设备。如图1所示,该方法具体包括:
[0031]S110、获取待增强语音信号的功率谱和相位谱,以及所述待增强语音信号中噪声信号的功率谱估计值,其中,所述待增强语音信号包括纯净语音信号和噪声信号。
[0032]其中,所述待增强语音信号是由语音采集现场中至少一个语音采集装置采集获取。所述语音采集现场可以是会议室、播音室以及火车站等嘈杂环境的通信现场,还可以是军事通信现场或者语音识别现场等。例如,播音员在播报新闻时,播音室内可能出现各类声音,播音室建筑外过往车辆产生的交通噪声或者播音室建筑内空调系统、灯光控制系统、摄像机以及工作人员来回走动所产生的噪声,此时则需对播音室内的语音信号进行采集,并对其中播音员的语音信号进行语音增强。
[0033]所述语音采集装置可以是麦克风或者检波器。具体的,对所述语音采集装置的数量不作限制,可以是1个或多个。当所述语音采集装置的数量是2个及以上时,为了能够采集到不同位置的语音信号,对语音采集装置的布置方式也不作限制。例如所述语音采集装置可以沿所述待增强语音信号中纯净语音信号源的圆周方向排列。此外,由于所述待增强语音信号中噪声干扰存在不确定性和随机性,因此所述语音采集装置可以持续性采集所述待增强语音信号,或者,也可以以较短的间隔时间进行间歇性采集。
[0034]进一步的,为了更好地对待增强语音信号进行语音增强处理,需将所采集到的待增强语音信号转换为频域声音信号,例如,可以采用傅里叶变换等方式,将待增强语音信号转换本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音增强方法,其特征在于,包括:获取待增强语音信号的功率谱和相位谱,以及所述待增强语音信号中噪声信号的功率谱估计值,其中,所述待增强语音信号包括纯净语音信号和噪声信号;根据所述待增强语音信号的功率谱和所述噪声信号的功率谱估计值确定纯净语音信号的功率谱估计值;根据所述纯净语音信号的功率谱估计值确定不同频带下的掩蔽阈值;根据所述掩蔽阈值和所述待增强语音信号的功率谱确定纯净语音信号的增强功率谱估计值;根据所述待增强语音信号的相位谱以及纯净语音信号的增强功率谱估计值,确定增强语音信号。2.根据权利要求1所述的方法,其特征在于,根据所述纯净语音信号的功率谱估计值确定不同频带下的掩蔽阈值,包括:获取纯净语音信号的功率谱估计值在迭代计算中相邻两次迭代的取值;根据所述纯净语音信号的功率谱估计值的相邻两次迭代的取值,确定频带的参数值;根据所述频带的参数值与噪声信号的功率谱估计值,确定掩蔽阈值。3.根据权利要求2所述的方法,其特征在于,根据所述纯净语音信号的功率谱估计值的相邻两次迭代的取值,确定频带的参数值,包括:采用如下公式确定频带的参数值:其中,j是迭代次数,i是频带数,是第j次迭代中第i个频带的纯净语音信号的功率谱估计值,是第(j

1)次迭代中第i个频带的纯净语音信号的功率谱估计值,α
j
(i)是第j次迭代中第i个频带的参数值。4.根据权利要求3所述的方法,其特征在于,根据所述频带的参数值与噪声信号的功率谱估计值,确定掩蔽阈值,包括:采用如下公式确定掩蔽阈值:其中,N
j
(i)是第j次迭代中第i个频带的噪声信号的功率谱估计值,N
(j

1)
(i)是第(j

1)次迭代中第i个频带的噪声信号的功率谱估计值,T
j
(i)是第j次迭代中第i个频带的掩蔽阈值。5.根据权利要求1所述的方法,其特征在于,根据所述掩蔽阈值和所述待增强语音信号的功...

【专利技术属性】
技术研发人员:秦永红付贤会刘武钊
申请(专利权)人:北京融讯科创技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1