一种语音信号处理方法、装置及计算机设备制造方法及图纸

技术编号:33192203 阅读:33 留言:0更新日期:2022-04-24 00:20
本发明专利技术实施例公开了一种语音信号处理方法、装置及计算机设备,包括:获取当前帧的原始语音信号、参考信号以及近端语音信号;计算近端语音信号的噪声功率;根据第一互相关系数、第二互相关系数、噪声功率以及前一帧目标语音信号存在的后验概率计算当前帧目标语音信号不存在的先验概率和当前帧目标语音信号的后验信噪比;根据后验信噪比计算先验信噪比,进而根据当前帧目标语音信号不存在的先验概率计算当前帧目标语音信号存在的后验概率;根据后验概率计算混合抑制因子;最后根据混合抑制因子对当前帧近端语音信号进行残余回声抑制和噪声抑制处理。本发明专利技术实施例的技术方案能够在保证语音信号处理性能的前提下,降低语音信号处理的计算复杂度。号处理的计算复杂度。号处理的计算复杂度。

【技术实现步骤摘要】
一种语音信号处理方法、装置及计算机设备


[0001]本专利技术实施例涉及语音处理
,尤其涉及一种语音信号处理方法、装置、计算机设备及存储介质。

技术介绍

[0002]在语音信号处理流程中,语音增强处理是实现流畅语音交互的前端信号处理手段。线性回声消除、残余回声抑制以及噪声抑制是目前前端信号处理中三个主要部分,同时也占据了大部分的语音信号处理计算资源。线性回声消除采用自适应滤波技术将语音信号中的绝大部分回声做抑制处理;残余回声抑制主要通过特定的非线性手段消除语音信号中残余的非线性回声成分;噪声抑制则是利用非线性算法来消除语音信号中的环境噪声。
[0003]目前,语音信号处理流程中将上述三部分语音处理操作独立串行完成,计算量较大,尤其是在一些计算资源受限的情况下,上述语音信号处理算法无法达到最优的语音处理效果。

技术实现思路

[0004]本专利技术实施例提供一种语音信号处理方法、装置、计算机设备及存储介质,以在保证语音信号处理性能的前提下,降低语音信号处理的计算复杂度。
[0005]第一方面,本专利技术实施例提供了一种语音信号处理方法,包括:
[0006]获取当前帧原始语音信号、当前帧参考信号以及当前帧近端语音信号;
[0007]计算所述当前帧近端语音信号的噪声功率;
[0008]根据所述当前帧原始语音信号与所述当前帧参考信号之间的第一互相关系数、所述当前帧原始语音信号与所述当前帧近端语音信号之间的第二互相关系数以及所述当前帧近端语音信号的噪声功率计算当前帧目标语音信号不存在的先验概率;
[0009]根据前一帧目标语音信号存在的后验概率计算当前帧目标语音信号的后验信噪比;
[0010]根据所述当前帧目标语音信号的后验信噪比计算当前帧目标语音信号的先验信噪比,并根据所述当前帧目标语音信号的先验信噪比以及所述当前帧目标语音信号不存在的先验概率计算当前帧目标语音信号存在的后验概率;
[0011]根据所述当前帧目标语音信号存在的后验概率计算混合抑制因子;
[0012]根据所述混合抑制因子以及所述当前帧近端语音信号计算所述当前帧近端语音信号经过残余回声抑制和噪声抑制处理后得到的语音信号。
[0013]第二方面,本专利技术实施例还提供了一种语音信号处理装置,包括:
[0014]信号获取模块,用于获取当前帧原始语音信号、当前帧参考信号以及当前帧近端语音信号;
[0015]噪声功率计算模块,用于计算所述当前帧近端语音信号的噪声功率;
[0016]先验概率计算模块,用于根据所述当前帧原始语音信号与所述当前帧参考信号之
间的第一互相关系数、所述当前帧原始语音信号与所述当前帧近端语音信号之间的第二互相关系数以及所述当前帧近端语音信号的噪声功率计算当前帧目标语音信号不存在的先验概率;
[0017]后验信噪比计算模块,用于根据前一帧目标语音信号存在的后验概率计算当前帧目标语音信号的后验信噪比;
[0018]后验概率计算模块,用于根据所述当前帧目标语音信号的后验信噪比计算当前帧目标语音信号的先验信噪比,并根据所述当前帧目标语音信号的先验信噪比以及所述当前帧目标语音信号不存在的先验概率计算当前帧目标语音信号存在的后验概率;
[0019]混合抑制因子计算模块,用于根据所述当前帧目标语音信号存在的后验概率计算混合抑制因子;
[0020]语音信号处理模块,用于根据所述混合抑制因子以及所述当前帧近端语音信号计算所述当前帧近端语音信号经过残余回声抑制和噪声抑制处理后得到的语音信号。
[0021]第三方面,本专利技术实施例还提供了一种计算机设备,所述计算机设备包括:一个或多个处理器;
[0022]存储装置,用于存储一个或多个程序;
[0023]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术任意实施例所提供的语音信号处理方法。
[0024]第四方面,本专利技术实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现本专利技术任意实施例所提供的语音信号处理方法。
[0025]本专利技术实施例通过计算当前帧近端语音信号的噪声功率,根据当前帧原始语音信号与当前帧参考信号之间的第一互相关系数、当前帧原始语音信号与当前帧近端语音信号之间的第二互相关系数以及噪声功率计算当前帧目标语音信号不存在的先验概率,并根据前一帧目标语音信号存在的后验概率计算当前帧目标语音信号的后验信噪比,进而根据当前帧目标语音信号的后验信噪比计算当前帧目标语音信号的先验信噪比,并根据当前帧目标语音信号的先验信噪比以及当前帧目标语音信号不存在的先验概率计算当前帧目标语音信号存在的后验概率,从而根据当前帧目标语音信号存在的后验概率计算混合抑制因子,以根据混合抑制因子以及当前帧近端语音信号计算当前帧近端语音信号经过残余回声抑制和噪声抑制处理后得到的语音信号,解决现有对语音信号独立进行残余回声抑制以及噪声抑制处理存在的计算量大及处理效果不理想等问题,实现在保证语音信号处理性能的前提下,降低语音信号处理的计算复杂度。
附图说明
[0026]图1是本专利技术实施例一提供的一种语音信号处理方法的流程图;
[0027]图2是本专利技术实施例二提供的一种语音信号处理方法的流程图;
[0028]图3是本专利技术实施例二提供的一种语音信号处理方法的流程图;
[0029]图4是本专利技术实施例三提供的一种语音信号处理装置的示意图;
[0030]图5为本专利技术实施例四提供的一种计算机设备的结构示意图。
具体实施方式
[0031]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。
[0032]另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
[0033]本专利技术实施例的说明书和权利要求书及附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
[0034]实施例一
[0035]图1是本专利技术实施例一提供的一种语音信号处理方法的流程图,本实施例可适用于对语音信号同时进行残余回声抑制和噪声抑制处理的情况,该方法可以由语音信号处理装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音信号处理方法,其特征在于,包括:获取当前帧原始语音信号、当前帧参考信号以及当前帧近端语音信号;计算所述当前帧近端语音信号的噪声功率;根据所述当前帧原始语音信号与所述当前帧参考信号之间的第一互相关系数、所述当前帧原始语音信号与所述当前帧近端语音信号之间的第二互相关系数以及所述当前帧近端语音信号的噪声功率计算当前帧目标语音信号不存在的先验概率;根据前一帧目标语音信号存在的后验概率计算当前帧目标语音信号的后验信噪比;根据所述当前帧目标语音信号的后验信噪比计算当前帧目标语音信号的先验信噪比,并根据所述当前帧目标语音信号的先验信噪比以及所述当前帧目标语音信号不存在的先验概率计算当前帧目标语音信号存在的后验概率;根据所述当前帧目标语音信号存在的后验概率计算混合抑制因子;根据所述混合抑制因子以及所述当前帧近端语音信号计算所述当前帧近端语音信号经过残余回声抑制和噪声抑制处理后得到的语音信号。2.根据权利要求1所述的方法,其特征在于,根据所述当前帧原始语音信号与所述当前帧参考信号之间的第一互相关系数、所述当前帧原始语音信号与所述当前帧近端语音信号之间的第二互相关系数以及所述当前帧近端语音信号的噪声功率计算当前帧目标语音信号不存在的先验概率,包括:根据所述当前帧近端语音信号的噪声功率、所述第一互相关系数以及所述第二互相关系数计算当前帧目标语音信号与当前帧噪声信号之间的功率比值;根据所述当前帧目标语音信号与当前帧噪声信号之间的功率比值计算所述当前帧目标语音信号不存在的先验概率。3.根据权利要求2所述的方法,其特征在于,根据所述当前帧近端语音信号的噪声功率、所述第一互相关系数以及所述第二互相关系数计算当前帧目标语音信号与当前帧噪声信号之间的功率比值,包括:基于如下公式计算所述当前帧目标语音信号与当前帧噪声信号之间的功率比值:其中,η1(i,j)表示所述当前帧目标语音信号与当前帧噪声信号之间的初步功率比值,λ
noise
(i,j)表示所述当前帧近端语音信号的噪声功率,C
de
(i,j)表示所述第二互相关系数,C
xd
(i,j)表示所述第一互相关系数,e
i,j
表示所述当前帧近端语音信号第j个频点的频谱。4.根据权利要求3所述的方法,其特征在于,根据所述当前帧近端语音信号的噪声功率、所述第一互相关系数以及所述第二互相关系数计算当前帧目标语音信号与当前帧噪声信号之间的功率比值,包括:基于如下公式计算所述当前帧目标语音信号与当前帧噪声信号之间的功率比值:η(i,j)=min((C
de
(i,j)/C
xd
(i,j))2,η1(i,j))其中,η(i,j)所述当前帧目标语音信号与当前帧噪声信号之间的目标功率比值。5.根据权利要求3或4所述的方法,其特征在于,根据所述当前帧目标语音信号与当前帧噪声信号之间的功率比值计算所述当前帧目标语音信号不存在的先验概率,包括:
基于如下公式计算所述当前帧目标语音信号不存在的先验概率:其中,q(i,j)表示所述当前帧近端语音信号不存在的先验概率,ν0表示门限值,η*表示所述当前帧目标语音信号与当前帧噪声信号之间的功率比值,η*取η1(i,j)或η(i,j)。6.根据权利要求1所述的方法,其特征在于,根据前一帧目标语音信号存在的后验概率计算当前帧目标语音信号的后验信噪比,包括:根据所述前一帧近端语音信号存在的后验概率计算当前帧残余回声信号以及当前帧噪声信号的联合功率谱;根据所述当前帧残余回声信号以及当前帧噪声信号的联合功率谱计算所述当前帧目标语音信号的后验信噪比。7.根据权利要求6所述的方法,其特征在于,根据所述前一帧近端语音信号存在的后验概率计算当前帧残余回声信号以及当前帧噪声信号的联合功率谱,包括:基于如下公式计算所述当前帧残余回声信号以及当前帧噪声信号的联合功率谱:基于如下公式计算所述当前帧残余回声信号以及当前帧噪声信号的联合功率谱:其中,λ(i,j)表示所述当前帧残余回声信号以及当前帧噪声信号的联合功率谱,表示前一帧近端语音信号的可变平滑因子,λ(i-1,j)表示前一帧残余回声信号以及前一帧噪声信号的联合功率谱,p(i-1,j)表示所述前一帧近端语音信号存在的后验概率;α
n
表示固定平滑系数;根据所述当前帧残余回声信号以及当前帧噪声信号的联合功率谱计算所述当前帧目标语音信号的后验信噪比,包括:基于如下公式计算所述当前帧目标语音信号的后验信噪比:其中,γ(i,j)表示所述当前帧目标语音信号的后验信噪比。8.根据权利要求1所述的方法,其特征在于,根据所述当前帧目标语音信号的后验信噪比计算当前帧目标语音信号的先验信噪比,包括:基于如下公式计算所述当前帧目标语...

【专利技术属性】
技术研发人员:刘溪杨晓霞
申请(专利权)人:大众问问北京信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1