一类单通道频域非因果语音降噪方法、系统、设备及介质技术方案

技术编号:37671079 阅读:28 留言:0更新日期:2023-05-26 04:32
一类单通道频域非因果语音降噪方法、系统、设备及介质,其方法包括:采集带噪语音信号;对带噪语音信号进行分帧、加窗、傅里叶变换等预处理,并引入帧间相关性及非因果机制;估计带噪信号及噪声信号的统计特性;基于估计得到的信号统计特性,估计语音降噪滤波器;对频域带噪信号滤波,得到干净语音信号的估计值;将经过滤波处理的频域语音信号转换到时域;实现单通道非因果语音降噪方法;其系统、设备及介质能够实现单通道频域非因果语音降噪;本发明专利技术设计了三种可同时利用过去帧和未来帧信息的非因果滤波器,可根据不同的要求及应用环境灵活地选择不同的滤波器,实现单通道频域非因果语音降噪,提升了其语音质量。提升了其语音质量。提升了其语音质量。

【技术实现步骤摘要】
一类单通道频域非因果语音降噪方法、系统、设备及介质


[0001]本专利技术涉及声学信号处理分析
,具体涉及一类单通道频域非因果语音降噪方法、系统、设备及介质。

技术介绍

[0002]语音降噪在智能语音、人机交互、远程会议、助听设备、车载、虚拟现实、临境通讯和军用超高背景噪声下的语音通信等系统中都起着举足轻重的作用,其性能的好坏直接影响着语音交互的体验。
[0003]根据是否利用空间信息,面向语音通信的语音降噪算法可以分为单通道语音降噪和多通道语音降噪两大类。尽管多通道降噪语音降噪利用了空间信息,可取得更好的语音降噪性能,但大多数多通道语音降噪方法在理论上等价于波束形成加单通道语音降噪方法的结合,且在实际中,由于成本、结构、硬件空间的限制,很多设备只能装备一个麦克风,另外,单通道语音降噪算法实现起来比较简单、复杂度较低,所以对单通道语音降噪算法仍具有重要意义。
[0004]目前,绝大多数频域单通道语音降噪方法为滤波增益(即每个频点的滤波器长度为1)的方法。这是由于为使得求解问题简单而通常假设相邻语音帧的统计特性不相关。但由于:1)语音信号的相邻帧本身具有一定的自相关性;2)在处理语音信号时,通常设置语音帧有一定的重叠率(通常为50%或75%),所以语音信号相邻帧的相关性通常较强。因此,可通过设计长度大于1的滤波器来利用相邻帧的相关性以改善语音降噪性能。CN114495964A公开了一种基于皮尔逊相关系数的频域滤波语音降噪方法,其主要思路为:对带噪语音信号进行短时傅里叶变换STFT处理,得到频域带噪语音信号;利用该频域带噪语音信号进行带噪语音信号的自相关矩阵估计、加性噪声信号的自相关矩阵估计和期望信号的自相关矩阵估计,将结果代入最优降噪滤波器的公式,得到最优降噪滤波器,所述最优降噪滤波器是基于皮尔逊相关系数的幅度平方最大和基于失真的均方误差最小求解所得;用最优降噪滤波器对频域带噪语音信号进行滤波处理,输出频域语音降噪信号;对频域降噪语音信号进行反短时傅里叶变换,输出时域语音降噪信号。但在现有的滤波器长度大于1的语音降噪方法中,只能利用过去语音帧和当前语音帧的相关性来实现语音降噪。无法有效利用未来语音帧的信息,导致语音降噪性能无法进一步提升。

技术实现思路

[0005]为了克服上述现有技术存在的缺陷,本专利技术的目的在于提供一类单通道频域非因果语音降噪方法、系统、设备及介质,基于系统可允许一定延时的假设,推导可同时利用过去帧和未来帧信息的非因果降噪滤波器,更好地改善带噪信号(输入信号)的信噪比及语音失真,提升其语音质量且方法更简单。
[0006]为了达到上述目的,本专利技术采用的技术方案为:
[0007]一类单通道频域非因果语音降噪方法,具体包括以下步骤:
[0008]步骤1、采集带噪语音信号;
[0009]步骤2、对带噪语音信号进行分帧、加窗、傅里叶变换等预处理,并引入帧间相关性及非因果机制;
[0010]步骤3、估计带噪信号及噪声信号的统计特性;
[0011]步骤4、估计语音降噪滤波器;
[0012]步骤5、对频域带噪信号滤波,得到干净语音信号的估计值;
[0013]步骤6、将经过滤波处理的频域语音信号转换到时域。
[0014]所述步骤2的具体方法为:
[0015]已知时域带噪语音信号模型表示为:y(t)=x(t)+v(t);
[0016]其中,t表示离散时间点,x(t)和v(t)分别表示干净语音信号(即期望信号)和加性噪声,y(t)表示带噪信号;
[0017]假设x(t)和v(t)彼此互不相关,同时假设所有信号都是零均值、宽带实信号;经过分帧、加窗及傅里叶变换后,信号模型写为:
[0018]Y(k,n)=X(k,n)+V(k,n)
[0019]其中,Y(k,n),X(k,n),V(k,n)分别表示y(t)、x(t)和v(t)在第n帧第k个频点的傅立叶变换系数,为简洁起见,后面的描述中将去掉k和n;
[0020]为引入帧间相关性,将N个连续的时间帧组合在一起,定义为:
[0021]y=[Y(1) Y(2) ... Y(N)]T
=x+v
[0022]其中,向量y是长度为N的带噪信号向量,向量x的定义为x=[X(1) X(2) ... X(N)]T
,向量v的定义为v=[V(1) V(2) ... V(N)]T
,分别表示语音信号向量和噪声信号向量;向量y中的元素Y(τ)表示Y(k,n

τ+1),其中1≤τ≤N,上标(
·
)
T
表示转置;
[0023]为引入非因果机制,设X(Q)为期望信号(1≤Q≤N,X(Q)表示X(k,n

Q+1)),即通过带噪信号向量y估计信号X(Q),从而引入非因果机制。
[0024]所述步骤3的具体方法为:
[0025]通过现有的噪声估计算法估计噪声信号向量v的自相关矩阵Φ
v
,通过递归方法估计带噪语音信号向量y的自相关矩阵Φ
y

[0026]Φ
y
(k,n)=α
y
Φ
y
(k,n

1)+(1

α
y
)y(k,n)y
H
(k,n)
[0027]其中α
y
为遗忘因子(0<α
y
<1),上标(
·
)
H
表示共轭转置;因语音信号和噪声信号相互独立,通过Φ
x
=Φ
y

Φ
v
估计语音信号向量x的自相关矩阵Φ
x
;矩阵Φ
x
中第Q行第Q列的元素即为期望信号X(Q)的方差φX(Q),应用φX(Q)对矩阵Φ
x
的第Q列进行归一化,则可得到向量
[0028][0029]基于φX(Q)和通过计算最后,通过式估计干扰信号加噪声信号的自相关矩阵Φ
in

[0030]所述步骤4的具体方法为:
[0031]基于步骤3中估计得到的信号统计特性,通过估计非因果维纳滤波器,通过估计非因果最小方差无失真响应滤波器,通过估计非因果折中滤波器。
[0032]所述步骤5的具体方法为:
[0033]基于步骤4所估计得到的滤波器,可通过Z(Q)=h
H
y得到干净语音信号的估计值Z(Q)。
[0034]所述步骤6的具体方法为:
[0035]通过反傅里叶变换以及重叠相加或重叠保留法,即可将步骤5得到的干净语音信号估计值Z(Q)转换到时域。
[0036]一类单通道频域非因果语音降噪系统,包括:
[0037]音频数据采集模块,用于采集带噪语音信号;
[0038]信号预处理模块,用于对带噪语音信号进行分帧、加窗、傅里本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一类单通道频域非因果语音降噪方法,其特征在于:具体包括以下步骤:步骤1、采集带噪语音信号;步骤2、对带噪语音信号进行分帧、加窗、傅里叶变换等预处理,并引入帧间相关性及非因果机制;步骤3、估计带噪信号及噪声信号的统计特性;步骤4、估计语音降噪滤波器;步骤5、对频域带噪信号滤波,得到干净语音信号的估计值;步骤6、将经过滤波处理的频域语音信号转换到时域。2.根据权利要求1所述的一类单通道频域非因果语音降噪方法,其特征在于:所述步骤2的具体方法为已知时域带噪语音信号模型表示为:y(t)=x(t)+v(t);其中,t表示离散时间点,x(t)和v(t)分别表示干净语音信号(即期望信号)和加性噪声,y(t)表示带噪信号;假设x(t)和v(t)彼此互不相关,同时假设所有信号都是零均值、宽带实信号;经过分帧、加窗及傅里叶变换后,信号模型写为:Y(k,n)=X(k,n)+V(k,n)其中,Y(k,n),X(k,n),V(k,n)分别表示y(t)、x(t)和v(t)在第n帧第k个频点的傅立叶变换系数,为简洁起见,后面的描述中将去掉k和n;为引入帧间相关性,将N个连续的时间帧组合在一起,定义为:y=[Y(1) Y(2)...Y(N)]
T
=x+v其中,向量y是长度为N的带噪信号向量,向量x的定义为x=[X(1) X(2)...X(N)]
T
,向量v的定义为v=[V(1) V(2)...V(N)]
T
,分别表示语音信号向量和噪声信号向量;向量y中的元素Y(τ)表示Y(k,n

τ+1),其中1≤τ≤N,上标(
·
)
T
表示转置;为引入非因果机制,设X(Q)为期望信号(1≤Q≤N,X(Q)表示X(k,n

Q+1)),即通过带噪信号向量y估计信号X(Q),从而引入非因果机制。3.根据权利要求1所述的一类单通道频域非因果语音降噪方法,其特征在于:所述步骤3的具体方法为:通过现有的噪声估计算法估计噪声信号向量v的自相关矩阵Φ
v
,通过递归方法估计带噪语音信号向量y的自相关矩阵Φ
y
:Φ
y
(k,n)=α
y
Φ
y
(k,n

1)+(1

α
y
...

【专利技术属性】
技术研发人员:王向辉李梅高朴韩冬田旭华郭晶陈晓屹
申请(专利权)人:陕西科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1