【技术实现步骤摘要】
一类单通道频域非因果语音降噪方法、系统、设备及介质
[0001]本专利技术涉及声学信号处理分析
,具体涉及一类单通道频域非因果语音降噪方法、系统、设备及介质。
技术介绍
[0002]语音降噪在智能语音、人机交互、远程会议、助听设备、车载、虚拟现实、临境通讯和军用超高背景噪声下的语音通信等系统中都起着举足轻重的作用,其性能的好坏直接影响着语音交互的体验。
[0003]根据是否利用空间信息,面向语音通信的语音降噪算法可以分为单通道语音降噪和多通道语音降噪两大类。尽管多通道降噪语音降噪利用了空间信息,可取得更好的语音降噪性能,但大多数多通道语音降噪方法在理论上等价于波束形成加单通道语音降噪方法的结合,且在实际中,由于成本、结构、硬件空间的限制,很多设备只能装备一个麦克风,另外,单通道语音降噪算法实现起来比较简单、复杂度较低,所以对单通道语音降噪算法仍具有重要意义。
[0004]目前,绝大多数频域单通道语音降噪方法为滤波增益(即每个频点的滤波器长度为1)的方法。这是由于为使得求解问题简单而通常假设相邻语音帧的统计特性不相关。但由于:1)语音信号的相邻帧本身具有一定的自相关性;2)在处理语音信号时,通常设置语音帧有一定的重叠率(通常为50%或75%),所以语音信号相邻帧的相关性通常较强。因此,可通过设计长度大于1的滤波器来利用相邻帧的相关性以改善语音降噪性能。CN114495964A公开了一种基于皮尔逊相关系数的频域滤波语音降噪方法,其主要思路为:对带噪语音信号进行短时傅里叶变换STFT处理,得到频域带噪 ...
【技术保护点】
【技术特征摘要】
1.一类单通道频域非因果语音降噪方法,其特征在于:具体包括以下步骤:步骤1、采集带噪语音信号;步骤2、对带噪语音信号进行分帧、加窗、傅里叶变换等预处理,并引入帧间相关性及非因果机制;步骤3、估计带噪信号及噪声信号的统计特性;步骤4、估计语音降噪滤波器;步骤5、对频域带噪信号滤波,得到干净语音信号的估计值;步骤6、将经过滤波处理的频域语音信号转换到时域。2.根据权利要求1所述的一类单通道频域非因果语音降噪方法,其特征在于:所述步骤2的具体方法为已知时域带噪语音信号模型表示为:y(t)=x(t)+v(t);其中,t表示离散时间点,x(t)和v(t)分别表示干净语音信号(即期望信号)和加性噪声,y(t)表示带噪信号;假设x(t)和v(t)彼此互不相关,同时假设所有信号都是零均值、宽带实信号;经过分帧、加窗及傅里叶变换后,信号模型写为:Y(k,n)=X(k,n)+V(k,n)其中,Y(k,n),X(k,n),V(k,n)分别表示y(t)、x(t)和v(t)在第n帧第k个频点的傅立叶变换系数,为简洁起见,后面的描述中将去掉k和n;为引入帧间相关性,将N个连续的时间帧组合在一起,定义为:y=[Y(1) Y(2)...Y(N)]
T
=x+v其中,向量y是长度为N的带噪信号向量,向量x的定义为x=[X(1) X(2)...X(N)]
T
,向量v的定义为v=[V(1) V(2)...V(N)]
T
,分别表示语音信号向量和噪声信号向量;向量y中的元素Y(τ)表示Y(k,n
‑
τ+1),其中1≤τ≤N,上标(
·
)
T
表示转置;为引入非因果机制,设X(Q)为期望信号(1≤Q≤N,X(Q)表示X(k,n
‑
Q+1)),即通过带噪信号向量y估计信号X(Q),从而引入非因果机制。3.根据权利要求1所述的一类单通道频域非因果语音降噪方法,其特征在于:所述步骤3的具体方法为:通过现有的噪声估计算法估计噪声信号向量v的自相关矩阵Φ
v
,通过递归方法估计带噪语音信号向量y的自相关矩阵Φ
y
:Φ
y
(k,n)=α
y
Φ
y
(k,n
‑
1)+(1
‑
α
y
...
【专利技术属性】
技术研发人员:王向辉,李梅,高朴,韩冬,田旭华,郭晶,陈晓屹,
申请(专利权)人:陕西科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。