【技术实现步骤摘要】
一种基于皮尔逊相关系数的频域滤波语音降噪方法
[0001]本专利技术涉及语音通信
,具体涉及一种基于皮尔逊相关系数的频域滤波语音降噪方法。
技术介绍
[0002]语音是人与人、人与自然最简单最自然的交流方式,随着时代的发展,语音系统与人们的生活已经密不可分。然而在自然界中,噪声是无处不在的,因此在语音通信以及与语音相关的系统中,麦克风采集到的语音信号都是被噪声污染过的带噪信号,纯净语音信号几乎不存在。
[0003]大多数情况下,噪声的存在对语音系统是有害的,它会降低语音信号的质量和可懂度,给语音通信和识别带来不可忽视的障碍。因此,在进行语音通信或者语音识别之前,需要先对麦克风采集回来的带噪语音信号进行降噪处理,尽可能的去掉噪声并保存原始语音信号不失真。
[0004]语音降噪,指消除带噪语音信号中夹杂的加性背景噪音。
[0005]随着科技的发展,不断的创造出新的语音降噪应用场景。语音降噪的应用场景非常广泛,例如在手机通话和视频会议中,需要语音降噪来消除嘈杂的环境背景噪声,即马路上的嘈杂背景噪音、办 ...
【技术保护点】
【技术特征摘要】
1.一种基于皮尔逊相关系数的频域滤波语音降噪方法,其特征在于,包括以下步骤:步骤1,对带噪语音信号进行短时傅里叶变换STFT处理,得到频域带噪语音信号;步骤2,利用步骤1得到的频域带噪语音信号进行带噪语音信号的自相关矩阵估计、加性噪声信号的自相关矩阵估计和期望信号的自相关矩阵估计,然后将带噪语音信号的自相关矩阵估计结果和期望信号的自相关矩阵估计结果代入最优降噪滤波器的公式,得到最优降噪滤波器;所述最优降噪滤波器是基于皮尔逊相关系数的幅度平方MSPCC函数最大和基于失真的均方误差最小求解所得;步骤3,用步骤2计算得到的最优降噪滤波器对步骤1的频域带噪语音信号进行滤波处理,输出频域语音降噪信号;步骤4,对频域降噪语音信号进行反短时傅里叶变换,输出时域语音降噪信号。2.如权利要求1所述的基于皮尔逊相关系数的频域滤波语音降噪方法,其特征在于,步骤2中自相关矩阵估计的子步骤为:(1)初始化子步骤:初始输入的语音信号只有纯噪声没有期望信号,即期望信号的自相关矩阵Φ
x
(k,n)=0;采用短时平均估计出语音信号的自相关矩阵和加性噪声信号的自相关矩阵,即初始化y
H
(k,n);其中,y(k(n)是连续时间帧长度为L的带噪语音频域信号,k代表频点,k∈{0,1,2,...,K
‑
1},n代表时间帧,n∈{0,1,2,...,N},N为自然数,上标
H
表示矩阵共轭转置,运算符*表示两个矩阵相乘;(2)更新子步骤:利用遗忘因子更新带噪语音信号的自相关矩阵Φ
y
(k,n)=α
y
Φ
y
(k,n
‑
1)+(1
‑
α
y
)y(k,n)*y
H
(k,n),其中α
y
为带噪语音信号更新遗忘因子;采用语音端点检测VAD检测带噪语音信号中的无语音信号段,在无语音信号段更新加性噪声信号的自相关矩阵:Φ
v
(k,n)=α
v
Φ
v
(k,n
‑
1)+(1
‑
α
v
)y(k,n)*y
H
(k,n),其中α
v
为加性噪声信号更新遗忘因子,在有语音信号段不更新加性噪声的自相关矩阵;其中,y(k,n)是连续时间帧长度为L的带噪语音频域信号,k代表频点,k∈{0,1,2,...,K
‑
1},n代表时间帧,n∈{0,1,2,...,N},N为自然数,上标
H
表示矩阵共轭转置,运算符*表示两个矩阵相乘;(3)更新的期望信号的自相关矩阵估计子步骤,更新的期望信号的自相关矩阵估计的结果为:Φ
x
(k,n)=Φ
y
(k,n)
‑
Φ
v
(k,n),其中,Φ
y
(k,n)为更新的带噪语音信号的自相关矩阵,Φ
v
(k,n)为无语音信号段更新的加性噪声信号的自相关矩阵。3.如权利要求2所述的基于皮尔逊相关系数的频域滤波语音降噪方法,其特征在于,在初始化子步骤中,所述N为自然数,且N=40。4.如权利要求2所述的基于皮尔逊相关...
【专利技术属性】
技术研发人员:于姣龙,张青松,杜琳,孙婷,白俊梅,马美娜,王陈春,
申请(专利权)人:西安烽火电子科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。