【技术实现步骤摘要】
一种平衡降噪量和语音音质的单通道语音增强方法
[0001]本专利技术属于语音增强算法领域,具体涉及一种平衡降噪量和语音音质的单通道语音增强方法。
技术介绍
[0002]语音增强是音频信号处理的核心问题之一,其主要目的是从受到环境噪声、干扰人声、混响以及回声等污染的信号中恢复语音,提升语音质量与可懂度,其在移动通信、电话会议、蓝牙耳机、助听器以及语音识别前端得到了广泛的应用。单通道语音增强是其中的一类重要技术,主要应用于仅有单个传声器采集信号的场景下,也可以作为多通道技术的后处理步骤。
[0003]基于传统信号算法的单通道语音增强技术具有计算复杂度低、稳定性高、参数可解释性强等优势,并已经形成了多种不同类别的算法,如谱减法、维纳滤波、基于统计模型的算法、基于小波变换的算法和基于子空间的算法等。其中,离散傅里叶变换域的基于最小均方误差的算法因其较低的计算复杂度、优秀的处理性能以及易与其他系统相结合的特点得到了更为广泛的应用。
[0004]单通道语音增强技术没有来自空间维度的信息,因此只能基于频谱的多样性与源的特性 ...
【技术保护点】
【技术特征摘要】
1.一种平衡降噪量和语音音质的单通道语音增强方法,其特征在于,该方法包括以下步骤:步骤1,将含噪信号变换到时频域,并利用PEFAC方法估计基频;步骤2,计算后验信噪比,根据步骤1得到的基频估计值,在倒谱域平滑后验信噪比,进而利用固定先验的方法估计后验语音存在概率;步骤3,利用无偏最小均方误差方法,根据步骤2得到的后验语音存在概率估计噪声功率谱密度;步骤4,根据步骤3得到的噪声功率谱密度估计值,计算后验信噪比估计值,并计算语音功率谱密度的最大似然估计;步骤5,根据步骤1得到的基频估计值,在倒谱域平滑步骤4得到的语音功率谱密度的最大似然估计,同时进行倒谱基频增强,进而得到先验信噪比的估计;步骤6,利用自适应先验的方法,根据步骤4得到的后验信噪比估计值与步骤5得到的先验信噪比估计值,再次估计后验语音存在概率;步骤7,根据步骤4得到的后验信噪比估计值与步骤5得到的先验信噪比估计值,计算基于广义伽马先验χ的对数谱幅度增益,进而结合步骤6得到的后验语音存在概率估计值,导出基于语音存在不确定性的增益估计;步骤8,利用步骤7得到的增益估计值增强语音,并将增强后的谱变换回时域,得到增强信号。2.根据权利要求1所述的一种平衡降噪量和语音音质的单通道语音增强方法,其特征在于,所述步骤2中的倒谱域平滑方法具体如下:设表示后验信噪比的估计值,其中k、l分别表示频带索引和帧索引;利用前一帧噪声功率谱密度估计值与当前帧含噪信号Y(k,l)的功率谱密度计算:将变换到倒谱域,记为γ
ceps
(q,l),即取对数并进行逆离散傅里叶变换:其中,IDFT{
·
}表示逆离散傅里叶变换,q表示倒谱频率索引;N表示步骤1中使用的离散傅里叶变换的长度;由于对称性,以下操作仅对进行;将步骤1得到的基频估计值f0(l)变换为倒谱频率q0(l):其中,f
s
表示采样率;表示向下取整;进而以q0(l)为中心将基频拓展到大小为2Δq0+1的范围:
其中,v(l)为浊音帧判别结果,v(l)=1表示当前帧为浊音帧,v(l)=0表示当前帧为非浊音帧;进而确定平滑因子α
ceps
(k,l):其中,β
ceps
用于平滑α
ceps
(q,l);α
const
(q)是预设的倒谱频率相关的平滑因子,表现为低倒谱频率数值较小,其余较大;α0是较小的基频平滑因子;平滑γ
ceps
(q,l),得到(q,l),得到反变换回频域,得到有偏的平滑结果γ
b
(k,l):其中,DFT{
·
}表示离散傅里叶变换;进行偏差补偿,得到无偏平滑结果进行偏差补偿,得到无偏平滑结果其中,...
【专利技术属性】
技术研发人员:汪大涵,卢晶,朱长宝,胡玉祥,程光伟,刘松,朱天一,张哲会,刘磊,
申请(专利权)人:南京大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。