【技术实现步骤摘要】
语音增强方法
本专利技术涉及多通道语音降噪
,尤其涉及一种语音增强方法。
技术介绍
语音是人类最便捷和自然的交流工具之一,一方面它消除了人与人之间交流的距离隔阂,另一方面它也提高了人与机器之间交互的效率。然而,现实环境中无处不在的噪声也不同程度地影响着语音交流的质量,研究有效的语音增强技术就显得尤为重要,是近几十年来学者们研究的热点。在现有的语音增强算法中,可以根据麦克风的数量将其分为两大类,即多通道语音增强算法和单通道语音增强算法。其中在多通道算法中,波束形成方法最为常见。然而波束形成算法往往对抑制方向性干扰和噪声的能力较好,对于无方向性的环境噪声,波束形成的性能就会降低。因此,近年来波束形成与后置滤波结合的方法成为了研究热点。但是,目前提出的后置滤波的方法大多假设环境噪声为高斯白噪声或者是散弹噪声,并且没有考虑干扰的情况,因此当方向性的非平稳干扰和环境噪声同时存在时,这些后置滤波方法对语音信号的增强效果并不是很好。
技术实现思路
本专利技术的目的是针对麦克风阵列接收的多通道语音信号提供一种语音增强方法,能够在方向性的非平稳干扰和无方向性的环境噪声同时存在的情况下仍然保持良好的语音增强的性能。本专利技术的目的是通过以下技术方案实现的:一种语音增强方法,包括:采用联合字典学习方法的训练方法,针对干净的语音信号、干扰和噪声,学习获得联合字典;通过多重信号分类算法测得期望语音信号的入射方向,并采用MVDR波束形成器来处理阵列接收信号,在抑制非期望语音方向上的干扰和噪声的同时增强期望方向的语音信号;利用学习获得的联合字典,对MVDR波束形成器的输出信号进行一级 ...
【技术保护点】
1.一种语音增强方法,其特征在于,包括:采用联合字典学习方法的训练方法,针对干净的语音信号、干扰和噪声,学习获得联合字典;通过多重信号分类算法测得期望语音信号的入射方向,并采用MVDR波束形成器来处理阵列接收信号,在抑制非期望语音方向上的干扰和噪声的同时增强期望方向的语音信号;利用学习获得的联合字典,对MVDR波束形成器的输出信号进行一级联合稀疏表示,并根据稀疏表示的残留成分设计权重系数,从而获得最终估计的语音信号、干扰和噪声,再结合维纳滤波器的形式得到对语音信号的基于均方意义的最优估计,最终恢复出期望的语音信号,实现语音增强。
【技术特征摘要】
1.一种语音增强方法,其特征在于,包括:采用联合字典学习方法的训练方法,针对干净的语音信号、干扰和噪声,学习获得联合字典;通过多重信号分类算法测得期望语音信号的入射方向,并采用MVDR波束形成器来处理阵列接收信号,在抑制非期望语音方向上的干扰和噪声的同时增强期望方向的语音信号;利用学习获得的联合字典,对MVDR波束形成器的输出信号进行一级联合稀疏表示,并根据稀疏表示的残留成分设计权重系数,从而获得最终估计的语音信号、干扰和噪声,再结合维纳滤波器的形式得到对语音信号的基于均方意义的最优估计,最终恢复出期望的语音信号,实现语音增强。2.根据权利要求1所述的一种语音增强方法,其特征在于,所述采用联合字典学习方法的训练方法,针对干净的语音信号、干扰和噪声,学习获得联合字典包括:在训练阶段,将干净语音信号str(t)、干净干扰itr(t)、干净噪声ntr(t)分别通过短时傅里叶变换得到时频域上的干净语音信号Str、干净干扰Itr和干净噪声Ntr,将这些时频域上的信号线性相加得到混合信号Ytr;采用联合字典学习的方法来获得联合字典,其包括:具有映射关系的混合信号字典Dy1和语音字典Ds,记为混合信号字典Dy2和干扰字典Di,记为以及混合信号字典Dy3和噪声字典Dn,记为其中,三个混合信号字典Dy1、Dy2与Dy3是由混合信号Ytr生成的互不相同的字典,C1是对于混合信号和干净语音信号的相同稀疏表示系数,C2是对于混合信号和干净干扰的相同稀疏表示系数,C3是对于混合信号和干净噪声的相同稀疏表示系数,q为稀疏约束;c1,g、c2,g和c3,g对应的表示稀疏系数矩阵C1、C2和C3的第g列;表示弗罗贝尼乌斯范数,||·||1表示1-范数。3.根据权利要求1所述的一种语音增强方法,其特征在于,阵列接收到的信号采用下述方式来表示:阵列为任意类型的阵列,包括:线阵列、圆阵列或者面阵列;假设一个由M个全向性的阵元排列成均匀线阵列,来自空间中的远场信号入射到该阵列,则在观测时刻t第m个阵元接收到的信号xm(t)为:xm(t)=s[t-τm(θs)]+i[t-τm(θi)]+nm(t)式中,s[t-τm(θs)](m=1,2,…,M)表示接收信号中的期望语音信号,i[t-τm(θi)]表示干扰(主要由点噪声源产生),nm(t)表示环境噪声(散弹噪声,即无方向噪声);τm(θs)为第m个阵元与参考点接收到的期望语音信号之间的时间差,τm(θi)为第m个阵元与参考点接收到的干扰之间的时间差,θs和θi分别表示期望语音信号和干扰的入射方向;阵列接收信号表示为:x(t)=[x1(t)x2(t)…xM(t)]T;阵列接收信号x(t)经过短时傅...
【专利技术属性】
技术研发人员:叶中付,朱媛媛,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。