一种基于有色噪声的语音增强方法技术

技术编号:16502754 阅读:219 留言:0更新日期:2017-11-04 12:29
本发明专利技术提供一种基于有色噪声的语音增强方法,通过建立双麦克风阵列,获得两个通道的带噪语音信号,对带噪语音信号数据的协方差矩阵进行特征值分解,将带噪语音信号空间分为信号子空间和噪声子空间。通过子空间法处理得到相对纯净的语音处理信号,然后结合最小均方误差估计算法,得到增强语音。该语音增强方法适用于智能家居的双麦阵列,不仅对噪声具有较好的降噪效果而且对语音的损伤也做到了最小失真,最大限度保证了纯净语音的可懂度。此外,该方法不仅对合成的带噪语音具有良好降噪效果,且对实际的带噪语音也有较好降噪效果。

A speech enhancement method based on colored noise

The present invention provides a method of speech enhancement based on colored noise, through the establishment of dual microphone array, for noisy speech signals of the two channels, the covariance matrix of the speech signal with noise data by eigenvalue decomposition, the noisy speech signal space is divided into signal subspace and noise subspace. The relatively pure speech processing signal is processed by subspace method, and then the minimum mean square error estimation algorithm is used to obtain the enhanced speech. Shuangmai array of the speech enhancement method for intelligent Home Furnishing, not only to the noise and has good noise reduction of speech damage also do the minimum distortion, to ensure maximum pure speech intelligibility. In addition, this method not only has a good noise reduction effect on the synthesized noisy speech, but also has a better noise reduction effect on the actual noisy speech.

【技术实现步骤摘要】
一种基于有色噪声的语音增强方法
本专利技术涉及信号处理
,具体而言,涉及一种基于有色噪声的语音增强方法。
技术介绍
随着科技的进步和人民生活水平的提高,用户对居住环境提出了更高的需求,越来越注重家居生活的舒适、安全与便捷。智能家居旨在融合计算机、自动化控制、人工智能和网络通讯各项技术于一体,将家居环境下的各种设备终端,比如照明设备、音视频设备、安防系统、网络家电等家庭网络连接在一起,实现家居环境的智能控制。语音是人与人之间最便捷的交互方式,智能语音技术对于改变家居环境下对电视、音箱、照明设备等控制方式有着重大革新意义,识赋予人与各终端设备良好沟通的重要桥梁。专利技术人研究发现,在真实家居场景下,用户发出语音指令的同时,通过伴随各种各样的噪声,比如电视的声音、音乐等。通常需要进行语音增强。然而在语音增强的过程中,提高信噪比(SNR)与提高可懂度通常是相互矛盾的。在滤除噪声的同时或多或少会损伤语音信号。通常,噪声滤除的越多,语音可懂度损害就越多,特别在低SNR下这一矛盾更为突出。传统的谱减法、维纳滤波法是在频域中进行分析的,计算量比较小,降噪效果不理想。而基于信号子空间的语音降噪算法,是将带噪语音信号投影到两个子空间中,一个是语音信号子空间,另一个是噪声子空间,通过去除噪声子空间,由语音信号子空间来重构语音信号,从而达到良好的降噪效果,但该方法属于单通道语音降噪算法,只适用于白噪声环境下的语音降噪,降噪后的语音通常伴有音乐噪声。专利CN1014660055提供了一种麦克风阵列语音增强技术,通过自适应滤波器用一个麦克风接收到的噪声抵消另一个麦克风接收到的信号中的噪声成分,保留语音成分,但是降噪的同时也会损害到语音。
技术实现思路
有鉴于此,本专利技术实施例针对语音增强过程中在滤除噪音的同时会损害语音信号,导致语音的可懂度下降的技术问题,提供一种基于有色噪声的语音增强方法。本专利技术是这样实施的:一种基于有色噪声的语音增强方法,包括以下步骤:步骤1,建立双麦克风阵列,接收得到两个通道的带噪语音信号,带噪语音信号经过时延补偿模块,以使两个通道的带噪语音信号同步;步骤2,得到带噪语音信号数据的协方差矩阵,并进行特征值分解,将带噪语音信号空间分为信号子空间和噪声子空间;步骤3,采用子空间法处理得到相对纯净的语音处理信号;步骤4,在信号子空间内对语音处理信号进行最小均方方差估计,计算最小均方误差。在步骤1中,S11,对麦克风接收到的两个通道的带噪语音信号分别进行预处理,预处理包括对带噪语音信号进行采样处理,然后进行分帧处理,将分帧处理后的每帧信号进行加窗处理。S12,经预处理后的带噪语音信号经过时延补偿模块,使两个麦克风的带噪语音信号准确同步,具体为:双麦克风阵列采集的两个通道的带噪语音信号分别为x0(n)和x1(n),进行傅立叶变换到频域,然后输入到时延估计单元计算x0(n)和x1(n)的相位差τ0和τ1,根据相位差计算出两个通道信号的相对延时ω0。然后,进行延时-求和波束形成,表示为:X(n)=ω0(n)x0(n-τ0)+ω1(n)x1(n-τ1),该过程可在某些程度上消除混响,并初略的对语音进行降噪。在步骤2中,S21,双麦克风阵列接收到带噪语音信号为X(n),计算得到带噪语音信号的协方差矩阵为:其中,X(n)表示带噪语音信号,E[·]表示求矩阵期望,上标H表示共轭转置,Rs表示纯净语音信号的协方差矩阵,Rn表示噪声信号的协方差矩阵;。S22,对协方差矩阵Rx进行特征值分解,表示为:Rx=UΛxUT;其中,Λx为Rx的K个特征值构成的K维对角阵,Λx的所有特征值中有M个较大的特征值,0<M<K,而其余K-M个特征值很小,都等于σN2,σN2表示噪声方差。令U=[UsUp」,U是矩阵Rx的特征向量矩阵,因而U是正交矩阵,满足:I=UxUxT+UpUpT其中,I为K维单位矩阵;Us为信号子空间,包含目标语音信号和噪声;UP为噪声子空间,只包含噪声。在步骤3中,S31,对带噪语音信号进行KL变换,表示为:E{UTX}=0;cov{UTX}=diag(Λx,1+σN2I,σN2I);cov{UpTX}=σN2I;其中,U是矩阵Rx的特征向量矩阵,UP为噪声子空间,Λx,1为Rx的特征值构成的对角阵;向量UpTX中的语音信号能量为零,即便是噪声,在估计纯净语音信号时,此向量可以被直接去除,得到相对纯净的所述语音处理信号。S32,将信号子空间的特征值减去噪声子空间的特征值,得到相对纯净的语音处理信号,表示为:Λs=Λx-Λn;其中,Λs为相对纯净的语音处理信号的特征值,Λx为信号子空间的特征值,Λn为噪声子空间的特征值。在步骤4中,S41,将噪声子空间UP的KL分量置零,表示为:E{UTX}=0;cov{UTX}=diag(Λx,1+σN2I,σN2I);cov{UpTX}=σN2I;S42,在信号子空间Us内对先相对纯净的语音处理信号的KL分量进行最小均方误差估计,具体为:先验信噪比ξk表示为:后验信噪比γk表示为:其中,Xk为带噪语音信号X的傅里叶变换,λs(k)为第k个频率分量下的语音方差,λn(k)为第K个频率分量下的噪声方差,Sk为纯净语音的傅里叶变化,Nk为噪声的傅里叶变换;得到ξk和γk后,定义νk为:则语音幅度谱估计值为:S43,MMSE增益:S44,通过KL逆变换,输出增强语音信号。本专利技术的有益效果是:该方法利用双麦阵列获得两个通道的带噪语音信号,两个麦克风的带噪语音信号通过时延补偿准备同步。然后通过子空间算法和最小均方误差估计法的结合,能够有效解决信号子空间单通道算法所产生的音乐噪声,在实现降噪的同时,有效保证语音信号的可懂度。方法简单,容易实现,且不仅对合成的带噪语音具有良好的降噪效果,对实际场景中的带噪语音也具有良好的降噪效果。此外,该语音增强方法不仅对白噪声有良好的降噪效果,且对noise92库里的其他噪声,如babble噪声、pink噪声、leopard噪声、volvo噪声等,也具有良好的降噪效果。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本专利技术实施例的原理示意图;图2为本专利技术实施例的步骤1的原理示意图;图3为babble+white噪声经过最小均方误差算法、子空间算法和本实施例改进算法后的分段信噪比;图4为leopard+white噪声经过最小均方误差算法、子空间算法和本实施例改进算法后的分段信噪比;图5为pink+white噪声经过最小均方误差算法、子空间算法和本实施例改进算法后的分段信噪比;图6为volvo+white噪声经过最小均方误差算法、子空间算法和本实施例改进算法后的分段信噪比;图7为空调噪声下的带噪语音在不同算法下的增强语音谱图。具体实施方式下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和本文档来自技高网
...
一种基于有色噪声的语音增强方法

【技术保护点】
一种基于有色噪声的语音增强方法,其特征在于,包括以下步骤:步骤1,建立双麦克风阵列,接收得到两个通道的带噪语音信号,所述带噪语音信号经过时延补偿模块,以使两个通道的所述带噪语音信号同步;步骤2,得到所述带噪语音信号数据的协方差矩阵,并进行特征值分解,将带噪语音信号空间分为信号子空间和噪声子空间;步骤3,采用子空间法处理得到相对纯净的语音处理信号;步骤4,在信号子空间内对所述语音处理信号进行最小均方方差估计,计算最小均方误差。

【技术特征摘要】
1.一种基于有色噪声的语音增强方法,其特征在于,包括以下步骤:步骤1,建立双麦克风阵列,接收得到两个通道的带噪语音信号,所述带噪语音信号经过时延补偿模块,以使两个通道的所述带噪语音信号同步;步骤2,得到所述带噪语音信号数据的协方差矩阵,并进行特征值分解,将带噪语音信号空间分为信号子空间和噪声子空间;步骤3,采用子空间法处理得到相对纯净的语音处理信号;步骤4,在信号子空间内对所述语音处理信号进行最小均方方差估计,计算最小均方误差。2.根据权利要求1所述的基于有色噪声的语音增强方法,其特征在于,得到所述带噪语音信号后,对其进行预处理,包括:对带噪语音信号进行采样处理,然后进行分帧处理,将分帧处理后的每帧信号进行加窗处理。3.根据权利要求1所述的基于有色噪声的语音增强方法,其特征在于,步骤1中,时延补偿的具体方法为:双麦克风阵列采集的两个通道的带噪语音信号分别为x0(n)和x1(n),进行傅立叶变换到频域,然后输入到时延估计单元计算x0(n)和x1(n)的相位差τ0和τ1,根据相位差计算出两个通道信号的相对延时ω0,然后进行延时-求和波束形成,表示为:X(n)=ω0(n)x0(n-τ0)+ω1(n)x1(n-τ1)。4.根据权利要求1所述的基于有色噪声的语音增强方法,其特征在于,步骤2中,S21,双麦克风阵列接收到带噪语音信号为X(n),计算得到带噪语音信号的协方差矩阵为:其中,X(n)表示带噪语音信号,E[·]表示求矩阵期望,上标H表示共轭转置,Rs表示纯净语音信号的协方差矩阵,Rn表示噪声信号的协方差矩阵;S22,对协方差矩阵进行特征值分解,表示为:Rx=...

【专利技术属性】
技术研发人员:郑康丽
申请(专利权)人:厦门理工学院
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1