一种基于统计模型的双传感器语音增强方法与装置制造方法及图纸

技术编号:14799574 阅读:56 留言:0更新日期:2017-03-14 21:47
本发明专利技术公开了一种基于统计模型的双传感器语音增强方法与装置,该方法首先结合非气导传感器语音和气导传感器语音来构建当前用于分类的语音联合统计模型以及进行端点检测,通过联合统计模型的分类结果来计算最佳气导语音滤波器,对气导语音进行滤波增强,然后通过映射模型将非气导语音转换为具有气导特征的气导语音,并与滤波增强后的语音进行加权融合,以进一步提高语音的质量。本方法采用两级语音增强的结构方法,在气导语音因强噪声而滤波效果不好时,第二级语音增强将滤波语音与非气导语音的映射语音进行自适应加权融合,能在强噪声环境下获得更好的语音增强效果,该方法可广泛应用于视频通话、车载电话、多媒体教室、军事通信等多种场合。

【技术实现步骤摘要】

本专利技术涉及数字信号处理领域,特别涉及一种基于统计模型的双传感器语音增强方法与装置
技术介绍
通信是现代人与人之间进行交流的重要手段,而语音作为通信系统中最常见的形式,其质量直接影响了人们获取信息的准确性。语音在传播的过程中,难免受到各种各样环境噪声的干扰,其音质、可懂度都将明显下降,因此在实际应用中往往会利用语音增强技术对噪声环境下的语音进行处理。语音增强技术能从噪声背景中提取有用的语音信号,是抑制、降低噪声干扰的基本手段。传统的语音增强对象是基于空气传导传感器(如麦克风等)采集的语音信号,根据处理方式的不同,常用的语音增强技术可以分为基于模型的方法和非基于模型的方法两类。非基于模型的增强方法有谱减法、滤波法、小波变换法等,它们通常假定噪声是相对平稳的,当噪声变化过快时,其增强效果并不能令人满意。基于模型的语音增强方法则首先对语音信号和噪声信号建立统计模型,然后通过模型获取干净语音的最小均方误差估计或最大后验概率估计。这类方法能够避免音乐噪声的产生,并能处理非平稳噪声。但由于上述的基于模型和非基于模型的方法均基于麦克风等空气传导语音传感器,其信号容易受环境中的声学噪声影响,特别是在强噪声环境下,系统性能会大幅度下降。为解决强噪声对语音处理系统的影响,有别于传统的空气传导传感器,非空气传导的语音传感器利用说话人声带、颚骨等部位的振动来带动传感器中的簧片或者碳膜发生变化,改变其电阻值,使其两端的电压发生变化,从而将振动信号转化为电信号,即语音信号。由于空气中传导的声波无法使非空气传导传感器的簧片或者碳膜发生形变,因此非空气传导传感器不受空气传导声音的影响,具有很强的抗环境声学噪声干扰的能力。但因非空气传导传感器采集的是通过颚骨、肌肉、皮肤等的振动传播的语音,表现为发闷、含糊不清,其高频部分丢失严重,语音可懂度较差,制约了非空气传导技术的实际应用。鉴于空气传导与非空气传导传感器的单独应用都存在一定的缺陷,近年来出现了一些结合两者优点的语音增强方法。这些方法利用空气传导传感器语音和非空气传导传感器语音的互补性,采用多传感器融合技术来实现语音增强的目的,通常能取得比单传感器语音增强系统更好的效果。但现有的空气传导传感器与非空气传导传感器结合的语音增强方法还存在以下不足:(1)空气传导传感器语音与非空气传导传感器语音通常独立地进行恢复处理,然后再将两者恢复后的语音进行融合,未能在空气传导传感器语音和非空气传导传感器语音的恢复过程中充分利用两者之间的互补性;(2)在多变的强噪音环境下,空气传导传感器语音纯语音段的统计特性会被严重干扰,增强语音的信噪比也会降低,导致融合后语音增强效果不明显。
技术实现思路
本专利技术针对现有的基于空气传导传感器语音、非空气传导传感器语音和两者融合的语音增强方法的缺点与不足,本专利技术提供了一种基于统计模型的双传感器语音增强方法,该方法首先利用空气传导传感器语音(简称气导语音)与非空气传导传感器语音(简称非气导语音)之间的互补性,通过建立用于分类的联合统计模型来计算最佳气导语音滤波器,对气导语音进行滤波增强,然后通过映射模型将非气导语音转换为具有气导特征的气导语音,并与滤波增强后的语音进行加权融合,以进一步提高语音的质量。本专利技术还同时提供了实现上述基于统计模型的双传感器语音增强方法的装置。与现有技术相比,本专利技术能在强噪声环境下获得更好的语音增强效果,增强后的语音在主观和客观评价上获得更高分数。本专利技术可以广泛应用于视频通话、车载电话、多媒体教室、军事通信等多种场合。根据公开的实施例,本专利技术的第一个目的通过下述技术方案实现:一种基于统计模型的双传感器语音增强方法,包括下列步骤:步骤S1:同步采集干净的气导训练语音和非气导训练语音,建立用于分类的联合统计模型,并计算对应于每个分类的气导语音线性频谱统计模型;步骤S2:利用步骤S1同步采集的气导训练语音和非气导训练语音,建立非气导语音到气导语音的映射模型;步骤S3:同步采集气导检测语音和非气导检测语音,检测气导检测语音的端点,然后利用气导检测语音的纯噪声段建立气导噪声统计模型;步骤S4:利用气导噪声统计模型修正步骤S1中的联合统计模型,并对气导检测语音帧进行分类,然后根据分类结果对应的气导语音线性频谱统计模型和气导噪声统计模型计算最佳气导语音滤波器,并对气导检测语音进行滤波增强;步骤S5:根据步骤S2中得到的非气导语音到气导语音的映射模型,将非气导检测语音转换为气导的映射语音;步骤S6:对步骤S5中得到的映射语音与步骤4得到的滤波增强语音进行加权融合,得到融合增强后的语音。上述步骤S1中,用于分类的联合统计模型和对应于每个分类的气导语音线性频谱统计模型采用以下方法建立:步骤S1.1:同步采集干净的气导训练语音和非气导训练语音并进行分帧,提取每帧语音的特征参数;步骤S1.2:将步骤S1.1中气导训练语音和非气导训练语音的特征参数拼接得到干净的联合语音特征参数;步骤S1.3:利用步骤S1.2得到的联合语音特征参数,训练用于分类的联合统计模型;步骤S1.4:对所有用于训练的联合语音帧进行分类,计算属于每个分类的所有联合语音帧中气导语音线性频谱的统计参数,建立与每个分类相对应的气导语音线性频谱统计模型。上述步骤S1.1中,气导训练语音和非气导训练语音的特征参数为梅尔频率倒谱系数(MFCC)、线性预测倒谱系数(LPCC)或线谱频率(LSF)。上述步骤S1.3中用于分类的联合统计模型为多数据流混合高斯模型(GMM)或多数据流隐马尔可夫模型(HMM)。上述步骤S1.4中对应于每个分类的气导语音线性频谱统计模型表示为气导语音线性频谱的均值。上述步骤S2中非气导语音到气导语音的映射模型,用以下具体步骤获得:步骤S2.1:对步骤S1中同步采集的干净非气导训练语音和气导训练语音进行分帧,将非气导训练语音帧作为输入,同时刻的气导训练语音帧作为理想输出,送入初始化后的前馈神经网络;步骤S2.2:根据最小均方误差准则,采用尺度共轭梯度算法训练前馈神经网络的权重系数,使得实际输出与理想输出之间的误差最小,得到非气导语音到气导语音的映射模型。上述步骤S3中气导检测语音端点检测与气导噪声统计模型估计,包含以下步骤:步骤S3.1:同步采集气导检测语音和非气导检测语音并分帧;步骤S3.2:根据非气导检测语音帧的短时自相关函数Rw(k)和短本文档来自技高网
...

【技术保护点】
一种基于统计模型的双传感器语音增强方法,其特征在于,包括下列步骤:S1、同步采集干净的气导训练语音和非气导训练语音,建立用于分类的联合统计模型,并计算对应于每个分类的气导语音线性频谱统计模型;S2、利用同步采集的所述气导训练语音和所述非气导训练语音,建立非气导语音到气导语音的映射模型;S3、同步采集气导检测语音和非气导检测语音,检测气导检测语音的端点,然后利用气导检测语音的纯噪声段建立气导噪声统计模型;S4、利用所述气导噪声统计模型修正所述联合统计模型,并对气导检测语音帧进行分类,然后根据分类结果对应的气导语音线性频谱统计模型和气导噪声统计模型计算最佳气导语音滤波器,并对气导检测语音进行滤波增强后得到滤波增强语音;S5、根据所述非气导语音到气导语音的映射模型,将非气导检测语音转换为气导的映射语音;S6、将所述气导的映射语音与所述滤波增强语音进行加权融合,得到融合增强后的语音。

【技术特征摘要】
1.一种基于统计模型的双传感器语音增强方法,其特征在于,包括下列步骤:
S1、同步采集干净的气导训练语音和非气导训练语音,建立用于分类的联合统计模型,并计算对应于每个分类的气导语音线性频谱统计模型;
S2、利用同步采集的所述气导训练语音和所述非气导训练语音,建立非气导语音到气导语音的映射模型;
S3、同步采集气导检测语音和非气导检测语音,检测气导检测语音的端点,然后利用气导检测语音的纯噪声段建立气导噪声统计模型;
S4、利用所述气导噪声统计模型修正所述联合统计模型,并对气导检测语音帧进行分类,然后根据分类结果对应的气导语音线性频谱统计模型和气导噪声统计模型计算最佳气导语音滤波器,并对气导检测语音进行滤波增强后得到滤波增强语音;
S5、根据所述非气导语音到气导语音的映射模型,将非气导检测语音转换为气导的映射语音;
S6、将所述气导的映射语音与所述滤波增强语音进行加权融合,得到融合增强后的语音。
2.根据权利要求1所述的一种基于统计模型的双传感器语音增强方法,其特征在于,
所述步骤S1中用于分类的联合统计模型和对应于每个分类的气导语音线性频谱统计模型采用以下子步骤建立:
S1.1、同步采集干净的气导训练语音和非气导训练语音并进行分帧,提取每帧语音的特征参数;
S1.2、将所述气导训练语音和非气导训练语音的特征参数拼接得到干净的联合语音特征参数;
S1.3、...

【专利技术属性】
技术研发人员:张军陈鑫源潘伟锵宁更新冯义志余华季飞陈芳炯
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1