当前位置: 首页 > 专利查询>胡旻波专利>正文

融合基频信息的双麦克风定向噪音抑制的系统及方法技术方案

技术编号:12663363 阅读:141 留言:0更新日期:2016-01-07 00:49
本发明专利技术公开了一种融合基频信息的双麦克风定向噪音抑制系统和方法,所述系统包括主声音信号输入设备、辅助声音信号输入设备、单通道语音信号分离模块和双通道语音信号分离模块;所述方法为主声音信号输入设备收集主要语音信号输入单通道语音信号分离模块,辅助声音信号输入设备收集背景噪音信号;单通道语音信号分离模块和辅助声音信号输入设备的输出信号都输入和双通道语音信号分离模块中,最后输出处理后的声音信号。本发明专利技术充分考虑了噪音残留与语音扭曲这一矛盾问题,可以达到在不至扭曲语音的前提下有效抑制噪音,可以处理大部分真实环境中的非平稳噪音。

【技术实现步骤摘要】

本专利技术设及噪音抑制的系统和方法,具体设及一种融合基频信息的双麦克风定向 噪音抑制的系统及方法。
技术介绍
基于语音的人机交互技术是人与人、人与计算机最便捷、自然的交互方式。随着智 能手机、语音识别等相关产品技术的发展,市场对语音降噪相关技术的需求越来越迫切。而 用户在使用智能语音相关产品的同时,目标语音通常伴随着一些噪音,比如在家居环境下 电视、音响设备的声音,运些噪音限制了智能语音的效果与用户体验。本专利专利技术的技术正 是基于运项需求,通过信号处理,有效过滤掉相关噪音,确保语音信号的纯净度,提高语音 交互的用户感知与体验。 常规的基于噪音能量估计的方法,通常需要对噪音类型进行限制,必须能量时不 变的平稳信号,才能有一定的噪音抑制效果。此外,由于语音谱也被破坏,不能提高后续语 音识别相关技术的准确率。采用麦克风阵列的beanrforming技术,需要准确估计用户方位 信息,或者需要用户必须站在某个固定的位置,限制了其应用的灵活性。本项专利技术采用了计 算听觉场景分析技术,可W有效抑制真实环境下的非平稳定向噪声,并且只需要两个麦克 风,对用户方位信息并无特殊要求,应用更为灵活。 对现有的降噪技术和市场上的语音降噪类产品进行仔细的对比和分析,可发现现 有的降噪技术技术或者只能抑制某一类噪音,或者对噪音的处理效果不佳,有很大的噪音 残留,不能提高语音识别的准确性,或者对麦克风的数量有严格要求,使用并不灵活。比较 详细的比较如下所示: 阳0化]W谱减法(spectralsubtraction)为代表的语音增强技术,对噪音的平稳性有严 格要求,只能有效处理白噪声或者其他能量变化缓慢的噪音信号;语音信号通常也会被误 减,语音扭曲很大,降噪后语音感知质量差、可懂度并未提高,由于语音扭曲会导致语音识 别率进一步下降。 Wbeanrforming为代表的麦克风阵列处理技术,需要4个或者更多的麦克风才能 达到相对良好的降噪效果,需要知道用户方位的先验信息,对于定向噪音抑制性能有限。 W主成分分析为代表的盲源分离技术,在理想无混响或者混响较弱的情况下,效 果良好,但是真实家居环境应用下,混响通常很强,导致性能下降;通常声源的数量,不能多 于麦克风的数量,比如W双麦克风为例,如果噪音源超过一个(用户声源也要计算),会导 致性能下降;此外过高的时间开销也是限制其应用的重要原因。
技术实现思路
针对现有技术的不足,本专利技术公开了一种融合基频信息的双麦克风定向噪音抑制 的系统及方法。 阳009] 本专利技术的技术方案如下: 一种融合基频信息的双麦克风定向噪音抑制系统,包括主声音信号输入设备和辅 助声音信号输入设备,所述辅助声音信号输入设备距离声源的距离远于主声音信号输入设 备满包括: 单通道语音信号分离模块,包括恢复语音信号中的谐波的缺失成分的模块; 双通道语音信号分离模块,包括构造优化目标和最优滤波器,所述最优滤波器用 于计算系统在保证语音信号无扭曲的条件下抑制噪音; 阳〇1引输出模块; 所述主声音信号输入设备的输出端连接单通道语音信号分离模块,单通道语音信 号分离模块的输出端和辅助声音信号输入设备的输出端都连接双通道语音信号分离模块; 双通道语音信号分离模块的输出端连接输出模块,所述输出模块输出可识别文本。 其进一步的技术方案为,其特征在于,所述单通道语音信号分离模块包括谐波结 构缺失成分恢复模块,具体包括: 听觉谱计算模块,计算听觉谱估计函数; 二值掩蔽估计模块,设置有二值掩蔽函数,根据听觉谱估计函数区分由噪音主导 的时频单元并将其排除,得到目标语音谱估计; 谐波结构模型分析模块,设置有谐波结构分析函数,分析所述听觉谱计算模块的 输出信号的谐波结构; 谐波缺失成分恢复模块,设置有时域到频域的卷积函数,可恢复所述二值掩蔽估 计模块得到的目标语音谱估计中的谐波缺失成分。 其进一步的技术方案为,所述单通道语音信号分离模块还包括基于CASA和维纳 滤波的平滑滤波模块,具体包括: 噪音谱估计模块,可根据所述主声音信号输入设备所输入的信号中的无语音信号 的空白时间段噪音谱估计函数和并估计噪音能量; 自适应噪音控制因子计算模块,可根据噪音谱估计模块和所述二值掩蔽估计模块 所输出的信息得到与噪音效果成负相关的噪音控制因子; 浮值掩蔽计算模块,设置有浮值掩蔽计算函数,可根据噪音控制因子得到目标语 音频谱估计函数;对语音频谱估计函数进行短时傅里叶逆变换得到目标语音时域估计函 数。 其进一步的技术方案为,所述双通道语音信号分离模块包括对偶滤波器和最优滤 波器;所述对偶滤波器用于提取所述单通道语音信号分离模块所输出的目标语音信号和辅 助声音信号输入设备所输出的背景噪音信号;所述最优滤波器内设置有噪音残留评价函 数、语音扭曲度评价函数和最优滤波器估计函数;所述噪音残留评价函数与噪音抑制效果 呈负相关;所述语音扭曲度评价函数与语音扭曲程度呈正相关;所述最优滤波器估计函数 在噪音抑制效果和语音扭曲度之间找到噪音抑制的最佳值。一种使用如上所述的融合基频信息的双麦克风定向噪音系统抑制噪音的方法,包 括W下步骤: 步骤1、主声音信号输入设备收集主要语音信号,同时辅助声音信号输入设备收集 背景噪音信号; 步骤2、单通道语音信号分离模块对主要语音信号进行噪音过滤,恢复主要语音信 号谐波结构缺失成分,输出目标语音信号; 步骤3、双通道语音信号分离模块对所收集的背景噪音信号和所述步骤2输出的 目标语音信号构建对偶滤波器,并通过对偶滤波器建立优化函数,在语音不扭曲的基础上 抑制所述目标语音信号中含有的噪声。 其进一步的技术方案为,所述步骤2具体包括: 步骤2. 1、使用gammatone滤波器组对所属主要语音信号进行听觉滤波并计算听 觉谱估计函数;gammatone滤波器的时域冲击响应函数为: (1) 阳03引式(1)中,1为滤波器阶数,b为等效矩形带宽,b= 1.019X24. 7X0). 0043f+l); 步骤2.2、二值掩蔽估计,根据所述步骤2. 1中得到的听觉谱估计函数,区分出由 噪音主导的时频单元并将其排除,得到目标语音谱估计; 二值掩蔽估计函数为: W对(2) 式(2)中,S(t,f)为语音听觉谱估计函数,N(t,f)为噪音听觉谱估计函数;LC为 口限阔值; 步骤2. 3、谐波结构分析,根据所述步骤2. 1中听觉滤波器的输出信号,计算第f通 道、第m时间帖自相关谱:[00 測C3)根据式(3)计算互通道相关系数: W40](4) 阳0川式(4)中互通道相关系数C化m)的最大值对应处为基频对应圆频率f。,当fuG化时,对所述输出信号进行梳状滤波,梳状滤波器频域响应函数为: Hwmb讯=1+aexpH2 31fFs/F。)妨 Hshift讯=1+aexp(-j(2 31fFs/F〇+ 31)) (6) W44] 式妨和式(6)中,a为控制参数,F历采样频率;Htumb讯用W抓取谐波结构上 的语音能量,山ift讯用W抓取谐波结构之间的语音能量; 根据滤波后的时域信号计算梳状滤波能量比:饥 式(7)中CFR是进行谐波结构分析得到的特征; 步骤2. 4、谐波缺失成分恢复, 通过相邻的谐波成分对孤立出现的谐波成分的缺失进行恢复,恢复所述二值掩蔽 估计本文档来自技高网
...

【技术保护点】
一种融合基频信息的双麦克风定向噪音抑制系统,包括主声音信号输入设备和辅助声音信号输入设备,所述辅助声音信号输入设备距离声源的距离远于主声音信号输入设备;其特征在于,还包括:单通道语音信号分离模块,包括恢复语音信号中的谐波的缺失成分的模块;双通道语音信号分离模块,包括构造优化目标和最优滤波器,所述最优滤波器用于计算系统在保证语音信号无扭曲的条件下抑制噪音;输出模块;所述主声音信号输入设备的输出端连接单通道语音信号分离模块,单通道语音信号分离模块的输出端和辅助声音信号输入设备的输出端都连接双通道语音信号分离模块;双通道语音信号分离模块的输出端连接输出模块,所述输出模块输出可识别文本。

【技术特征摘要】

【专利技术属性】
技术研发人员:胡旻波
申请(专利权)人:胡旻波
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1