一种用于语音识别系统消除背景噪音的方法技术方案

技术编号:14897395 阅读:206 留言:0更新日期:2017-03-29 12:40
本发明专利技术提供一种用于语音识别系统消除背景噪音的方法,包括如下步骤:步骤一:捕捉噪音声源发出的背景噪音和主音源发出的指令声音,设背景噪音的声强为x1,设指令声音的声强为y1;步骤二:捕捉噪音声源发出的背景噪音和主音源发出的指令声音,背景噪音的声强设为x2,指令声音的声强设为y2;步骤三:计算(x1+y1):(x2+y2);步骤四:提取分母的音频特征,即x2+y2的音频特征,并生成反相音频信号进行滤波;步骤五:降噪模块对滤出的有效音频波形进行放大,完成噪音识别与噪音消除,并还原主音。本发明专利技术的方法大大提高语音识别系统对于人声指令的正确识别效率。

【技术实现步骤摘要】

本专利技术涉及一种用于语音识别系统消除背景噪音的方法,属于音频处理领域。
技术介绍
当前背景噪音降噪技术分为主动降噪和被动降噪技术。首先介绍一下被动降噪的原理:被动式降噪,就是通过加装隔音、吸音材料,阻断声波传递、吸收声波能量,实现人耳听觉系统只能接收到合法传递声音信息,这种降噪技术也可以称作物理技术降噪。被动式降噪耳麦通常是通过加装耳机的外罩,如海绵体或橡胶体等,以达到吸收声波和阻断声波传递的效果,让人耳可以听到纯净的音乐等耳机播报的声音。这种被动降噪技术的缺陷是,对于采集声音的系统来说,是无法实行被动降噪的,也就是说,对于听众是人耳可以采用被动降噪,对于听众是一套电子系统,则无法采用被动降噪技术。另外,被动降噪技术对于外界高频噪音隔阻吸收效果较好,但对于低频噪音的阻隔效果就比较差。由于被动降噪的这些不足,为了获得更好的听觉效果,主动降噪技术应运而生。主动降噪技术包括两部分技术和工作。第一部分,识别噪音;第二部分,消除噪音。第一部分:识别噪音。在识别噪音的技术上,当前通常的做法是通过其降噪系统进行“噪音采样”,采样的噪音一般是持续的、相对稳定的、规律性的、信号特征不明显的声音信息,这种噪音一般称作背景噪音,例如一个配送中心的叉车声、说话声、自动分拣机械声、喇叭声、手推车声、风扇声等等集合混合成的嗡嗡噪音。经过采样后,系统将后期采集的声音信号与样本进行比较,与样本相同的波形音频信息被识别为噪音。并采用“样本减法”的方式消除噪音。第二部分:消除噪音。在消除噪音的技术上,当前通常的做法是采用“样本减法”的方式。“样本减法”的方式,就是将采集到的声音信息总和减去噪音信息,余下的就是我们需要的合法声音信息。具体做法是利用听筒采集外界的声波信息,然后将该信息传递给算法芯片,算法芯片运算后发出用以抵消噪声信息的电信号,该电信号通过一个声波发声器发出与噪音相对应的声音,即相位相反、振幅相同的声波,该声波与噪音声波相遇后发生湮灭,从而在人耳听觉器官的附近形成一道噪音防御屏障,人耳就听不到噪音了。这种技术通常的做法是在系统上加装一块降噪电路芯片,并在系统上安装一块电池提供电源。因此主动降噪技术也可以称作有源消声降噪。一般降噪的范围是:100至1000HZ。降噪深度一般在12至18分贝。这种技术的缺陷和不足:在实际应用中,该技术降噪是采用的声波抵消,这样的情况下,常常因为运算问题或工艺问题,导致环境噪声没有抵消而是产生了加强。原因之一是由于延时引起相位的改变,随着频率的升高而增大,形成对噪音的加强,甚至引起啸叫。其次,高频部份相位快速翻转,电子系统对快速翻转的信号无法进行同步补偿。再次,这种降噪技术也很难对较低频的噪音进行消除,因为一般应用场景的小型喇叭很难产生足够的低频能量,用以抵消低频背景噪声。另一方面,由于主动降噪系统发出的声波不可能完全与噪音抵消,对于采集声音的电子系统来说,会获得不间断更多的主动反噪音信息,也就是说,对于听众是人耳可以智能区分有效声音信息,对于听众是一套电子系统,会将过滤后接收到的所有音频信息视为合法有效的信息进行识别,因此必然造成错误识别。例如,一个作业人员对系统说:5,而附近有叉车喇叭等噪音,在反相消音系统发出的声波抵消了大部分背景噪音,但却未能完全抵消叉车喇叭的声音,此时语音识别系统捕捉到这个未能过滤掉的音频信息,并混合作业人员发出的5的声音,此时系统对音频信息识别为8,因此发生错误。
技术实现思路
本专利技术的目的在于提供一种用于语音识别系统消除背景噪音的方法,以解决上述问题。本专利技术采用了如下技术方案:一种用于语音识别系统消除背景噪音的方法,其特征在于:步骤一:近嘴端听筒捕捉噪音声源发出的背景噪音和主音源发出的指令声音,设背景噪音的声强为x1,设指令声音的声强为y1;步骤二:近耳端听筒捕捉噪音声源发出的背景噪音和主音源发出的指令声音,背景噪音的声强设为x2,指令声音的声强设为y2,x1=x2,y1:y2>1;步骤三:计算近嘴端听筒与近耳端听筒捕获的声强总和的比值,即(x1+y1):(x2+y2);步骤四:提取分母的音频特征,即x2+y2的音频特征,并生成反相音频信号进行滤波;步骤五:降噪模块对滤出的有效音频波形进行放大,完成噪音识别与噪音消除,并还原主音。进一步,本专利技术的用于语音识别系统消除背景噪音的方法,还可以具有这样的特征:其中,步骤四中,噪音消除的方法直接通过电路生成反相声波电信号将滤出的噪音信号进行湮灭。进一步,本专利技术的用于语音识别系统消除背景噪音的方法,还可以具有这样的特征:步骤四中,提取的分母音频特征为:声强、音频、相位、波幅。专利技术的有益效果根据本专利技术的用于语音识别系统消除背景噪音的方法,本专利技术提供一种用于语音识别系统消除背景噪音的方法,该方法大大提高语音识别系统对于人声指令的正确识别效率。本专利技术克服了现有降噪技术的不足,能够实现更为理想的降噪效果,尤其是向以电子语音识别系统为听众的对象,提供降噪后的音频信息,能够实现电子系统高效识别合法的人声命令,减少错误识别。本专利技术可以广泛应用于物流分拣、专业设备维护、安检巡查等行业领域,上述行业作业中,具有相对固定的操作流程,采用语音交互系统完成作业的,本专利技术方法均可应用于该语音识别系统中,以帮助提高识别合法身份人向语音系统传达的声音指令。保证在工业环境下,满足生产的实际需要,以提高劳动生产的效率。对于提高工业信息化、提高工业作业效率具有广泛的实用价值。附图说明图1是双通道降噪语音识别耳麦的主视图;图2是双通道降噪语音识别耳麦的内侧结构示意图;图3是双通道降噪语音识别耳麦的内部结构示意图;图4是用于语音识别系统消除背景噪音的方法的流程图。具体实施方式以下结合附图和具体实施例对本专利技术做进一步的描述。本专利技术的消除背景噪音的方法,可以使用以下的硬件来进行实施。如图1、图2和图3所示,双通道降噪语音识别耳麦的主要组件包括:近嘴端听筒组件10,近耳端听筒组件21,运算芯片组件22,电池组件23。近耳端听筒组件21,负责收集背景噪音。近嘴端听筒组件10,负责收集合法人声命令和非法人声命令或突发噪音。运算芯片组件22上具有一个背景噪音音频过滤电路,用于运算识别背景噪音,并发出与背景噪音相位相反、振幅相同的反相声波电信号,以湮灭噪音。运算芯片组件22上还集成有一个突发噪音音频过滤电路,用于运算识别靠近人的嘴巴附近听筒收集到的非法人声和突发噪音,并发出与突发噪音相位相反、振幅相同的反相声波电信号,以湮灭噪音。电池组件23,为两个音频运算电路提供电源。利用上述结构的双通道降噪耳麦,再按照如下流程进行噪音识别、消除,和还原主音。如图4所示,用于语音识别系统消除背景噪音的方法的工作过程:步骤S201:近嘴端听筒捕捉噪音声源,即图中的声源一,发出的背景噪音,设背景噪音的声强为x1。步骤S202:听嘴端听筒捕捉主音源,即图中的声源二,发出的指令声音,设指令声音的声强为y1;步骤S201和步骤S202的采集音频的动作同时进行。步骤S203:近耳端听筒捕捉噪音声源发出的背景噪音,背景噪音的声强设为x2;步骤S204:主音源发出的指令声音,指令声音的声强设为y2,则:x1=x2,y1:y2>1;步骤S203和步骤S204的本文档来自技高网
...

【技术保护点】
一种用于语音识别系统消除背景噪音的方法,其特征在于,包括以下步骤:步骤一:近嘴端听筒捕捉噪音声源发出的背景噪音和主音源发出的指令声音,设背景噪音的声强为x1,设指令声音的声强为y1;步骤二:近耳端听筒捕捉噪音声源发出的背景噪音和主音源发出的指令声音,背景噪音的声强设为x2,指令声音的声强设为y2,x1=x2,y1:y2>1;步骤三:计算近嘴端听筒与近耳端听筒捕获的声强总和的比值,即(x1+y1):(x2+y2);步骤四:提取分母的音频特征,即x2+y2的音频特征,并生成反相音频信号进行滤波;步骤五:降噪模块对滤出的有效音频波形进行放大,完成噪音识别与噪音消除,并还原主音。

【技术特征摘要】
1.一种用于语音识别系统消除背景噪音的方法,其特征在于,包括以下步骤:步骤一:近嘴端听筒捕捉噪音声源发出的背景噪音和主音源发出的指令声音,设背景噪音的声强为x1,设指令声音的声强为y1;步骤二:近耳端听筒捕捉噪音声源发出的背景噪音和主音源发出的指令声音,背景噪音的声强设为x2,指令声音的声强设为y2,x1=x2,y1:y2>1;步骤三:计算近嘴端听筒与近耳端听筒捕获的声强总和的比值,即(x1+y1):(x2+y2);步骤四:...

【专利技术属性】
技术研发人员:唐志展
申请(专利权)人:上海日趋信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1