一种提升语音识别稳健性的装置及其方法制造方法及图纸

技术编号:20727844 阅读:81 留言:0更新日期:2019-03-30 18:29
本发明专利技术提供了一种提升语音识别稳健性的装置及其方法,该装置和方法通过在智能语音交互机器等目标设备中自身机体的噪声源位置和噪声能量最小区域这两个不同位置处分别获取不同的声音信号,随后基于获得的声音信号实施自适应降噪处理和基于多通道的降噪算法的处理,从而在有效消除该目标设备自带的固有噪声的同时,保证声音信号中有用语音信息不被篡改,以提高该智能语音交互机器进行语音识别的准确性和正确率。

【技术实现步骤摘要】
一种提升语音识别稳健性的装置及其方法
本专利技术涉及人机交互的
,特别涉及一种提升语音识别稳健性的装置及其方法。
技术介绍
随着人工智能技术和互联网技术的不断进步,具有人机交互功能的智能机器人已经出现在人类的生活和工作中,并且这类智能机器人本身具有运算处理能力强大,能快速地应对不同的突发情况和及时海量地处理各种不同类型的问题的特点,故其受到广泛的应用和青睐。这类智能机器人的人机交互功能包括语音识别或者手势动作识别等。其中,语音识别作为智能机器人发展最早和最快的技术,其能够满足人们与智能机器人之间进行自然方便对话交流的需求。人们通过对智能机器人发出相应的语音信息,智能机器人通过其语音识别功能就能够向对方进行合适的语音应答,可见语音识别在人机交互技术发展中占据非常重要的位置。通常来说,语音识别包括语音接收、语义解释和语音反馈这几个过程;其中语音接收过程中获得源语音的质量决定后续语音解释和语音反馈的准确定,一般而言,在相对安静的环境下源语音的质量较好,在相对嘈杂的环境下源语音的质量较差。但是,在智能机器人实际工作中,其工作环境是复杂多变的,同时该工作环境也不可能只存在智能机器人与对话人类方这两者,这导致在语音接收过程中会不可避免地受到背景噪声和其他非交互噪声的干扰。为了提高智能机器人的语音识别准确性,就必须对语音接收过程中获得的源语音在语义解释处理前进行降噪处理,以从中提取出有效的语音信息。在现有技术中,对源语音进行降噪处理只有在该源语音存在弱噪声的情况下才能有效地降低噪声信息并准确地提取出有用的语音信息,而对于该源语音存在强噪声的情况,若采用传统的降噪处理,会在消除该源语音中噪声信息的同时,使得该源语音中的有用语音信息受到破坏篡改,这并不能保证经降噪处理后的源语音会携带完整的有用语音信息。此外,除了外部强噪声难以有效消除外,智能机器人内部自身的强噪声也是一个不可忽略的影响因素,其始终伴随着智能机器人的工作而存在,且无法用外部屏蔽技术来消除,虽然麦克风阵列能够处理内部和外部噪声,但当噪声强度很大时,经过麦克风阵列处理后依然会存在较多的残留噪声,其存在会严重降低智能机器人语音识别的准确性。
技术实现思路
在人机交互的语音识别过程中,智能机器人在工作过程中其内部的元器件会产生不同强度和频率的运转噪声,这些运转噪声相互叠加会形成一具有干扰作用的强噪声,该强噪声会掺混进入该智能机器人接收交互对象发出的语音信息中。由于该强噪声是智能机器人工作中自带和固有的噪声,其并不能通过采用外界过滤屏蔽或者麦克风阵列接收等外界手段进行降噪处理,其是伴随智能机器人的运转而存在,故采用一般的降噪技术并不能有效地去除过滤该内部固有的强噪声,这给提高智能机器人的语音识别准确性带来很大的挑战。针对现有降噪处理手段并不能有效地去除智能机器人自身固有的内部强噪声这一缺陷,本专利技术提供一种提升语音识别稳健性的装置及其方法,该装置和方法通过在智能语音交互机器关于噪声强度不同位置处分别设置麦克风和麦克风阵列来接收相应的声音信号,随后基于获得的声音信号实施自适应降噪处理和波束形成处理,这样能够有效地降低该智能语音交互机器自身固有内部强噪声的影响,从而显著地提高语音信号的信噪比和提升语音识别的准确性。本专利技术提供一种提升语音识别稳健性的装置,所述装置用于降低源自目标设备自身机体的噪声并提高所述目标设备对外来语音识别的准确性,所述装置包括:第一声音获取单元,其用于拾取位于所述目标设备自身机体的噪声源位置处的第一声音信号;第二声音获取单元,其用于拾取位于所述目标设备自身机体中噪声能量最小区域处的第二声音信号;第一降噪单元,其能够基于自适应噪声消除算法,对所述第二声音信号进行自适应降噪处理以消除其中关于所述第一声音信号的噪声成分;第二降噪单元,其能够对所述第二声音信号经过自适应降噪处理后得到的阵列数据进行基于多通道降噪算法的处理,从而识别得到对应的语音信号;进一步,所述装置还包括分贝仪和运算单元,所述分贝仪用于获取所述目标设备自身机体不同位置处的噪声信号,所述运算单元能够基于所述不同位置处的噪声信号和所述目标设备自身机体的物理结构,获得关于所述目标设备自身机体的噪声信号的区域分布信息,并确定所述目标设备自身机体的噪声源位置和噪声能量最小区域,其中,所述目标设备自身机体的物理结构包括所述目标设备自身机体的外壳形状和/或所述目标设备自身机体内部的有源电子器件的安装位置;进一步,所述第一声音获取单元为拾取麦克风,其设置于靠近所述噪声源位置的附近区域,所述第一降噪单元在进行所述自适应降噪处理前,还获取所述第一声音信号中的噪声统计量,并基于所述噪声统计量实施所述自适应降噪处理;其中,获取所述噪声统计量包括分析和提取所述第一声音信号对应的噪声成分,并对所述噪声成分进行频域分析处理,从而得到关于所述噪声成分的噪声统计量;进一步,所述第一降噪单元还连接有噪声检测单元和控制单元,所述噪声检测单元能够对所述第一声音信号进行噪声识别检测,所述控制单元能够根据所述噪声识别检测的结果,控制所述第一降噪单元是否实施所述噪声统计量的获取,具体为,若所述噪声检测单元检测到所述第一声音信号不存在噪声信号,则所述控制单元暂停从所述第一声音信号中获取所述噪声统计量,若所述噪声检测单元检测到所述第一声音信号存在噪声信号,则所述控制单元指示从所述第一声音信号中获取所述噪声统计量;进一步,所述第二声音获取单元为麦克风阵列,所述麦克风阵列中的若干麦克风单元分布在所述噪声能量最小区域处,所述第二降噪单元实施所述基于多通道降噪算法的处理能够去除所述第二声音信号中的残余噪声和混响。本专利技术还提供一种提升语音识别稳健性的方法,所述方法包括:拾取目标设备自身机体的噪声源位置处的第一声音信号,以及拾取所述目标设备自身机体中噪声能量最小区域处的第二声音信号;基于自适应噪声消除算法,对所述第二声音信号进行自适应降噪处理以消除其中关于所述第一声音信号的噪声成分;对所述第二声音信号经过自适应降噪处理后得到的阵列数据进行基于多通道降噪算法的处理,从而识别得到对应的语音信号;进一步,所述方法在拾取所述第一声音信号和所述第二声音信号前,还包括确定所述噪声源位置和所述噪声能量最小区域,具体为,通过分贝仪获取所述目标设备自身机体不同位置处的噪声信号,随后基于所述不同位置处的噪声信号和所述目标设备自身机体的物理结构,获得关于所述目标设备自身机体的噪声信号的区域分布信息,最终确定所述目标设备自身机体的噪声源位置和噪声能量最小区域各自的分布位置;其中,获取所述目标设备自身机体的物理结构包括获取所述目标设备自身机体的外壳形状和/或所述目标设备自身机体内部的有源电子器件的安装位置;进一步,拾取目标设备自身机体的噪声源位置处的第一声音信号具体为在靠近所述噪声源位置的附近区域设置一拾取麦克风,通过所述拾取麦克风进行所述第一声音信号的记录拾取;此外,在进行所述自适应降噪处理前,还包括获取所述第一声音信号中的噪声统计量,并基于所述噪声统计量实施所述自适应降噪处理;其中,获取所述噪声统计量包括分析和提取所述第一声音信号对应的噪声成分,并对所述噪声成分进行频域分析处理,从而得到关于所述噪声成分的噪声统计量;进一步,在获取所述噪声统计量的同时,还包括对本文档来自技高网
...

【技术保护点】
1.一种提升语音识别稳健性的装置,所述装置用于降低源自目标设备自身机体的噪声并提高所述目标设备对外来语音识别的准确性,其特征在于,所述装置包括:第一声音获取单元,其用于拾取位于所述目标设备自身机体的噪声源位置处的第一声音信号;第二声音获取单元,其用于拾取位于所述目标设备自身机体中噪声能量最小区域处的第二声音信号;第一降噪单元,其能够基于自适应噪声消除算法,对所述第二声音信号进行自适应降噪处理以消除其中关于所述第一声音信号的噪声成分;第二降噪单元,其能够对所述第二声音信号经过自适应降噪处理后得到的阵列数据进行基于多通道降噪算法的处理,从而识别得到对应的语音信号。

【技术特征摘要】
1.一种提升语音识别稳健性的装置,所述装置用于降低源自目标设备自身机体的噪声并提高所述目标设备对外来语音识别的准确性,其特征在于,所述装置包括:第一声音获取单元,其用于拾取位于所述目标设备自身机体的噪声源位置处的第一声音信号;第二声音获取单元,其用于拾取位于所述目标设备自身机体中噪声能量最小区域处的第二声音信号;第一降噪单元,其能够基于自适应噪声消除算法,对所述第二声音信号进行自适应降噪处理以消除其中关于所述第一声音信号的噪声成分;第二降噪单元,其能够对所述第二声音信号经过自适应降噪处理后得到的阵列数据进行基于多通道降噪算法的处理,从而识别得到对应的语音信号。2.如权利要求1所述的提升语音识别稳健性的装置,其特征在于,所述装置还包括分贝仪和运算单元,所述分贝仪用于获取所述目标设备自身机体不同位置处的噪声信号,所述运算单元能够基于所述不同位置处的噪声信号和所述目标设备自身机体的物理结构,获得关于所述目标设备自身机体的噪声信号的区域分布信息,并确定所述目标设备自身机体的噪声源位置和噪声能量最小区域,其中,所述目标设备自身机体的物理结构包括所述目标设备自身机体的外壳形状和/或所述目标设备自身机体内部的有源电子器件的安装位置。3.如权利要求1所述的提升语音识别稳健性的装置,其特征在于,所述第一声音获取单元为拾取麦克风,其设置于靠近所述噪声源位置的附近区域,所述第一降噪单元在进行所述自适应降噪处理前,还获取所述第一声音信号中的噪声统计量,并基于所述噪声统计量实施所述自适应降噪处理;其中,获取所述噪声统计量包括分析和提取所述第一声音信号对应的噪声成分并对所述噪声成分进行频域分析处理,从而得到关于所述噪声成分的噪声统计量。4.如权利要求3述的提升语音识别稳健性的装置,其特征在于,所述第一降噪单元还连接有噪声检测单元和控制单元,所述噪声检测单元能够对所述第一声音信号进行噪声识别检测,所述控制单元能够根据所述噪声识别检测的结果,控制所述第一降噪单元是否实施所述噪声统计量的获取,具体为,若所述噪声检测单元检测到所述第一声音信号不存在噪声信号,则所述控制单元暂停从所述第一声音信号中获取所述噪声统计量,若所述噪声检测单元检测到所述第一声音信号存在噪声信号,则所述控制单元指示从所述第一声音信号中获取所述噪声统计量。5.如权利要求1所述的提升语音识别稳健性的装置,其特征在于,所述第二声音获取单元为麦克风阵列,所述麦克风阵列中的若干麦克风单元分布在所述噪声能量最小区域处,所述第二降噪单元实施所述基于多通道降噪算法的处理能够去除所述第二声音信...

【专利技术属性】
技术研发人员:关海欣
申请(专利权)人:北京云知声信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1