【技术实现步骤摘要】
一种提升语音识别稳健性的装置及其方法
本专利技术涉及人机交互的
,特别涉及一种提升语音识别稳健性的装置及其方法。
技术介绍
随着人工智能技术和互联网技术的不断进步,具有人机交互功能的智能机器人已经出现在人类的生活和工作中,并且这类智能机器人本身具有运算处理能力强大,能快速地应对不同的突发情况和及时海量地处理各种不同类型的问题的特点,故其受到广泛的应用和青睐。这类智能机器人的人机交互功能包括语音识别或者手势动作识别等。其中,语音识别作为智能机器人发展最早和最快的技术,其能够满足人们与智能机器人之间进行自然方便对话交流的需求。人们通过对智能机器人发出相应的语音信息,智能机器人通过其语音识别功能就能够向对方进行合适的语音应答,可见语音识别在人机交互技术发展中占据非常重要的位置。通常来说,语音识别包括语音接收、语义解释和语音反馈这几个过程;其中语音接收过程中获得源语音的质量决定后续语音解释和语音反馈的准确定,一般而言,在相对安静的环境下源语音的质量较好,在相对嘈杂的环境下源语音的质量较差。但是,在智能机器人实际工作中,其工作环境是复杂多变的,同时该工作环境也不可能只存在智能机器人与对话人类方这两者,这导致在语音接收过程中会不可避免地受到背景噪声和其他非交互噪声的干扰。为了提高智能机器人的语音识别准确性,就必须对语音接收过程中获得的源语音在语义解释处理前进行降噪处理,以从中提取出有效的语音信息。在现有技术中,对源语音进行降噪处理只有在该源语音存在弱噪声的情况下才能有效地降低噪声信息并准确地提取出有用的语音信息,而对于该源语音存在强噪声的情况,若采用传统的降噪处 ...
【技术保护点】
1.一种提升语音识别稳健性的装置,所述装置用于降低源自目标设备自身机体的噪声并提高所述目标设备对外来语音识别的准确性,其特征在于,所述装置包括:第一声音获取单元,其用于拾取位于所述目标设备自身机体的噪声源位置处的第一声音信号;第二声音获取单元,其用于拾取位于所述目标设备自身机体中噪声能量最小区域处的第二声音信号;第一降噪单元,其能够基于自适应噪声消除算法,对所述第二声音信号进行自适应降噪处理以消除其中关于所述第一声音信号的噪声成分;第二降噪单元,其能够对所述第二声音信号经过自适应降噪处理后得到的阵列数据进行基于多通道降噪算法的处理,从而识别得到对应的语音信号。
【技术特征摘要】
1.一种提升语音识别稳健性的装置,所述装置用于降低源自目标设备自身机体的噪声并提高所述目标设备对外来语音识别的准确性,其特征在于,所述装置包括:第一声音获取单元,其用于拾取位于所述目标设备自身机体的噪声源位置处的第一声音信号;第二声音获取单元,其用于拾取位于所述目标设备自身机体中噪声能量最小区域处的第二声音信号;第一降噪单元,其能够基于自适应噪声消除算法,对所述第二声音信号进行自适应降噪处理以消除其中关于所述第一声音信号的噪声成分;第二降噪单元,其能够对所述第二声音信号经过自适应降噪处理后得到的阵列数据进行基于多通道降噪算法的处理,从而识别得到对应的语音信号。2.如权利要求1所述的提升语音识别稳健性的装置,其特征在于,所述装置还包括分贝仪和运算单元,所述分贝仪用于获取所述目标设备自身机体不同位置处的噪声信号,所述运算单元能够基于所述不同位置处的噪声信号和所述目标设备自身机体的物理结构,获得关于所述目标设备自身机体的噪声信号的区域分布信息,并确定所述目标设备自身机体的噪声源位置和噪声能量最小区域,其中,所述目标设备自身机体的物理结构包括所述目标设备自身机体的外壳形状和/或所述目标设备自身机体内部的有源电子器件的安装位置。3.如权利要求1所述的提升语音识别稳健性的装置,其特征在于,所述第一声音获取单元为拾取麦克风,其设置于靠近所述噪声源位置的附近区域,所述第一降噪单元在进行所述自适应降噪处理前,还获取所述第一声音信号中的噪声统计量,并基于所述噪声统计量实施所述自适应降噪处理;其中,获取所述噪声统计量包括分析和提取所述第一声音信号对应的噪声成分并对所述噪声成分进行频域分析处理,从而得到关于所述噪声成分的噪声统计量。4.如权利要求3述的提升语音识别稳健性的装置,其特征在于,所述第一降噪单元还连接有噪声检测单元和控制单元,所述噪声检测单元能够对所述第一声音信号进行噪声识别检测,所述控制单元能够根据所述噪声识别检测的结果,控制所述第一降噪单元是否实施所述噪声统计量的获取,具体为,若所述噪声检测单元检测到所述第一声音信号不存在噪声信号,则所述控制单元暂停从所述第一声音信号中获取所述噪声统计量,若所述噪声检测单元检测到所述第一声音信号存在噪声信号,则所述控制单元指示从所述第一声音信号中获取所述噪声统计量。5.如权利要求1所述的提升语音识别稳健性的装置,其特征在于,所述第二声音获取单元为麦克风阵列,所述麦克风阵列中的若干麦克风单元分布在所述噪声能量最小区域处,所述第二降噪单元实施所述基于多通道降噪算法的处理能够去除所述第二声音信...
【专利技术属性】
技术研发人员:关海欣,
申请(专利权)人:北京云知声信息技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。