【技术实现步骤摘要】
远场语音指令识别方法及装置
本专利技术属于远场语音识别
,具体涉及一种远场语音指令识别方法及装置。
技术介绍
语音技术作为当前比较热门的人机交互方式,近年来被广泛运用于智能领域的各个方面。随着技术的不断发展,语音控制技术也不断进步。较以往的控制而言,由于语音控制能够免去操作者的手动控制,较为便捷,这样就使语音控制技术的使用愈发广泛。其中,由于语音控制的前提是需要语音识别技术作为基础的,由此,语音识别技术的发展,也逐步受领域内人士所重视。基于语音发出位置与语音接收设备之间的距离的不同,通常语音识别技术分为远场语音识别和近场语音识别两种,由于远场语音识别能够实现较远距离的语音指令的识别,这就使得远场语音识别技术更为技术专家的重视。目前,当用户进行远场语音控制时,由于现有远场语音识别方法唤醒词和控制指令相对固定,变化较少,错误率较高,特别在语音指令控制场景错误率更高,用户体验较差。因此,如何实现一种能够准确纠正语音控制指令的语音识别纠正方法和装置,成为本领域内亟待解决的问题。
技术实现思路
本专利技术的目的在于提供一种语音识别纠正方法及装置,以解决远场语音控制指令识别 ...
【技术保护点】
1.一种远场语音指令识别方法,其特征在于,包括:步骤一:获取待识别的远场语音指令信号;步骤二:基于语音识别引擎对所述语音指令信号进行解码,得到解码结果;步骤三:基于汉语拼音和上下文模型对步骤二的解码结果进行指令匹配,得到最终识别结果。
【技术特征摘要】
1.一种远场语音指令识别方法,其特征在于,包括:步骤一:获取待识别的远场语音指令信号;步骤二:基于语音识别引擎对所述语音指令信号进行解码,得到解码结果;步骤三:基于汉语拼音和上下文模型对步骤二的解码结果进行指令匹配,得到最终识别结果。2.根据权利要求1所述的远场语音指令识别方法,其特征在于,所述步骤三包括:将步骤二的解码结果转换为汉语拼音;将目标指令集中的所有目标指令转换为汉语拼音,得到汉语拼音库;将所述解码结果的汉语拼音在所述汉语拼音库中进行第一级匹配,若匹配成功,则直接返回匹配结果,并结束匹配过程。3.根据权利要求2所述的远场语音指令识别方法,其特征在于,所述步骤三还包括:若第一级批配没有匹配成功,则将所述解码结果的汉语拼音转换为模糊拼音,将所述汉语拼音库转换为模糊拼音库,并进行第二级匹配;若第二级匹配成功,则直接返回匹配结果,并结束匹配过程;若第二级批配没有成功,则将所述解码结果参照目标指令集中的汉字字数进行切分,按字数为滑块逐字切分后进行第三级匹配。4.根据权利要求3所述的远场语音指令识别方法,其特征在于,所述第三级匹配包括:将切分结果转换为模糊拼音,并将每个模糊拼音与所述模糊拼音库进行相似度匹配,每次匹配得到一个得分C,得分最高的匹配所对应的目标指令即为识别结果。5.根据权利要求4所述的远场语音指令识别方法,其特征在于,所述第三级匹配还包括:若所述识别结果的得分大于阈值H,则直接返回该结果,并结束后续匹配;若所述识别结果的得分小于阈值H,则将所述识别结果与上一个进行相似度匹配的模糊语音组成上下文,与所述模糊拼音库进行相似度匹配,若所述识别结果的得分大于阈值H,则直接返回该结果,并结束后续匹配。6.一种远场语音指...
【专利技术属性】
技术研发人员:邱建,王兴,佟彤,
申请(专利权)人:北京奥特维科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。