对大范围波动的汉语方言语音识别处理方法及智能机器人技术

技术编号:15692532 阅读:61 留言:0更新日期:2017-06-24 06:38
本发明专利技术提供一种对大范围波动的汉语方言语音识别处理方法及智能机器人,所述汉语方言语音识别处理方法包括:步骤S1,对用户的音频信号进行语音识别,并返回语音识别后的识别结果至管理中心;步骤S2,在预先设置的目标关键字和语音识别后的识别结果之间建立映射表;步骤S3,实时识别用户的音频控制指令,将实时识别的音频控制指令结果通过映射表映射至通讯录。本发明专利技术能够很好地消除了由于汉语方言或用户口音而带来的无法准确识别语音的问题,提高了对于汉语方言的语音识别准确率和适应性,应用范围很广,不再局限于识别标准的普通话而是适用于各种汉语方言和用户口音,更是能够大大提高老年人这一特殊群体中的语音识别的适应性和识别率。

Speech recognition processing method for large scale fluctuation Chinese dialect and intelligent robot

The invention provides a wide range of Chinese dialect speech recognition processing method and intelligent robot, including the Chinese dialect speech recognition process: step S1, speech recognition, audio signal to the user, and returns the result to the recognition of speech recognition after management center; step S2, establish a mapping table between target keywords speech recognition and preset after the identification result; step S3, real-time identification of user audio control instruction, real-time identification of audio control instruction results through the mapping table is mapped to the mail list. The invention can be well eliminated due to the Chinese dialect or accent of the user can not accurately identify speech problems, improve the speech recognition accuracy and adaptability of Chinese dialects, the application scope is very broad, is no longer confined to the identification standard Mandarin but is applicable to various Chinese dialects and the user is able to greatly improve the accent. The adaptability and the recognition of this special group of elderly people in the rate.

【技术实现步骤摘要】
对大范围波动的汉语方言语音识别处理方法及智能机器人
本专利技术涉及一种语音识别处理方法,尤其涉及一种高识别率的对大范围波动的汉语方言语音识别处理方法,并涉及采用了该对大范围波动的汉语方言语音识别处理方法的智能机器人。
技术介绍
我国拥有56个民族,地域广人口多,虽然普通话作为国语,但是各个地方都有自己的方言和母语,并且同一个语种的发音也会由于地方口音等问题而有所不同,那么,对于,语音识别系统来说,如何准确识别和处理汉语方言或是带有口音的音频信号,就会面临非常大的困难,尤其是对于老年人来说,其汉语方言或是地方口音更为严重,那么,对于语音控制拨打电话等基于语音识别功能的一些应用就势必会面临很大的识别率困难,非常容易造成识别失败或是识别错误。
技术实现思路
本专利技术所要解决的技术问题是需要提供一种高识别率的对大范围波动的汉语方言语音识别处理方法,并需要提供采用了该对大范围波动的汉语方言语音识别处理方法的智能机器人。对此,本专利技术提供一种对大范围波动的汉语方言语音识别处理方法,包括:步骤S1,对用户的音频信号进行语音识别,并返回语音识别后的识别结果至管理中心;步骤S2,在预先设置的目标关键字和语音识别后的识别结果之间建立映射表;步骤S3,实时识别用户的音频控制指令,将实时识别的音频控制指令结果通过映射表映射至通讯录。本专利技术的进一步改进在于,所述步骤S2中,建立映射表用于存储所述语音识别后的识别结果,进而使得对同一用户语音识别后的所有的识别结果均指向所述目标关键字的地址。本专利技术的进一步改进在于,所述步骤S3包括以下子步骤:步骤S301,实时识别用户的音频控制指令,得到实时识别的音频控制指令结果后,判断音频控制指令结果是否为预先设置的目标关键字,若是,则直接调取所述目标关键字的地址;若否,则跳转至步骤S302;步骤S302,判断音频控制指令结果是否为映射表的识别结果中的任意一个,若是,则通过所述映射表的映射关系调取该识别结果对应的目标关键字的地址;若否,返回错误信号至管理中心。本专利技术的进一步改进在于,所述步骤S3中,得到实时识别的音频控制指令结果后,判断所述音频控制指令结果是否为所述目标关键字或识别结果中的任意一个,若是,则通过映射表调取目标关键字的地址;若否,则进入步骤S4实现自学习功能。本专利技术的进一步改进在于,所述步骤S4中,返回音频控制指令结果,并提示用户选择该音频控制指令结果的所需要指向的目标关键字,当用户选择该音频控制指令结果的所需要指向的目标关键字后,将所述音频控制指令结果添加至所述目标关键字的映射表中以实现自学习功能。本专利技术的进一步改进在于,所述步骤S1中,对同一用户的音频信号进行两次或两次以上的语音识别,并返回每一次语音识别后的识别结果至管理中心;所述步骤S2中,在预先设置的目标关键字和所述用户所有的识别结果之间建立映射表。本专利技术的进一步改进在于,所述步骤S1中,对同一个用户的音频信号进行语音识别时,当语音识别的次数在预设次数范围内均未返回新的识别结果时,则结束步骤S1并跳转至所述步骤S2。本专利技术的进一步改进在于,所述步骤S1中,实现语音识别后,返回次数由多至少顺序排序后的识别结果至管理中心;所述步骤S2中,根据排序的顺序,将排序后的识别结果依次与所述预先设置的目标关键字建立映射关系。本专利技术的进一步改进在于,所述步骤S3中,识别到音频控制指令结果后,若该音频控制指令结果指向同一用户的多个目标关键字的映射表,则通过排序后的识别结果作为优先级别实现映射;或,弹出指向同一用户的多个目标关键字以供用户选择。本专利技术还提供一种智能机器人,所述智能机器人采用了如上所述的对大范围波动的汉语方言语音识别处理方法。与现有技术相比,本专利技术的有益效果在于:先对用户的音频信号进行语音识别,并返回语音识别后的识别结果,然后在语音识别后的识别结果和预先设置的目标关键字之间建立映射表,这样子,不管由于其汉语方言或是用户口音而导致语音识别出来的识别结果是什么,只要预先将识别结果保存并与目标关键字相匹配形成映射表,就能够在实时识别用户的音频控制指令之后,通过映射表映射至通讯录,很好地消除了由于汉语方言或是用户口音而带来的无法准确识别语音的问题,对于语音控制拨打电话等基于语音识别功能的一些应用来说,汉语方言和用户口音也不再是语音识别的难题;因此,本专利技术提高了对于汉语方言的语音识别准确率和适应性,应用范围很广,不再局限于识别标准的普通话而是适用于各种汉语方言和用户口音,尤其是对于老年人来说,更是大大提高了这一特殊群体中的语音识别的适应性和识别率。附图说明图1是本专利技术一种实施例的工作流程示意图;图2是本专利技术一种实施例的工作原理示意图;图3是本专利技术一种实施例的人机界面示意图。具体实施方式下面结合附图,对本专利技术的较优的实施例作进一步的详细说明。如图1至图3所示,本例提供一种对大范围波动的汉语方言语音识别处理方法,包括:步骤S1,对用户的音频信号进行语音识别,并返回语音识别后的识别结果至管理中心;步骤S2,在预先设置的目标关键字和语音识别后的识别结果之间建立映射表;步骤S3,实时识别用户的音频控制指令,将实时识别的音频控制指令结果通过映射表映射至通讯录。本例所述管理中心可以是设置于智能机器人中的主控模块,也可以是远程管理中心,如远程服务器等;所述步骤S2中,建立映射表用于存储所述语音识别后的识别结果,进而使得对同一用户语音识别后的所有的识别结果均指向所述目标关键字的地址;也就是说,对同一用户语音识别后的所有的识别结果均与预先设置的目标关键字等效。所述步骤S3中,音频控制指令指的是用户在实际操作中为了实现某一功能的语音指令,而音频控制指令结果则是识别音频控制指令后提取的与映射表相对应的关键字,比如音频控制指令是拨打大儿子电话,那么,其识别音频控制指令结果提取与映射表相对应的关键字“大儿子”,并实现拨打通讯录中大儿子的联系号码,该步骤S3可以通过现有的声控拨打电话功能来实现。本例以通过对粤语的语音识别实现语音控制拨打电话为例,比如用户的目标关键字是“大儿子”,也就是说,通讯录里面的地址是大儿子的联系号码,正确的识别结果应该是“大仔”;但是由于语音识别平台、地方口音或是用户自己的发音等原因,对粤语里面“大儿子”的语音识别所返回的识别结果往往并不准确,经常会返回比如“带仔”、“大奖”、“大只”和“呆仔”等各种错误的识别结果,那么,在现有技术中,这种错误的识别结果是没有办法找到通讯录里面“大儿子”的地址的,也就没法实现语音控制拨打电话的功能。如图1和图2所示,本例通过先对用户的音频信号进行语音识别,比如对某一个用户的音频信号进行连续几次的语音识别,如果识别出来的结果共包括“大仔”、“带仔”、“大奖”、“大只”和“呆仔”这五种,那么,返回这几种语音识别后的识别结果,并将“大仔”、“带仔”、“大奖”、“大只”和“呆仔”这五种语音识别后的识别结果均和预先设置的目标关键字“大儿子”之间建立映射表,这样子,不管由于语音识别平台、地方口音或是用户个人口音而导致语音识别出来的识别结果是这五种结果中的哪一种,只要通过识别结果与目标关键字相匹配所形成映射表,就能够在实时识别该用户的音频控制指令(比如语音控制拨打“大儿子”电话)之后,通过映射表映射至通讯录里面的大儿子的地本文档来自技高网...
对大范围波动的汉语方言语音识别处理方法及智能机器人

【技术保护点】
一种对大范围波动的汉语方言语音识别处理方法,其特征在于,包括:步骤S1,对用户的音频信号进行语音识别,并返回语音识别后的识别结果至管理中心;步骤S2,在预先设置的目标关键字和语音识别后的识别结果之间建立映射表;步骤S3,实时识别用户的音频控制指令,将实时识别的音频控制指令结果通过映射表映射至通讯录。

【技术特征摘要】
1.一种对大范围波动的汉语方言语音识别处理方法,其特征在于,包括:步骤S1,对用户的音频信号进行语音识别,并返回语音识别后的识别结果至管理中心;步骤S2,在预先设置的目标关键字和语音识别后的识别结果之间建立映射表;步骤S3,实时识别用户的音频控制指令,将实时识别的音频控制指令结果通过映射表映射至通讯录。2.根据权利要求1所述的对大范围波动的汉语方言语音识别处理方法,其特征在于,所述步骤S2中,建立映射表用于存储所述语音识别后的识别结果,进而使得对同一用户语音识别后的所有的识别结果均指向所述目标关键字的地址。3.根据权利要求1所述的对大范围波动的汉语方言语音识别处理方法,其特征在于,所述步骤S3包括以下子步骤:步骤S301,实时识别用户的音频控制指令,得到实时识别的音频控制指令结果后,判断音频控制指令结果是否为预先设置的目标关键字,若是,则直接调取所述目标关键字的地址;若否,则跳转至步骤S302;步骤S302,判断音频控制指令结果是否为映射表的识别结果中的任意一个,若是,则通过所述映射表的映射关系调取该识别结果对应的目标关键字的地址;若否,返回错误信号至管理中心。4.根据权利要求1所述的对大范围波动的汉语方言语音识别处理方法,其特征在于,所述步骤S3中,得到实时识别的音频控制指令结果后,判断所述音频控制指令结果是否为所述目标关键字或识别结果中的任意一个,若是,则通过映射表调取目标关键字的地址;若否,则进入步骤S4实现自学习功能。5.根据权利要求4所述的对大范围波动的汉语方言语音识别处理方法,其特征在于,所述步骤S4中,返回...

【专利技术属性】
技术研发人员:陈修志
申请(专利权)人:佛山市父母通智能机器人有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1