一种带方言识别的话音控制系统技术方案

技术编号:15642617 阅读:250 留言:0更新日期:2017-06-16 16:09
本文公开了带方言翻译的话音命令识别。用户话音输入可以使用方言翻译单元来翻译成标准话音模式。之后可以基于所述翻译的用户话音输入来产生控制命令。在某些实施例中,带方言翻译的所述话音命令识别系统可以被实现在驾驶设备中。在那些实施例中,用于控制所述驾驶设备的各种控制命令可以由用户利用方言输入来产生。用于所述驾驶设备的所述产生的话音控制命令可以包括:起动所述驾驶设备、打开/关闭A/C单元、控制所述A/C单元、打开/关闭娱乐系统、控制所述娱乐系统、打开/关闭某些安全特征、打开/关闭某些驾驶特征、调节座椅、调节方向盘、对周围环境拍摄照片和/或可以控制所述驾驶设备的各种功能的任何其他控制命令。

【技术实现步骤摘要】
一种带方言识别的话音控制系统相关申请的交叉引用本申请要求2015年12月30日提交的美国临时专利申请No.62/272,710的优先权,所述临时专利申请的全部公开内容出于所有目的以引用的方式并入本文。
本公开总体上涉及通过话音命令控制驾驶设备。
技术介绍
汽车上的常规语音识别系统方便驾驶员和/或乘客通过话音命令来控制各种车辆功能。典型地,一个或多个麦克风可以被设置在汽车的整个舱室中并且连接到语音处理器以使用声学和语言建模技术来处理用户话音命令。话音模式数据被典型地存储在车载语音识别系统中的存储器内,并且从所述存储器检索话音模式数据以用于识别用户话音命令。与常规车载语音识别系统相关联的一个问题是它在识别由带方言的用户提供的话音命令方面具有局限性。方言典型地是指单一语言的变体,它是讲该语言的人中的特定群体的特征。单一语言内的不同社群讲该相同语言的方式可能不同,这些方式将他们与其他社群区分开来。这些差异可以被认为是方言—不只是口音(字词发音的方式),更涉及语法、词汇、句法以及常用表达。在地区上或社会上与其他群体有某种程度隔离的群体通常会形成特征性方言。例如,在中国存在数千种方言,诸如广东话、上海话、四川话、福建话等等。说不同方言的用户对常规车载语音识别系统提出的挑战在于,常规车载语音识别系统仅将用户输入映射到标准话音模式。也就是说,常规车载语音识别系统不配置成用来区分方言差异并且要求用户通过标准语言模式来输入话音命令。在中文的情况下,常规车载语音识别系统典型地要求用户通过普通话来输入话音命令。如果用户通过他/她的方言输入话音命令,那么常规车载语音系统一般不会正确地作出响应。
技术实现思路
诸实施例可以方便驾驶设备的用户提供具有方言的话音输入。方言翻译层可以被实现用于将用户话音输入翻译为标准话音模式,并且基于所翻译的话音模式,控制命令可以被产生以控制驾驶设备的各种功能和/或操纵所述驾驶设备。与常规车载语音识别系统相比较,本公开使得用户能够使用方言来提供话音输入,并且因此向用户提供操作驾驶设备的方便性。本公开通过考虑驾驶设备的用户之间的方言差异来相对于常规车载语音识别系统提高命令识别准确性。在一些实施例中,驾驶设备所在的地点可以由用户选择。当从用户接收到话音输入时,可以加载对应于所选地点的方言翻译单元。所接收的用户话音输入可以通过方言翻译单元来处理。方言翻译单元可以被配置成识别对于与所述方言翻译单元相关联的方言而言特有的方言特征。在一些实施例中,在通过方言翻译单元处理之后,所翻译的用户输入可以进一步通过话音模式控制命令单元来处理。所述话音模式控制命令单元可以被配置成产生控制命令,以控制驾驶设备的各种功能,所述各种功能例如但不限于:起动驾驶设备、打开/关闭A/C单元、控制A/C单元(例如,调节温度和/或风性质)、打开/关闭娱乐系统、控制娱乐系统、打开/关闭某些安全特征、打开/关闭某些驾驶特征、调节座椅、调节方向盘、对周围环境拍摄照片和/或能够控制驾驶设备的各种功能的任何其他控制命令。在一些实施例中,话音控制命令单元可以被配置成产生控制命令以操纵驾驶设备。例如,可使得用户能够用他/她自己的方言提供话音输入以驾驶所述驾驶设备。例如,可使得用户能够指示驾驶设备转弯、加速、减速、停止、前进、停车和/或以任何其他方式操纵。在一些实例中,方便驾驶设备的用户用方言提供话音输入可以包括自动地确定用户所在的地点。例如,与用户相关联的方言可以基于驾驶设备所在的位置来确定。在一些实例中,方便驾驶设备的用户用方言提供话音输入可以包括识别用户的话音、鉴别所述用户并且自动地确定与所述用户相关联的方言。在一些实例中,方便驾驶设备的用户用方言提供话音输入可以包括在服务器处执行本文描述的各种方言翻译操作。在一些实例中,提供一种用于方便用户通过话音命令控制驾驶设备的方法,所述方法包括:由处理器接收用户话音输入;由所述处理器基于所述用户话音输入来确定输入话音模式;由所述处理器基于所述输入话音模式来确定所述用户话音输入相关联的语言方言;由所述处理器使用所述语言方言来将所述输入话音模式转换成标准话音模式;由所述处理器基于标准话音模式来确定对应于所述用户话音输入的控制命令以用于操纵所述驾驶设备;以及由所述处理器来实现所述控制命令的执行以控制所述驾驶设备。在一些实例中,所述用户话音输入包括指示所述驾驶设备的平移和/或转动操纵的信息。在一些实例中,所述用户话音输入包括指示所述驾驶设备内的部件的控制的信息。在一些实例中,所述方法还包括存储所述语言方言的预设特征,并且其中确定所述用户话音输入相关联的所述语言方言包括从所述话音模式提取方言特征,并且将所述提取的方言特征与所述语言方言的所述预设特征进行比较。在一些实例中,确定所述输入话音模式包括:检索表示通过所述方言提供的预定话音输入的一个或多个参考模式;获得所述参考模式的特征矢量;获得所述输入话音模式的特征矢量;针对所述参考模式的每个特征矢量,确定所述参考模式的所述特征矢量与所述输入话音模式的所述特征矢量之间的相似性;以及将与所述输入话音模式具有最高相似性的所述参考模式确定为匹配的参考模式。在一些实例中,所述方法包括基于所述接收的用户话音输入来自动地确定用户身份。在一些实例中,基于所述用户话音输入来确定所述输入话音模式包括将所述用户话音输入转换成表示矢量的一系列数字值,所述矢量指示所述输入话音模式的特征。在一些实例中,所述方法包括呈现用户界面,从而使得所述用户能够选择与所述用户相关联的语言。在一些实例中,所述方法还包括基于所述确定的语言方言将方言翻译单元自动地加载到存储器中,以处理所述用户话音输入。在一些实例中,提供一种用于方便用户通过话音命令控制驾驶设备的系统,所述系统包括一个或多个处理器,所述一个或多个处理器配置成执行下列动作:接收用户话音输入;基于所述用户话音输入来确定输入话音模式;基于所述输入话音模式,确定所述用户话音输入相关联的语言方言;由所述处理器使用所述语言方言来将所述输入话音模式转换成标准话音模式;由所述处理器基于标准话音模式来确定对应于所述用户话音输入的控制命令以用于操纵所述驾驶设备;以及由所述处理器来实现所述控制命令的执行以控制所述驾驶设备。在一些实例中,所述用户话音输入包括指示所述驾驶设备的平移和/或转动操纵的信息。在一些实例中,所述用户话音输入包括指示所述驾驶设备内的部件的控制的信息。在一些实例中,所述处理器进一步被配置成执行下列动作:存储所述语言方言的预设特征,并且其中确定所述用户话音输入相关联的所述语言方言包括从所述话音模式提取方言特征以及将所述提取的方言特征与所述语言方言的所述预设特征进行比较。在一些实例中,确定所述输入话音模式包括:检索一个或多个参考模式,所述参考模式表示通过所述方言提供的预定话音输入;获得所述参考模式的特征矢量;获得所述输入话音模式的特征矢量;针对所述参考模式的每个特征矢量,确定所述参考模式的所述特征矢量与所述输入话音模式的所述特征矢量之间的相似性;以及将与所述输入话音模式具有最高相似性的所述参考模式确定为匹配的参考模式。在一些实例中,所述处理器进一步被配置成自动地执行下列动作:基于所述接收的用户话音输入来确定用户身份。在一些实例中,基于所述用户话音输入来确本文档来自技高网
...
一种带方言识别的话音控制系统

【技术保护点】
一种用于方便用户通过话音命令控制驾驶设备的方法,所述方法包括:由处理器接收用户话音输入;由所述处理器基于所述用户话音输入来确定输入话音模式;由所述处理器基于所述输入话音模式来确定所述用户话音输入相关联的语言方言;由所述处理器使用所述语言方言来将所述输入话音模式转换成标准话音模式;由所述处理器基于标准话音模式来确定对应于所述用户话音输入的控制命令以用于操纵所述驾驶设备;以及由所述处理器来实现所述控制命令的执行以控制所述驾驶设备。

【技术特征摘要】
2015.12.30 US 62/272,710;2016.01.14 US 14/996,180;1.一种用于方便用户通过话音命令控制驾驶设备的方法,所述方法包括:由处理器接收用户话音输入;由所述处理器基于所述用户话音输入来确定输入话音模式;由所述处理器基于所述输入话音模式来确定所述用户话音输入相关联的语言方言;由所述处理器使用所述语言方言来将所述输入话音模式转换成标准话音模式;由所述处理器基于标准话音模式来确定对应于所述用户话音输入的控制命令以用于操纵所述驾驶设备;以及由所述处理器来实现所述控制命令的执行以控制所述驾驶设备。2.如权利要求1所述的方法,其中,所述用户话音输入包括指示所述驾驶设备的平移和/或转动操纵的信息。3.如权利要求1所述的方法,其中,所述用户话音输入包括指示所述驾驶设备内的部件的控制的信息。4.如权利要求1所述的方法,其还包括存储所述语言方言的预设特征,并且其中确定所述用户话音输入相关联的所述语言方言包括从所述话音模式提取方言特征,并且将所述提取的方言特征与所述语言方言的所述预设特征进行比较。5.如权利要求1所述的方法,其中,确定所述输入话音模式包括:检索表示通过所述方言提供的预定话音输入的一个或多个参考模式;获得所述参考模式的特征矢量;获得所述输入话音模式的特征矢量;针对所述参考模式的每个特征矢量,确定所述参考模式的所述特征矢量与所述输入话音模式的所述特征矢量之间的相似性;以及将与所述输入话音模式具有最高相似性的所述参考模式确定为匹配的参考模式。6.如权利要求1所述的方法,还包括基于所述接收的用户话音输入来自动地确定用户身份。7.如权利要求1所述的方法,其中,基于所述用户话音输入来确定所述输入话音模式包括将所述用户话音输入转换成表示矢量的一系列数字值,所述矢量指示所述输入话音模式的特征。8.如权利要求1所述的方法,还包括呈现用户界面,从而使得所述用户能够选择与所述用户相关联的语言。9.如权利要求1所述的方法,还包括基于所述确定的语言方言将方言翻译单元自动地加载到存储器中,以处理所述用户话音输入。10.一种用于方便用户通过话音命令控制驾驶设备的系统,所述系统包括一个或多个处理器,所述一个或多个处理器配置成执行下列动作...

【专利技术属性】
技术研发人员:陈泳璿
申请(专利权)人:昶洧新能源汽车发展有限公司
类型:发明
国别省市:中国香港,81

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1