用于车辆的基于声学和域的语音识别制造技术

技术编号:15940610 阅读:66 留言:0更新日期:2017-08-04 22:36
本发明专利技术公开一种用于车辆的基于声学和域的语音识别。车辆语音识别系统的处理器经由特定域语言模型和声学模型来识别语音。所述处理器还响应于所述声学模型具有的针对识别的语音的置信度落入相对于所述特定域语言模型的置信度而定义的预定范围内,仅经由所述声学模型来识别语音。

Acoustic and domain based speech recognition for vehicles

An acoustic and domain based speech recognition for a vehicle is disclosed. The processor of the vehicle speech recognition system recognizes speech through a domain specific language model and an acoustic model. The processor is responsive to the acoustic model for speech recognition has the confidence to fall relative to the specific domain language model and the definition of confidence within a predetermined range, only through the acoustic model to speech recognition.

【技术实现步骤摘要】
用于车辆的基于声学和域的语音识别
本公开涉及用于语音识别的基于声学和域的方法。
技术介绍
语音识别系统可以将可听见的声音解释成从车辆乘客发起的命令、指令或信息。当环境噪声覆盖掉语音时,可能难以辨别语音。车辆状态信息可用于改善语音的识别。然而,在特定情况下车辆状态信息可能妨碍准确的语音识别。
技术实现思路
一种用于车辆的语音识别系统包括:处理器,被配置为经由特定域语言模型和声学模型识别语音,并被配置为:响应于所述声学模型具有的针对识别的语音的置信度落入相对于所述特定域语言模型的置信度而定义的预定范围内,仅经由所述声学模型识别语音。一种语音识别系统包括:处理器,被配置为具有特定域语言模型和声学模型,并被配置为:响应于接收到包含语音的信号,使用被馈入车辆状态输入的机器学习算法产生特定域置信度,并基于特定域置信度与声学模型置信度的合成而选择与特定域语言模型和声学模型的潜在结果关联的多个语音识别路径中的一个。根据本专利技术的一个实施例,被馈入车辆状态输入的机器学习算法是人工神经网络。根据本专利技术的一个实施例,用于被馈入车辆状态输入的机器学习算法的车辆状态输入包括天气状况或交通状况。根据本专利技术的一个实施例,用于被馈入车辆状态输入的机器学习算法的车辆状态输入包括在车辆接近度内的移动装置。根据本专利技术的一个实施例,用于被馈入车辆状态输入的机器学习算法的车辆状态输入包括会话历史。根据本专利技术的一个实施例,处理器还被配置为具有解码器算法以确定声学模型置信度。一种语音识别方法包括:通过处理器,执行根据从多个识别假设中选择的识别假设而从包含语音的信号中识别的车辆命令,其中,每个识别假设是基于包括多个特定域语言模型置信度中的一个和多个声学模型置信度中的一个的共同的语音域对的乘积的,所述多个特定域语言模型置信度是根据将机器学习算法应用于车辆状态输入而被推导出的。根据本专利技术的一个实施例,机器学习算法是人工神经网络。根据本专利技术的一个实施例,人工神经网络具有与车辆命令相关的输出。根据本专利技术的一个实施例,所述方法还包括:基于所述多个声学模型置信度中的所述一个落入相对于所述多个特定域语言模型置信度中的所述一个而定义的预定范围内,在产生所述乘积之前按比例减小所述多个特定域语言模型置信度中的所述一个。根据本专利技术的一个实施例,所述车辆状态输入包括天气或交通。根据本专利技术的一个实施例,所述车辆状态输入包括在车辆接近度内的移动装置。根据本专利技术的一个实施例,所述车辆状态输入包括会话历史。附图说明图1是描绘具有自动语音识别系统的车辆的示例的示意图;图2是描绘自动语音识别系统的示例的示意图;图3是自动语音识别系统的流程图;图4是具有一种以上的声学模型假设的自动语音识别系统的流程图;图5是具有针对声学模型和特定域语言模型的置信度(confidencescore)的示例值的示图;图6是用于确定特定域语言模型的置信度的机器学习算法。具体实施方式在此描述了本公开的实施例。然而,应该理解的是,所公开的实施例仅仅是示例,并且其它实施例可采用各种替代形式。附图不必按比例绘制;可夸大或最小化一些特征以示出特定组件的细节。因此,在此公开的具体结构和功能细节不应被解释为具有限制性,而仅仅作为用于教导本领域技术人员以多种方式利用本专利技术的代表性基础。本领域普通技术人员将理解的是,参照任一附图示出并描述的各种特征可与在一个或更多个其它附图中示出的特征相结合,以产生未被明确示出或描述的实施例。示出的特征的组合提供用于典型应用的代表性实施例。然而,针对特定应用或实施方式,可期望与本公开的教导一致的特征的各种组合和修改。自动或手动的语音识别已经成为现代车辆中的重要的附件功能。语音识别可在车辆和乘客之间提供免提输入和交互。各种类型的车辆可利用语音识别。例如,飞行器、水运工具、航天器或陆基车辆可受益于识别来自乘客的语音指令。这些车辆可包括可使用人机界面访问或调用的多个功能。人机界面可包括自动语音识别系统,自动语音识别系统将人类语音解码或翻译成车辆或辅助系统能够理解的指令。来自车辆系统或环境的环境噪声可降低利用声学模型的自动语音识别系统的准确度。一个麦克风或多个麦克风可用于将来自乘客的声音转换成电信号。麦克风可位于乘客的移动装置中或者遍布于车辆中。麦克风可将接收到的声音信号转换成数字语音数据,并在通信总线上发送该数据,或者移动装置可将数字语音数据发送给车辆的通信总线。移动装置可经由有线连接或无线连接(例如,蓝牙、Wi-Fi、ZigBee、以太网等)连接到车辆数据总线。语音识别服务器、处理器、控制器或系统可位于本地、位于车辆中或者位于远处的数据中心。本地语音识别服务器可连接到通信总线以接收数字语音数据。对于远程的服务器,车辆远程信息处理单元可用作车辆与语音识别服务器之间的接口。语音识别系统可将从车辆附近或内部的乘客接收的语音发送到本地识别服务器或远程识别服务器。然后服务器可将识别后的语音发送回车辆。服务器可被配置为向任意数量的客户端发送数据和接收来自任意数量的客户端的数据。服务器可连接到作为服务器数据的存储库的数据集市(DataMart)、数据存储区或数据仓库。任意数量的客户端都可将信息输入到数据存储区中,以便提供增强且准确的语音识别。语音识别处理可位于经由互联网可访问的服务器上或位于车辆自身内。语音识别系统可被配置为将识别的语音自动转换成可读文本或机器代码。现代的语音识别系统可使用多个识别模型的组合来识别语音。一种类型的模型可源于具有可识别的词语或短语的列表的词库。另一种类型的模型可源于对包含在音频信号中的声学性质的统计分析。这些语音识别系统可被实现在车辆中以通过使用本领域已知的解码器算法来识别乘客指令或通信。车辆可使用语音识别来向乘客确定期望的车辆行为。例如,语音识别可指示车辆使车辆车厢冷却下来或者呼叫亲近的朋友。语音识别可在不需要用户输入的情况下提供期望目的地的指示或关于期望路线的指令。车辆可包括能够汇集相关状态输入以改善语音识别的特定域语言模型。自动语音识别系统可使用先前学习的统计模型或实时学习的统计模型来预测更准确地确定乘客的语音的特定域语音识别模型。对相关状态输入的统计分析可使得自动语音识别系统能够缩小声学模型的搜索范围或词库模型的搜索范围。状态输入可包括发动机状态信息、加热、通风或冷却的状态、车辆运动状态、外部或内部的指示符状态、车窗雨刷器状态、环境状况信息、车窗位置或车门位置、车厢声音、座椅位置或由车辆计算机接收的其它车辆信息。状态输入还可包括信息娱乐系统状态、会话历史、天气、位置、交通、便携式装置或可用于改善语音识别的任何其它信息。状态输入可包括在车辆接附近的漫游装置或移动装置。这些状态输入可与车辆命令或车辆系统相关。可通过由车辆的处理器或控制器或者远程服务器执行的多个统计处理、机器学习算法(MLA)或人工神经网络(ANN)来获得特定域的置信度。例如,控制器可将指示特定域的相关状态输入的数量相加,并将得到的和除以可用状态输入的总数以返回特定域的置信度。作为统计处理的另一示例,控制器可对被确定为对缩小预期的特定域模型特别有用的特定的相关状态输入进行加权。可被加权的相关状态输入可以是车辆速度。由于处于交通堵塞中的人可能对寻找方向感兴趣,因此,与低的车辆速度相关的状态输入可被赋予比其本文档来自技高网...
用于车辆的基于声学和域的语音识别

【技术保护点】
一种用于车辆的语音识别系统,包括:处理器,被配置为经由特定域语言模型和声学模型来识别语音,并被配置为:响应于所述声学模型具有的针对识别的语音的置信度落入相对于所述特定域语言模型的置信度而定义的预定范围内,仅经由所述声学模型来识别语音。

【技术特征摘要】
2016.01.25 US 15/005,6541.一种用于车辆的语音识别系统,包括:处理器,被配置为经由特定域语言模型和声学模型来识别语音,并被配置为:响应于所述声学模型具有的针对识别的语音的置信度落入相对于所述特定域语言模型的置信度而定义的预定范围内,仅经由所述声学模型来识别语音。2.如权利要求1所述的语音识别系统,其中,处理器还被配置为:汇集车辆状态输入以确定所述特定域语言模型的置信度。3.如权利要求2所述的语音识别系统,其中,车辆状态输入包括天气或交通。4.如权利要求2所述的语音识别系统,其中,车辆状态输入包括在车辆接近度内的移动装置。5.如权利要求2所述的语音识别系统,其中,车辆状态输入包括会话历史。6.如权利要求1所述的语音识别系统,其中,处理器还被配置为具有解码器算法以确定声学模型置信度。7.一种语音识别系统,包括:处理器,被配置为具有特定域语言模型和声学...

【专利技术属性】
技术研发人员:季安斯科特·安德鲁·安曼布丽奇特·弗朗西丝·莫拉·理查森约翰·爱德华·胡伯弗朗索斯·沙雷特兰杰尼·兰加拉詹金塔拉斯·文森特·普斯科瑞斯阿里·哈萨尼
申请(专利权)人:福特全球技术公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1