根本原因分析以及校正系统和方法技术方案

技术编号:16271411 阅读:27 留言:0更新日期:2017-09-22 22:59
提供了用于校正语音识别系统中的错误的方法和系统。在一个实施例中,方法包括:通过处理器接收由第一语言模型从第一语音话语识别到的第一命令;通过处理器接收由第二语言模型从第一语音话语识别到的第二命令;通过处理器确定第一命令与第二命令之间的相似点和相异点中的至少一个;在相似点和相异点的基础上通过处理器利用错误模型中的至少一个规则来处理第一命令和第二命令,以确定根本原因;以及基于根本原因选择性地执行校正流程。

Root cause analysis and correction system and method

A method and system for correcting errors in a speech recognition system are provided. Including the method in one embodiment, receiving from the first language model from the first speech to speech recognition of the first command through the processor; through the processor is received by the second language model from the first to the second voice speech recognition commands; through the processor between the first and second command command to determine the similarities and dissimilarities in at least one; based on the similarities and differences on the processor using at least one of the rules of error model to deal with the first order and second order to determine root cause; and based on the fundamental reason to selectively perform calibration process.

【技术实现步骤摘要】
根本原因分析以及校正系统和方法

总体上涉及语音系统,且更具体地涉及用于检测语音识别错误的根本原因并基于根本原因校正错误的方法和系统。
技术介绍
语音系统对用户发出的语音进行语音识别。例如,车辆语音系统对车辆乘员发出的语音进行语音识别。语音话语通常包括控制车辆的一个或多个特征或其他可由车辆语音系统进行访问的系统的命令。在某些情况下,语音识别可能会发生错误。语音识别错误是有问题的,并可能会导致用户停止使用系统。例如,用户可能不会理解为什么会发生错误,并且/或者可能不会懂得如何解决错误,因此就干脆停止使用语音系统。因此,期望的是提供用于识别语音识别错误的根本原因的方法和系统。进一步期望的是提供用于基于所识别的根本原因校正错误的方法和系统。此外,从以下结合附图以及上述

技术介绍
进行的详细描述和所附权利要求书中,将很容易了解到本专利技术的其他期望特征和特性。
技术实现思路
提供了用于校正语音识别系统中的错误的方法和系统。在一个实施例中,方法包括:通过处理器接收由第一语言模型从第一语音话语识别到的第一命令;通过处理器接收由第二语言模型从第一语音话语识别到的第二命令;通过处理器确定第一命令与第二命令之间的相似点和相异点中的至少一个;在相似点和相异点的基础上通过处理器利用错误模型中的至少一个规则来处理第一命令和第二命令,以确定根本原因;以及基于根本原因选择性地执行校正流程。在另一示例中,系统包括第一非瞬变模块,其中该第一非瞬变模块通过处理器从第一语言模型接收从第一语音话语识别到的第一命令以及从第二语言模型接收从第一语音话语识别到的第二命令,并确定第一命令与第二命令之间的相似点和相异点中的至少一个。系统进一步包括第二非瞬变模块,其中该第二非瞬变模块在相似点和相异点的基础上通过处理器利用错误模型中的至少一个规则来处理第一命令和第二命令,以确定根本原因;系统还包括第三非瞬变模块,其中该第三非瞬变模块在根本原因的基础上通过处理器选择性地执行校正流程。附图说明下面将结合以下附图对示例性实施例进行描述,其中相同的附图标记表示相同的元件,且其中:图1是示出了根据各种示例性实施例的包括语音系统的车辆的功能框图;图2是示出了根据各种示例性实施例的语音系统的错误检测和校正模块的数据流图;以及图3是示出了根据各种示例性实施例的可由语音系统执行的错误检测和校正方法的序列图。具体实施方式以下详细描述本质上仅仅是示例性的,其并非旨在限制应用和用途。此外,不存在被前述的

技术介绍

技术实现思路
或下面的详细描述中提出的任何明确或暗示的理论约束的意图。本文所用术语“模块”指的是专用集成电路(ASIC)、电子电路、处理器(共享、专用或群组)、执行一个或多个软件或固件程序的存储器、组合逻辑电路和/或其他合适的提供所述功能的部件。首先参照图1,根据本公开的示例性实施例,语音系统10被示出为包括在车辆12内。语音系统10通过人机接口(HMI)模块14为一个或多个车辆系统13提供语音识别和对话。例如,此类车辆系统13可包括但不限于:电话系统16、导航系统18、媒体系统20、远程信息处理系统22、网络系统24或任何可包括基于语音的应用程序的其他车辆系统或非车辆系统26。如可理解的,本公开的语音系统10的一个或多个实施例可适用于除了车辆以外的系统(例如,手表、机器人、便携式电子设备等),因此,其并不限于本车辆示例。出于示例性目的,语音系统10将在车辆示例的上下文中进行讨论。在各种实施例中,语音系统10通过HMI模块14和通信总线和/或其他通信装置28(例如,有线、短程无线或远程无线通信装置)与多个车辆系统16-24和/或其他车辆和非车辆系统26进行通信。例如,通信总线可为,但不限于:CAN总线。一般而言,语音系统10包括自动语音识别(ASR)模块32、对话管理器模块34以及错误检测和校正模块36。如可理解的,ASR模块32和对话管理器模块34可作为独立的系统和/或组合系统来进行实施。如可进一步理解的,语音系统10的模块可全部在车辆12上进行实施,或该模块的一部分在车辆12上实施,而另一部分在远程系统(例如,远程服务器(未示出))上进行实施。在各种实施例中,ASR模块32接收并处理来自HMI模块14的语音话语。ASR模块32从语音话语生成识别命令。根据本公开,ASR模块32利用至少两个不同的语言模型38、40来处理语音话语。ASR模块32从两个不同的语言模型38、40中的每一个生成识别命令。所使用的每一个模型在以下项中的至少一个中提供优势:所支持的短语数量、短语深度、处理的时延、识别的准确度以及处理时间。所选择的模型的组合在上文列出的项中的至少两个中提供优势。例如,在各种实施例中,第一语言模型38可为包括固定的可识别命令列表的固定模型,其被称为固定列表模型。固定列表模型在时延、准确度以及处理时间的改进方面提供优势,并可被认为是更理想的模型。这种模型可包括但不限于:有限状态文法(FSG)。在另一示例中,第二语言模型40可具有较广泛的短语识别范围,其被称为宽范围模型。宽范围模型识别较宽范围的命令,然而,其时延较高,且准确度下降。这种模型可包括但不限于:统计语言模型(SLM)。如可理解的,ASR模块32所实施的模型可为任何语言模型,且其并不限于本专利技术示例。对话管理器模块34通常接收ASR模块32的结果,并管理通过HMI模块14传回给用户的交互序列和提示。在某些情况下,错误可能会在命令的识别过程中发生。错误检测和校正模块36接收来自ASR模块32的两个或多个识别命令,并针对错误处理这些识别命令。例如,若该两个识别命令基本上不相同,则错误检测和校正模块36通过错误模型对这些识别命令进行处理,以识别根本原因。在各种实施例中,错误模型包括用于识别两个命令之间的错误的规则以及与这些规则相关联的根本原因。例如,示例性语音话语可包括:“在移动电话上呼叫Dorian”。如果无法找到列出Dorian的通讯录,则第一语言模型38可能会生成识别命令:“呼叫311”。同样地,第二语言模型40可能会生成识别命令:“呼叫电话和在移动电话上”。错误检测和校正模块36通过错误模型处理这两个识别命令。错误模型识别命令的相似点和/或相异点,并基于该相似点和/或相异点选择一个或多个特定规则。例如,就上述示例而言,错误模型将“呼叫”指令识别为相似点。错误模型选择与“呼叫”相似点相关联的规则,并通过该规则处理两个识别命令。示例性“呼叫”规则可包括:若第一识别命令由FSG语言模型生成并包括数字,且第二识别命令由SLM语言模型生成并包括随机对象,则根本原因是“没有通讯录”。如可理解的,该规则仅仅是一个示例,因为错误模型可包括限定用于任何数量的相似点和相异点的任何数量的规则。在各种实施例中,规则在相似点和/或相异点的基础上进行限定,其中该相似点和/或相异点通常由两个已知的语言模型生成。根本原因一旦被识别出,错误检测和校正模块36就会尝试在没有用户参与的情况下和/或在用户参与的情况下校正错误。例如,错误检测和校正模块36可生成信号并将其传递至车辆系统13中的一个或多个,以在不需要用户参与的情况下进行校正。就上述示例而言,若根本原因是“没有通讯录”,则错误检测和校正模块36可生成控制信号并将其传递本文档来自技高网
...
根本原因分析以及校正系统和方法

【技术保护点】
一种校正语音识别系统中的错误的方法,其包括:通过处理器接收由第一语言模型从第一语音话语识别到的第一命令;通过所述处理器接收由第二语言模型从所述第一语音话语识别到的第二命令;通过所述处理器确定所述第一命令与所述第二命令之间的相似点和相异点中的至少一个;在所述相似点和所述相异点的基础上通过所述处理器利用错误模型中的至少一个规则来处理所述第一命令和所述第二命令,以确定根本原因;以及基于所述根本原因选择性地执行校正流程。

【技术特征摘要】
2016.03.15 US 15/0709701.一种校正语音识别系统中的错误的方法,其包括:通过处理器接收由第一语言模型从第一语音话语识别到的第一命令;通过所述处理器接收由第二语言模型从所述第一语音话语识别到的第二命令;通过所述处理器确定所述第一命令与所述第二命令之间的相似点和相异点中的至少一个;在所述相似点和所述相异点的基础上通过所述处理器利用错误模型中的至少一个规则来处理所述第一命令和所述第二命令,以确定根本原因;以及基于所述根本原因选择性地执行校正流程。2.根据权利要求1所述的方法,其中所述校正流程包括生成控制信号并将其传递至一个或多个车辆系统,以自动校正所述根本原因。3.根据权利要求1所述的方法,其中所述校正流程包括生成提示数据和交互序列数据中的至少一个,以校正所述根本原因。4.根据权利要求1所述的方法,其进一步包括:通过所述第一语言模型和解码器处理所述第一语音话语;以及通过所述第二语言模型和所述解码器或另一解码器处理所述第一语音话语,其中所述解码器或所述另一解码器包括在远程服务器中或处于离线状态中。5.根据权利要求4所述的方法,其...

【专利技术属性】
技术研发人员:R·M·赫克特Y·S·弗里德兰A·泰尔帕斯E·蒂泽凯尔汉考克
申请(专利权)人:通用汽车环球科技运作有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1