语音识别仲裁逻辑制造技术

技术编号:22103339 阅读:31 留言:0更新日期:2019-09-14 03:49
一种使用多语音识别算法识别语音的方法和相关联系统。该方法包括在安装在车辆中的麦克风处接收语音,以及使用第一算法(例如,本地嵌入在车辆处)来确定语音的结果。也可以在车辆处接收使用(例如,由远程设施确定的)第二算法确定的语音的语音结果。两者的结果都可以包括确定的语音主题和确定的语音时隙值,以及每个的相应置信水平。该方法还可以包括:使用所确定的第一语音主题和所接收的第二语音主题中的至少一个来确定与所接收的语音相关联的主题,即使在第一语音主题的第一语音主题置信水平和第二语音主题的第二语音主题置信水平都是低置信水平时也是如此。

Speech Recognition Arbitration Logic

【技术实现步骤摘要】
语音识别仲裁逻辑
本公开涉及语音仲裁,并且更具体地,涉及实现组合来自不同语音识别引擎或算法的结果的语音仲裁过程。
技术介绍
传统上,使用多个语音算法或引擎需要在数值上使用归一化结果,例如,使用置信度分数。然而,语音识别置信度分数的归一化高度依赖于每种算法中采用的特定方法,并且因此可能无法准确地比较来自不同算法的语音识别置信度结果。另外,基于较低置信度分数反映识别语音中的问题的预期,或者否则无助于确定语音的内容,语音识别置信度分数的归一化可导致与相对较低的数值置信度分数相关联的结果被完全丢弃。因此,需要一种用于组合来自不同语音识别引擎或算法的语音识别结果的改进方法。
技术实现思路
根据本专利技术的一个方面,提供了一种使用第一和第二语音识别算法识别语音的方法。一种方法可以包括:在安装在车辆中的麦克风处接收语音,使用第一算法确定语音结果,包括第一语音主题和第一语音时隙值,确定第一语音主题的第一语音主题置信水平,以及确定第一语音时隙值的第一语音值置信水平。该方法还可以包括在车辆处接收利用与第一算法不同的第二算法确定的第二语音结果,包括第二语音主题和第二语音时隙值,接收第二语音主题的第二语音主题置信水平,以及接收第二语音时隙值的第二语音时隙值置信水平。该方法还可以包括:使用所确定的第一语音主题和所接收的第二语音主题中的至少一个来确定与所接收的语音相关联的主题,即使在第一语音主题的第一语音主题置信水平和第二语音主题的第二语音主题置信水平都是低置信水平时也是如此。在至少一些示例中,第一语音识别算法是使用嵌入在车辆中的电子设备中的自然语言理解启发法确定的局部语音识别算法。在其他示例中,第二语音识别算法是在车辆处从远程设施接收的远程语音识别算法。在一些示例方法中,该方法还包括:当第一语音主题与第二语音主题匹配时,请求用户确认与所接收的语音相关联的语音主题。在一些情况下,示例方法可以包括当用户确认第一语音主题时请求与第一语音主题相关联的用户输入。在其他示例中,当确定的第一语音主题不同于第二语音主题时,该方法可以包括请求用户对语音主题进行主题选择。在这些示例中,响应于用户主题选择,可以提供用户菜单选择,其包括与用户主题选择相关联的多个时隙值。在一些方法中,该方法可以包括:响应于用户主题选择,丢弃与用户主题选择不相关联的第一语音时隙值或第二语音时隙值中的至少一个。在至少一些示例中,一种方法可以包括仅确定包括高水平、中水平和低置信水平的本地语音主题置信水平级别和本地语音值置信级别,并且不确定本地语音主题置信水平和本地语音值置信水平的数值。在至少一些示例中,一种包含用于识别车辆中的语音的程序指令的非暂时性计算机可读介质,其中由安装到车辆的一个或多个处理器执行程序指令使得一个或多个处理器执行本文公开的方法。例如,计算机可读介质可以使得一个或多个处理器在安装到车辆的麦克风处接收语音,使用安装在车辆中的电子设备确定本地语音结果,包括本地语音主题和本地语音时隙值,以及确定本地语音主题的本地语音主题置信水平,并且确定本地语音时隙值的本地语音值置信水平。处理器还可以在车辆处接收远程语音结果,包括远程语音主题和远程语音时隙值,并且接收远程语音主题的远程语音主题置信水平,并且接收远程语音时隙值的远程语音时隙值置信水平。处理器还可以使用所确定的本地语音主题和所接收的远程语音主题中的至少一个来确定与所接收的语音相关联的主题,即使本地语音主题的本地语音主题置信水平和远程语音主题的远程语音主题置信水平都是低置信水平时也是如此。在至少一些示例中,由安装到车辆的一个或多个处理器执行程序指令使得一个或多个处理器实施以下步骤:当本地语音主题与远程语音主题匹配时,请求用户确认与所接收的语音相关联的语音主题。在这些示例中的至少一些示例中,由安装到车辆的一个或多个处理器执行程序指令使得一个或多个处理器实施以下步骤:当用户确认本地语音主题时,请求与本地语音主题相关联的用户输入。在其他示例方法中,由安装到车辆的一个或多个处理器执行程序指令使得一个或多个处理器实施以下步骤:当确定的本地语音主题与远程语音主题不同时请求用户对语音主题进行主题选择,并且响应于用户主题选择,提供包括与用户主题选择相关联的多个时隙值的用户菜单选择。附图说明在下文中将结合附图描述本专利技术的一个或多个实施例,其中相同的标号表示相同的元件,并且其中:图1是描绘能够利用本文公开的示例性方法的通信系统的实施例的框图;图2是描绘自动语音识别(ASR)系统的实施例的框图;图3是说明在语音识别算法之间进行仲裁的示例性方法的过程流程图;以及图4是示出根据一个示例说明的语音识别仲裁方法的表。具体实施方式下面提供用于例如在车辆中,在两个单独或不同的语音识别引擎或算法之间进行仲裁的方法和系统的示例性说明。语音识别引擎或算法通常可以解释语音输入,并确定语音输入的内容。仅作为示例,语音识别算法可以使用有限状态语法(FSG)、自然语言理解(NLU)或两者的组合。多个语音识别引擎或算法的使用允许结合远程语音识别算法在车辆中使用嵌入或本地语音识别算法。在一些示例中,第一语音识别算法是本地算法,例如,通过嵌入在车辆电子设备中,而第二语音识别算法通过远程服务器或设施提供。远程语音识别算法可以通过依赖于不受安装到车辆限制的远程系统而具有优于车辆中存在的处理能力。然而,远程语音识别可能具有缺点,例如需要向远程设施发送语音,这可能涉及无线载波系统用于从车辆向远程设施发送语音的使用费。每当车辆发送要由远程设施分析的语音时,车辆或远程信息处理服务提供商就会收取费用。该费用可以基于发送语音所需的时间长度,语音包括的数据量或两者。另一方面,从车辆接收语音的远程设施可以利用比车辆上可用的语言模型更复杂的语言模型来维持更强大的计算机处理能力。基于车辆的语音处理可能具有其自身的缺点。虽然识别车辆处接收到的语音可以最小化无线载波系统收取的费用,但是车辆的计算机处理能力可能不如远程设施处可用的那样强大,并且车辆可以使用更简单的语言模型,其可以包括比远程设施可用的内容更少的内容,这可能意味着不太准确的结果。因此,组合本地和远程算法可以允许混合每种方法的益处,同时减少缺点。在至少一些示例方法中,语音识别仲裁方法通过至少部分地基于置信水平选择结果之一来选择从不同语音识别引擎输出的结果。用于这些确定的置信水平与置信度分数形成对比,置信度分数在先前的方法中通常将例如从0到100的数值确定为结果置信度的指示。另一方面,如本文所使用的置信“水平”不依赖于数值或标准化值,而是有利于相对少量的类别,例如“低”、“中”和“高”。可以根据便于所采用的特定语音识别引擎/算法的任何度量来确定低/中/高置信水平。在一些示例中,可以在某些情况下使用具有相对低置信水平的语音识别结果。相反,在先前的方法中,具有低于某个基线或阈值的低置信度分数的语音识别结果通常将被完全丢弃。如此丢弃低置信度分数通常会导致语音识别会话在某些情况下被终止或重新开始,从而降低了用户成功完成语音识别会话的可能性。丢弃低置信度分数通常在预期较低置信度分数指示语音识别分析的不准确结果或其他问题的情况下进行。然而,在下面进一步描述的一些示例情况中,已经发现具有相对低置信水平的语音识别结果可能是有用的。此外,在这些示例中本文档来自技高网...

【技术保护点】
1.一种识别语音的方法,包括:(a)在安装于车辆的麦克风处接收语音;(b)使用安装在所述车辆上的电子设备,使用自然语言理解方法确定本地语音结果,包括本地语音主题和本地语音时隙值;(c)确定所述本地语音主题的本地语音主题置信水平,并且确定所述本地语音时隙值的本地语音值置信水平;(d)在所述车辆处接收远程语音结果,包括远程语音主题和远程语音时隙值;(e)接收所述远程语音主题的远程语音主题置信水平,并且接收所述远程语音时隙值的远程语音时隙值置信水平;以及(f)当所述步骤(b)中确定的所述本地语音主题的所述本地语音主题置信水平和所述步骤(d)中接收的所述远程语音主题的所述远程语音主题置信水平均为低置信水平时,使用所述确定的本地语音主题和所述接收的远程语音主题中的至少一个,以确定与所述接收的语音相关联的所述主题。

【技术特征摘要】
2018.03.06 US 15/9132241.一种识别语音的方法,包括:(a)在安装于车辆的麦克风处接收语音;(b)使用安装在所述车辆上的电子设备,使用自然语言理解方法确定本地语音结果,包括本地语音主题和本地语音时隙值;(c)确定所述本地语音主题的本地语音主题置信水平,并且确定所述本地语音时隙值的本地语音值置信水平;(d)在所述车辆处接收远程语音结果,包括远程语音主题和远程语音时隙值;(e)接收所述远程语音主题的远程语音主题置信水平,并且接收所述远程语音时隙值的远程语音时隙值置信水平;以及(f)当所述步骤(b)中确定的所述本地语音主题的所述本地语音主题置信水平和所述步骤(d)中接收的所述远程语音主题的所述远程语音主题置信水平均为低置信水平时,使用所述确定的本地语音主题和所述接收的远程语音主题中的至少一个,以确定与所述接收的语音相关联的所述主题。2.根据权利要求1所述的方法,还包括以下步骤:(g)当所述本地语音主题与所述远程语音主题匹配时,请求用户确认与所述接收的语音相关联的所述语音主题。3.根据权利要求2所述的方法,还包括以下步骤:(h)当所述用户确认所述本地语音主题时,请求与所述本地语音主题相关联的用户输入。4.根据权利要求1所述的方法,还包括以下步骤:(g)当所述确定的本地语音主题与所述远程语音主题不同时,请求用户对所述语音主题进行主题选择。5.根据权利要求4所述的方法,还包括以下步骤:(h)响应于所述用户主题选择,提供包括与所述用户主题选择相关联的多个时隙值的用户菜单选择。6.根据权利要求5所述的方法,还包括以下步骤:(i)响应于所述用户主题选择,丢弃所述本地语音时隙值或所述远程语音时隙值中的至少一个,所述本地语音时隙值或所述远程语音时隙值中的所述至少一个不与用户主题选择相关联。7.根据权利要求1所述的方法,还包括确定包括高水平、中水平和低置信水平的所述本地语音主题置信水平和所述本地语音值置信水平级别,并且不确定所述本地语音主题置信水平和所述本地语音值置信水平的数值。8.一种...

【专利技术属性】
技术研发人员:G·塔瓦尔X·F·赵S·M·彭诺克K·R·布克
申请(专利权)人:通用汽车环球科技运作有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1