使用助理系统的基于自然语言理解的元语音系统提高语音识别精度技术方案

技术编号：33721017 阅读：18 留言：0更新日期：2022-06-08 21:13

在一个实施例中，一种方法包括从与第一用户相关联的客户端系统接收第一音频输入。该方法包括基于多个自动语音识别(ASR)引擎生成对应于第一音频输入的多个转录。每个ASR引擎与多个域中的相应域相关联。该方法包括为每个转录确定与转录相关联的一个或更多个意图和一个或更多个槽的组合。该方法包括由元语音引擎从多个组合中选择与第一用户输入相关联的意图和槽的一个或更多个组合。该方法包括基于所选组合生成对第一音频输入的响应，并且向客户端系统发送用于呈现对第一音频输入的响应的指令。指令。[转续页]

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用助理系统的基于自然语言理解的元语音系统提高语音识别精度

[0001]本专利技术总体上涉及在网络环境内的数据库和文件管理，且具体涉及用于智能助理(smart assistant)系统的硬件和软件。
[0002]背景
[0003]助理系统可以基于用户输入、位置感知和从各种在线源访问信息(如天气状况、交通拥堵、新闻、股票价格、用户日程、零售价格等)的能力的组合来为用户提供信息或服务。用户输入可以包括文本(例如，在线聊天)(尤其是在即时消息传递应用或其他应用中的文本)，声音(voice)、图像、运动(motion)或它们的组合。助理系统可以基于用户输入来执行礼宾类型的服务(例如，预订晚餐、购买活动门票、安排旅行)或者提供信息。助理系统还可以基于在线信息和事件来执行管理或数据处理任务，而无需用户启动或交互。可以由助理系统执行的那些任务的示例可以包括日程管理(例如，对晚餐约会发送用户由于交通状况而要迟到的告警信息，更新双方的日程，以及改变餐馆预订时间)。助理系统可以通过计算设备、应用编程接口(API)、以及用户设备上应用激增(proliferation)的组合来实现。
[0004]可以包括社交网络网站的社交网络系统可以使它的用户(例如个人或组织)能够与它互动以及通过它彼此互动。社交网络系统可以利用来自用户的输入来在社交网络系统中创建并存储与用户相关联的用户简档(user profile)。用户简档可以包括用户的人口统计信息、通信渠道信息以及关于个人兴趣的信息。社交网络系统还可以用来自用户的输入来创建并存储用户与社交网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法，包括由一个或更多个计算系统：从与第一用户相关联的客户端系统接收第一音频输入；基于多个自动语音识别(ASR)引擎生成对应于所述第一音频输入的多个转录，其中每个ASR引擎与多个域中的相应域相关联；为每个转录确定与所述转录相关联的一个或更多个意图和一个或更多个槽的组合；由元语音引擎从所述多个组合中选择与所述第一音频输入相关联的意图和槽的一个或更多个组合；基于所选组合生成对所述第一音频输入的响应；和向所述客户端系统发送用于呈现对所述第一音频输入的响应的指令。2.根据权利要求1所述的方法，其中每个ASR引擎与特定于相应ASR引擎的多个代理中的一个或更多个代理相关联。3.根据权利要求1或权利要求2所述的方法，其中所述多个域中的每个域包括特定于所述相应域的一个或更多个代理；可选地，其中所述代理包括第一方代理或第三方代理中的一个或更多个。4.根据任一前述权利要求所述的方法，其中所述多个域中的每个域包括特定于所述相应域的一组任务。5.根据任一前述权利要求所述的方法，其中所述多个域与多个代理相关联，并且其中每个代理能够操作来执行特定于所述域中的一个或更多个域的一个或更多个任务。6.根据任一前述权利要求所述的方法，还包括：对于意图和槽的每个组合，识别所述多个域中的域，其中选择意图和槽的一个或更多个组合包括将意图和槽的每个组合的域映射到与所述多个ASR引擎之一相关联的域；可选地，其中当意图和槽的相应组合的域与所述多个ASR引擎之一的域匹配时，选择所述意图和槽的一个或更多个组合。7.根据任一前述权利要求所述的方法，其中生成所述多个转录包括：向所述多个ASR引擎中的每个ASR引擎发送所述第一音频输入；和从所述多个ASR引擎接收所述多个转录。8.根据任一前述权利要求所述的方法，其中所述多个ASR引擎中的ASR引擎中的一个或更多个是与第三方系统相关联的第三方ASR引擎，所述第三方系统与所述一个或更多个计算系统分离并且在所述一个或更多个计算系统外部，所述方法还包括：向所述第三方ASR引擎中的一个发送所述第一音频输入以生成一个或更多个转录；和从所述第三方ASR引擎中的一个第三方ASR引擎接收由所述第三方ASR引擎生成的一个或更多个转录，其中生成所述多个转录包括选择由所述第三方ASR引擎生成的一个或更多个转录，以确定与每个相应转录相关联的意图和槽的组合。9.根据任一前述权利要求所述的方法，还包括：识别意图和槽的每个组合的一个或更多个特征，其中所述一个或更多个特征指示所述意图和槽的组合是否具有属性；和基于所述多个组合的各自识别的特征对所述多个组...

【专利技术属性】
技术研发人员：尼古拉斯，
申请(专利权)人：脸谱科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人