当前位置: 首页 > 专利查询>苹果公司专利>正文

训练至少部分语音命令系统技术方案

技术编号:12273994 阅读:84 留言:0更新日期:2015-11-04 23:11
本发明专利技术公开了一种具有存储器和一个或多个处理器的电子设备,所述电子设备包括用于训练数字助理的过程。在一些实施例中,所述设备检测数字助理和用户之间的包括语音输入的对话中的僵局。在学习会话期间,所述设备利用来自用户的后续澄清输入来调整与所述语音输入相关联的意图推断或任务执行,以生成令人满意的响应。在一些实施例中,所述设备辨识与先前用于完成任务的方面相关联的成功或失败模式,并生成与在语音识别、意图推断或任务执行中所使用的作为所述模式的原因的参数有关的假设。然后,所述设备通过针对所述任务的后续完成而改变所述参数来测试所述假设,并基于从所述后续完成收集的反馈信息来采用或拒绝所述假设。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】 相关申请的交叉引用 本申请要求于2013年3月15日提交的名称为"TRAININGANATLEASTPARTIAL VOICECOMMANDSYSTEM"的美国临时专利申请61/792, 078的权益,所述美国临时专利申请 全文以引用方式并入本文以用于所有目的。
所公开的实施例整体涉及数字助理系统,更具体地,涉及训练数字助理系统。
技术介绍
正如人类个人助理一样,数字助理系统可执行所请求的任务并提供所请求的建 议、信息或服务。数字助理系统满足用户请求的能力取决于数字助理系统对请求或指令的 正确理解。在自然语言处理方面的最新进展已使用户能够使用口头或文本形式的自然语言 来与数字助理系统进行交互。此类数字助理系统可解译用户的输入以推断用户的意图、将 推断出的意图转换成可执行的任务和参数、执行操作或部署服务以执行任务、以及产生可 被用户理解的输出。理想的是,由数字助理系统所产生的输出应实现用户在用户和数字助 理系统之间的自然语言交互期间所表达的意图。 数字助理系统对用户请求产生令人满意的响应的能力取决于能够用于数字助理 系统的自然语言处理、知识库和人工智能。数字助理系统的良好设计的训练过程可改善用 户与该系统进行交互的体验,并提高用户对该系统的服务和能力的信任。
技术实现思路
本文所公开的实施例提供用于训练数字助理以更有规律地为用户的请求提供令 人满意的响应的方法、系统、非暂态计算机可读存储介质和用户界面。 因此,一些实施例提供用于操作数字助理的方法,该方法包括在包括一个或多个 处理器和存储一个或多个程序的存储器的设备处:检测在数字助理和用户之间的对话期间 的僵局,其中所述对话包括来自用户的至少一个语音输入;以及响应于检测到所述僵局,建 立与所述至少一个语音输入相关联的学习会话。在学习会话期间,该方法包括:从用户接收 一个或多个后续澄清输入;至少部分地基于所述一个或多个后续澄清输入,调整与所述至 少一个语音输入相关联的意图推断和任务执行中的至少一者,以生成对所述至少一个语音 输入的令人满意的响应;以及使所述令人满意的响应与所述至少一个语音输入相关联,以 用于处理所述至少一个语音输入的未来出现。 在一些实施例中,用于训练数字助理的另一方法在包括一个或多个处理器和存储 由该一个或多个处理器执行的指令的存储器的电子设备处被执行。在数字助理和用户之间 的对话期间,方法包括:接收来自用户的初始语音输入;基于初始语音输入来推断初始意 图;提供初始响应来满足已推断出的初始意图;以及接收拒绝初始响应的跟进语音输入。 在接收到拒绝初始响应的跟进语音输入时,该方法包括建立与初始语音输入相关联的学习 会话。在学习会话期间,该方法包括:调整与初始语音输入相关联的意图推断和任务执行中 的至少一者,以生成对初始语音输入的令人满意的响应;以及使令人满意的响应与初始语 音输入相关联,以用于处理所述初始语音输入的未来出现。 在一些实施例中,用于训练数字助理的另一方法在包括一个或多个处理器和存储 由该一个或多个处理器执行的指令的存储器的电子设备处被执行。该方法包括:获取与任 务的一个或多个先前完成相关联的反馈信息;以及辨识与先前用于完成所述任务的语音识 另IJ、意图推断或任务执行的方面相关联的成功或失败模式。该方法还包括:生成与在语音 识别、意图推断和任务执行中的至少一者中使用的作为成功或失败模式的原因的参数有关 的假设;识别一个或多个后续针对完成所述任务的请求;通过针对所述任务的后续完成而 改变在语音识别、意图推断和任务执行中的所述至少一者中使用的所述参数来测试所述假 设;以及基于从所述任务的所述后续完成收集的反馈信息来采用或拒绝所述假设。 在另一方面,一种电子设备包括一个或多个处理器和存储由该一个或多个处理器 执行的一个或多个程序的存储器,其中该一个或多个程序包括指令,该指令在被该一个或 多个处理器执行时使电子设备执行上述方法中的任一方法。 在另一方面,一种非暂态计算机可读介质存储一个或多个程序,该一个或多个程 序在被计算机系统的一个或多个处理器执行时使电子设备执行上述方法中的任一方法。 在附图以及下文的描述中阐述了本说明书中所述的主题的一个或多个实施例的 细节。根据说明书、附图及权利要求,所述主题的其他特征、方面和优点将显而易见。【附图说明】 图1为示出根据一些实施例的数字助理操作于其中的环境的框图。 图2为示出根据一些实施例的数字助理客户端系统的框图。 图3A为示出根据一些实施例的数字助理系统或其服务器部分的框图。 图3B为示出根据一些实施例的图3A中所示的数字助理的功能的框图。 图3C为示出根据一些实施例的图3B中所示的知识本体的一部分的示意图。 图4A至4C为根据一些实施例的用于训练数字助理的示例性过程的流程图。 图5为根据一些实施例的包括在图3B中的训练模块的框图。 图6A至6C为根据一些实施例的用于训练数字助理的示例性过程的流程图。 图7为根据一些实施例的电子设备的功能框图。 图8为根据一些实施例的电子设备的功能框图。 在整个附图中,相似的附图标号是指对应的部件。【具体实施方式】 图1为根据一些实施例的数字助理的操作环境100的框图。术语"数字助理"、"虚 拟助理"、"智能自动化助理"或"自动数字助理"是指解译口头和/或文本形式的自然语言 输入以推断用户意图并基于推断出的用户意图来执行动作的任何信息处理系统。例如,为 了遵循推断出的用户意图,系统可执行以下内容中的一个或多个:辨识具有被设计用以实 现所推断出的用户意图的步骤和参数的任务流,将来自推断出的用户意图的具体要求输入 到任务流中;通过调用程序、方法、服务、API等来执行任务流;以及生成听觉(例如,语音) 和/或视觉形式的对用户的输出响应。 具体地讲,数字助理能够接受至少部分地为自然语言命令、请求、声明、讲述和/ 或询问的形式的用户请求。通常,用户请求要么寻求信息回答,要么寻求数字助理执行任 务。针对用户请求的令人满意的响应是提供所请求的信息回答、或执行所请求的任务、或这 两者的组合。例如,用户可能对数字助理提问,诸如"我现在在哪里?"。基于用户的当前位 置,数字助理可回答"您在中央公园"。用户也可能请求执行任务,例如"请提醒我今天下午 4点给妈妈打电话"。作为响应,数字助理可确认该请求,然后在用户的电子日程表中创建适 当的提醒项。在执行所请求的任务期间,数字助理有时在延长的时间段内涉及多个信息交 换的连续对话中与用户交互。存在与数字助理进行交互以请求信息或执行各种任务的许多 其他方法。除提供言语响应和采取经编程的动作之外,数字助理还提供其他视觉或音频形 式(例如,作为文本、警报、音乐、视频、动画等)的响应。申请人的提交于2011 年 1 月 10 日的名称为"IntelligentAutomatedAssistant" 的美国实用专利申请序列号No. 12/987,982中介绍了数字助理的实例,该美国实用专利申 请的全部公开内容以引用方式并入本文。 如图1中所示,在一些实施例中,根据客户端_服务器模型来实施数字助理。数字 助理包括在用户设备104a、104b上执行的客户端侧部分102a、102b(在后文中称作"DA客 户端102")本文档来自技高网...

【技术保护点】
一种在电子设备处执行的用于训练数字助理的计算机实现的方法,所述电子设备包括一个或多个处理器和存储由所述一个或多个处理器执行的指令的存储器,所述方法包括:检测所述数字助理和用户之间的对话期间的僵局,其中所述对话包括来自所述用户的至少一个语音输入;响应于检测到所述僵局,建立与所述至少一个语音输入相关联的学习会话;在所述学习会话期间:接收来自所述用户的一个或多个后续澄清输入;至少部分地基于所述一个或多个后续澄清输入,调整与所述至少一个语音输入相关联的意图推断和任务执行中的至少一者,以生成对所述至少一个语音输入的令人满意的响应;以及使所述令人满意的响应与所述至少一个语音输入相关联,以用于处理所述至少一个语音输入的未来出现。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:D·W·皮特谢尔A·J·彻耶C·D·布里格汉姆T·R·格鲁伯
申请(专利权)人:苹果公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1