当前位置: 首页 > 专利查询>苹果公司专利>正文

通过智能数字助理的用户培训制造技术

技术编号:21799379 阅读:24 留言:0更新日期:2019-08-07 10:34
本公开的实施例涉及通过智能数字助理的用户培训。本发明专利技术提供了一种方法,所述方法包括接收来自用户的用第一语言说出的第一语音输入;基于采用所述第一语言的至少所述第一语音输入来推断用户意图;基于所推断的用户意图,生成采用所述第一语言的所述第一语音输入的一个或多个可供选择的表达;以及向所述用户提供介绍所述可供选择的表达作为比所述用户提供的所述第一语音输入更优选的输入以表达所推断的用户意图的反馈。

User Training Through Intelligent Digital Assistant

【技术实现步骤摘要】
通过智能数字助理的用户培训相关申请的交叉引用本申请是国际申请号为PCT/US2014/028785、国际申请日为2014年3月14日、进入国家阶段日为2015年9月11日、国家申请号为201480014613.9、专利技术名称为“通过智能数字助理的用户培训”的中国专利技术专利申请的分案申请。本申请要求于2013年3月15日提交的名称为USERTRAININGBYINTELLIGENTDIGITALASSISTANT的美国临时专利申请号61/800,846的权益,所述专利申请据此全文以引用方式并入以用于所有目的。
本专利技术所公开的实施例整体涉及数字助理,并且更具体地讲涉及智能地向用户提供培训机会和辅助的数字助理。
技术介绍
正如人类个人助理一样,数字助理或虚拟助理可执行所请求的任务并提供所请求的建议、信息或服务。助理满足用户请求的能力取决于助理对请求或指令的正确理解。自然语言处理的最新进展使用户能够使用自然语言以语音或文本形式与数字助理交互,而非采用常规用户界面(例如菜单或程序命令)。此类数字助理可解译用户的输入以推断用户的意图、将所推断的意图转化成可执行的任务和参数、执行操作或部署服务以执行任务,以及产生可被用户理解的输出。理想的是,由数字助理所产生的输出应实现用户在用户和数字助理之间的自然语言交互期间所表达的意图。数字助理可响应于从用户接收的搜索请求,在选择域(例如餐厅域等)中执行搜索并呈现符合条件的选项(例如餐厅)。数字助理系统对用户请求产生令人满意的响应的能力取决于由该系统所实现的自然语言处理、知识库和人工智能。常规数字助理响应于单一语言的用户命令,并以相同语言提供响应。当用户访问使用不同语言的区域时,这些数字助理无法胜任。此外,虽然一些常规数字助理响应于用户的培训或自定义,但常规数字助理尚未用于通过利用其自然语言和意图处理能力来向用户提供培训。
技术实现思路
本文所公开的实施例提供了数字助理通过利用其自然语言处理和意图处理能力智能且主动地向用户提供培训机会和辅助,尤其是外语培训和辅助和/或向用户介绍特定于地区的口音/俚语的方法、系统、计算机可读存储介质和用户界面。具有多语言能力的智能数字助理在外语培训方面可更有效,因为它并非简单地执行用户输入的直接直译,而是根据基于用户输入所推断的用户意图来提供培训样本和外语辅助。意图推断可以根据上下文,并且可利用关于来自许多不同来源的用户当前需求的相关信息。可以避免直译的许多局限性(例如,由于拙劣和不正确的句子结构、语法和输入习惯造成的错误)。此外,数字助理知晓与用户相关联的当前上下文,并且可向用户提供针对当前上下文的更适当的外语培训练习并提供针对用户学习的激励和实景实践机会。因此,一些实施例提供了用于操作数字助理的方法,该方法包括在包括存储器和一个或多个处理器的设备处存储一个或多个程序:接收来自用户的用第一语言说出的第一语音输入;基于采用该第一语言的至少第一语音输入来推断用户意图;基于所推断的用户意图生成采用第一语言的第一语音输入的一个或多个可供选择的表达;并且向用户提供介绍可供选择的表达作为比用户提供的第一语音输入更优选的输入以表达所推断的用户意图的反馈。在一些实施例中,提供反馈还包括:采用不同于第一语言的第二语言来提供反馈,其中第二语言是与用户相关联的主要语言,并且第一语言是与用户相关联的次要语言。在一些实施例中,第一语音输入的一个或多个可供选择的表达至少包括纠正第一语音输入中的至少一个字词的发音的相应的可供选择的表达。在一些实施例中,第一语音输入的一个或多个可供选择的表达至少包括纠正第一语音输入中的至少一个字词的语法使用的相应的可供选择的表达。在一些实施例中,第一语音输入的一个或多个可供选择的表达至少包括将第一语音输入中的至少一个字词或短语替换为另一个字词或短语的相应的可供选择的表达。在一些实施例中,该方法还包括:提供至少命令模式和外语培训模式,其中数字助理在命令模式中执行任务流以实现所推断的用户意图,并且其中数字助理在外语培训模式中生成一个或多个可供选择的表达并向用户提供反馈。在一些实施例中,该方法还包括:同时提供命令模式和外语培训模式两者,其中除了生成一个或多个可供选择的表达并向用户提供反馈之外,数字助理还执行任务流以实现所推断的用户意图。在一些实施例中,该方法还包括:接收外语培训模式的用户选择;以及响应于外语培训模式的用户选择来启用外语培训模式。在一些实施例中,该方法还包括:在没有用户干预的情况下,基于用户的当前位置来自动启用外语培训模式,其中与用户的当前位置相关联的主要语言为第一语言。在一些实施例中,基于第一语言的第一语音输入来推断用户意图还包括:识别用户的第一语言的自定义语音转文本模型,其中已基于由第二语言的母语者(用户也是该第二语言的母语者)提供的培训样本来建立自定义语音转文本模型;使用自定义语音转文本模型处理第一语音输入以生成文本串;以及使用该文本串作为用于数字助理的意图推断模型的输入。在一些实施例中,生成采用第一语言的第一语音输入的一个或多个可供选择的表达还包括:识别由第一语言的母语者先前提供的第二语音输入,其中第二语音输入已与和第一语音输入的所推断的用户意图相同的相应用户意图相关联,并且其中针对相应用户意图执行的任务流对所述母语者已是令人满意的;以及利用第二语音输入作为第一语音输入的可供选择的表达中的一个可供选择的表达。由母语者先前提供的语音输入是显示特定区域中的语言和词汇的习惯用法的示例表达的良好来源。在一些实施例中,向用户提供介绍可供选择的表达作为更优选的输入以表达所推断的用户意图的反馈还包括:采用第二语言提供对第一可供选择的表达与第一语音输入之间的差异的说明,其中第二语言是与用户相关联的主要语言,并且第一语言是与用户相关联的次要语言。在一些实施例中,该方法还包括:接收来自用户的采用第一语言的第二语音输入,该第二语音输入利用可供选择的表达中的至少一个可供选择的表达;确定第二语音输入是否为至少一个可供选择的表达的令人满意的声音话语;以及在确定第二语音输入是至少一个可供选择的表达的令人满意的声音话语时,执行任务流以实现所推断的用户意图。在一些实施例中,该方法还包括:基于所推断的用户意图采用第二语言提供第一语音输入的改述,以确认所推断的用户意图的正确性,其中数字助理在接收到所推断的用户意图是正确的用户意图的用户确认之后,生成可供选择的表达并提供反馈。在一些实施例中,基于采用第一语言的至少第一语音输入来推断用户意图还包括进一步基于与用户相关联的当前上下文来推断用户意图。在一些实施例中,与用户相关联的当前上下文至少包括用户的当前位置。在一些实施例中,与用户相关联的当前上下文至少包括接收第一语音输入的当前时间。在一些实施例中,与用户相关联的当前上下文至少包括位于用户的当前位置的地点的类型。在一些实施例中,与用户相关联的当前上下文至少包括用户的时间表项目与当前位置之间的相关性。在一些实施例中,与用户相关联的当前上下文至少包括用户的时间表项目与当前时间之间的相关性。在一些实施例中,与用户相关联的当前上下文至少包括用户的当前交通模式。在一些实施例中,与用户相关联的当前上下文至少包括由用户输入的方向请求与用户的当前位置之间的相关性。在一些实施例中,本文档来自技高网
...

【技术保护点】
1.一种操作数字助理的方法,包括:在具有存储器和一个或多个处理器的设备处:在与用户的第一交互期间:当所述用户位于第一地理区域时,接收来自所述用户的第一语音输入;基于所述第一语音输入来推断第一用户意图;基于所推断的所述第一用户意图来提供所述第一语音输入的第一改述;以及执行相应任务流,以实现所推断的所述第一用户意图;在与所述用户的第二交互期间:当所述用户位于第二地理区域时,接收来自所述用户的第二语音输入,所述第二语音输入与所述第一语音输入基本上相同;基于所述第二语音输入来推断第二用户意图,所推断的所述第二用户意图与所推断的所述第一用户意图相同;确定从所述第一地理区域到所述第二地理区域的位置变化与所述第二语音输入中的至少一个字词或表达的语言或特定于地区的词汇的变化相关联;响应于所述确定,基于所推断的所述第二用户意图来提供第二改述,其中基于语言或词汇的所述变化,所述第二改述不同于所述第一改述;以及执行所述相应任务流,以实现所推断的所述第二用户意图。

【技术特征摘要】
2013.03.15 US 61/800,8461.一种操作数字助理的方法,包括:在具有存储器和一个或多个处理器的设备处:在与用户的第一交互期间:当所述用户位于第一地理区域时,接收来自所述用户的第一语音输入;基于所述第一语音输入来推断第一用户意图;基于所推断的所述第一用户意图来提供所述第一语音输入的第一改述;以及执行相应任务流,以实现所推断的所述第一用户意图;在与所述用户的第二交互期间:当所述用户位于第二地理区域时,接收来自所述用户的第二语音输入,所述第二语音输入与所述第一语音输入基本上相同;基于所述第二语音输入来推断第二用户意图,所推断的所述第二用户意图与所推断的所述第一用户意图相同;确定从所述第一地理区域到所述第二地理区域的位置变化与所述第二语音输入中的至少一个字词或表达的语言或特定于地区的词汇的变化相关联;响应于所述确定,基于所推断的所述第二用户意图来提供第二改述,其中基于语言或词汇的所述变化,所述第二改述不同于所述第一改述;以及执行所述相应任务流,以实现所推断的所述第二用户意图。2.根据权利要求1所述的方法,其中所述第一地理区域和所述第二地理区域均与所述用户的主要语言相关联。3.根据权利要求1至2中的任一项所述的方法,其中特定于地区的词汇的所述变化包括使用所述第二语音输入中的所述至少一个字词或表达在所述第二地理区域中的相应当地俚语,并且其中所述第二改述利用所述相应当地俚语。4.根据权利要求3所述的方法,进一步包括:接收用户输入,以开始关于在所述第二改述中所提供的所述相应当地俚语的学习会话;以及响应于接收所述用户输入,提供对所述第二地理区域中的所述相应当地俚语的用法的说明。5.根据权利要求1至4中的任一项所述的方法,其中语言的所述变化包括使用所述第二语音输入中的所述至少一个字词或表达在所述第二地理区域中的相应当地口音,并且其中所述第二改述利用所述相应当地口音。6.根据权利要求5所述的方法,进一步包括:接收用户输入,以开始关于在所述第二改述中所提供的所述相应当地口音的学习会话;以及响应于接收所述用户输入,提供所述第二地理区域中的所述相应当地口音的用法的一个或多个附加的示例。7.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,当由电子设备执行时,所述指令使得所述电子设备执行以下操作:在与用户的第一交互期间:当所述用户位于第一地理区域时,接收来自所述用户的第一语音输入;基于所述第一语音输入来推断第一用户意图;基于所推断的所述第一用户意图来提供所述第一语音输入的第一改述;以及执行相应任务流,以实现所推断的所述第一用户意图;在与所述用户的第二交互期间:当所述用户位于第二地理区域时,接收来自所述用户的第二语音输入,所述第二语音输入与所述第一语音输入基本上相同;基于所述第二语音输入来推断第二用户意图,所推断的所述第二用户意图与所推断的所述第一用户意图相同;确定从所述第一地理区域到所述第二地理区域的位置变化与所述第二语音输入中的至少一个字词或表达的语言或特定于地区的词汇的变化相关联;响应于所述确定,基于所推断的所述第二用户意图来提供第二改述,其中基于语言或词汇的所述变化,所述第二改述不同于所述第一改述;以及执行所述相应任务流,以实现所推断的所述第二用户意图。8.根据权利要求7所述的计算机可读存储介质,其中所述第一地理区域和所述第二地理区域均与所述用户的主要语言相关联。9.根据权利要求7至8中的任一项所述的计算机可读存储介质,其中特定于地区的词汇的...

【专利技术属性】
技术研发人员:D·W·皮特谢尔T·R·格鲁伯
申请(专利权)人:苹果公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1