针对屏幕上项目选择的基于语言和域独立模型的方法技术

技术编号:18609946 阅读:19 留言:0更新日期:2018-08-04 22:55
提供了一种针对项目消歧和选择的基于通用模型的方法。可以由计算设备响应于用于选择的项目的列表来接收话语。在一些方面,项目的列表可以在显示器屏幕上显示。继而可以向话语应用通用消歧模型。通用消歧模型可以用于基于所标识的语言和/或域独立参考特征,来确定话语是否指向项目的列表中的至少一个,并且标识来自列表的与话语相对应的项目。计算设备继而可以执行可以包括选择与话语相关联的所标识的项目的动作。

【技术实现步骤摘要】
【国外来华专利技术】针对屏幕上项目选择的基于语言和域独立模型的方法
技术介绍
机器学习、语言理解和人工智能正在改变用户与计算机交互的方式。计算机和应用的开发者总是尝试改进人类与计算机之间的交互。然而,语言理解的开发以及选择针对任何给定语言的模型经常需要大量时间、金钱和其他资源来完成。就这些和其他一般考虑而言,已经做出了本文公开的方面。而且,虽然可以讨论相对具体的问题,但是应当理解,本文的各方面不应当限于解决
技术介绍
或者本公开内容其他部分中所标识的具体问题。
技术实现思路
总体来说,公开内容一般涉及用于提供或者生成针对屏幕上项目选择和消歧的基于语言和/或域独立模型的方法。响应于在显示器上显示项目,可以由计算设备接收第一语言的话语(utterance)。继而可以由计算设备向话语应用语言和/或域独立消歧模型。即使在通用消歧模型没有在相同语言中被训练或者接收相同语言的最小训练数据作为话语时,也可以使用该通用模型。通用消歧模型可以基于从所提取的话语的参考特征选择的语言和/或域独立特征来标识话语是否指向显示器上的项目中的至少一个项目,并且继而可以标识所显示的项目中的项目是否与话语相对应。在标识与显示器上的话语相对应的项目时,计算设备继而可以执行与话语相关联的动作。因此,本文公开的系统和方法的语言和/或域独立模型以最小成本和开发时间可扩展至新的语言。更具体地,本文公开的系统和方法的语言和/或域独立模型通过使其通用于或者可应用于任何给定语言而提供改善的效率和可扩展性。因此,与不是设计为语言和/或域独立的自然用户接口或者消歧模型相比,本文公开的系统和方法的语言和/或域独立模型更加易于开发和/或扩展,并且更加有效。本公开内容的一个方面包括一种语言理解系统。该语言理解系统包括语言理解服务器。语言理解服务器包括处理器和存储器。处理器执行存储在存储器上的指令以执行方法。该方法包括:从多个特征提取器检索训练特征,并且基于使用来自不同特征提取器的训练特征以形成经训练的语言理解模型的训练算法,来估计模型参数。在一些方面,多个特征提取器(例如,域预测器、意图预测器、实体预测器等)可以定位在与语言理解系统相同的服务器上。在其他方面,多个特征提取器可以定位在与语言理解系统通信的一个或多个不同的服务器上。本公开内容的另一方面涉及一种用于训练和使用自然语言理解系统的方法。该方法包括训练语言理解系统的语言理解模型。语言理解模型的训练包括:例如在语言理解服务器处接收来自多个特征提取器的训练特征,并且基于使用来自不同特征提取器的训练特征以形成经训练的语言理解模型的训练算法,来估计模型参数。在一些方面,多个特征提取器(例如,域预测器、意图预测器、实体预测器等)可以定位在语言理解服务器上。在其他方面,多个特征提取器可以定位在与语言理解服务器通信的一个或多个不同的服务器上。本公开内容的又一方面包括一种系统。该系统包括至少一个处理器和存储器。存储器包括存储在其上的计算机可执行指令。计算机可执行指令由至少一个处理器执行。计算机可执行指令导致系统执行操作,操作包括:在自然语言服务器上接收来自客户端设备的自然语言输入,向第一特征提取器(例如,意图预测器)发送自然语言输入,向第二特征提取器(例如,域预测器)发送自然语言输入,以及向第三特征提取器(例如,实体预测器)发送自然语言输入。在一些方面,一个或多个特征提取器(例如,第一特征提取器、第二特征提取器和第三特征提取器)可以定位在与自然语言服务器通信的一个或多个远程服务器上。在其他方面,一个或多个特征提取器可以定位在自然语言服务器上。关于上文描述的方面,计算机可执行指令导致系统执行另外的操作,操作包括:从第一特征提取器接收针对自然语言输入的第一潜在特征集合,从第二特征提取器接收针对自然语言输入的第二潜在特征集合,以及从第三特征提取器接收针对自然语言输入的第三潜在特征集合。计算机可执行指令导致系统执行附加操作,操作包括:聚合第一潜在特征集合、第二潜在特征集合和第三潜在特征集合,以形成聚合的潜在特征集合,并且使用利用来自第一特征提取器、第二特征提取器和第三特征提取器的训练特征训练的语言理解模型,来评估聚合的潜在特征集合。计算机可执行指令导致系统执行另外的操作,操作包括基于评估聚合的潜在特征集合来确定用户意图、域和实体(或者位置(slot))以及相关联的置信度分数,以及基于用户意图、域和实体以及置信度分数来生成响应。提供此
技术实现思路
以用于以简化形式介绍下文在具体实施方式中进一步描述的概念的选择。此
技术实现思路
不旨在标识所要求保护的主题的关键特征或者必要特征,也不旨在辅助确定所要求保护的主题的范围。这些和其他特征和优点将通过阅读以下具体实施方式和相关联的附图的评述而变得易见。可以理解,前述一般描述和下文具体实施方式都仅是说明性的而不是权利要求的约束。附图说明参考以下附图来描述非限制性和非穷举式的示例或者方面。图1是图示了根据公开内容的方面的使用针对屏幕上项目选择和消歧(disambiguation)的基于通用模型的方法的系统。图2A示出了根据公开内容的方面的计算设备的屏幕显示器,其包括用于使用针对屏幕上项目选择和消歧的基于通用模型的方法的用户接口。图2B示出了根据公开内容的方面的计算设备的屏幕显示器,其包括用于使用针对屏幕上项目选择和消歧的基于通用模型的方法的用户接口。图3示出了根据公开内容的方面的计算设备的屏幕显示器,其包括用于使用针对屏幕上项目选择和消歧的基于通用模型的方法的用户接口。图4是图示了根据公开内容的方面的用于使用针对屏幕上项目选择和消歧的基于通用模型的方法的例程的流程图。图5是图示了根据公开内容的方面的用于使用针对屏幕上项目选择和消歧的基于通用模型的方法的例程的流程图。图6是图示了可以利用其实践公开内容的方面的计算设备的示例物理组件的框图。图7A和图7B是可以利用其实践公开内容的方面的移动计算设备的简化框图。图8是可以利用其实践公开内容的各种方面的分布式计算系统的简化框图。图9图示了可以利用其实践公开内容的方面的平板计算设备。具体实施方式机器学习、语言理解和人工智能的进步正在改变用户与计算机交互的方式。诸如SIRI、GOOGLENow和CORTANA的数字助理应用是人机交互转换的示例。自然语言理解(NLU)系统负责提取语义框架以表示自然语言输入的域、意图和语义位置(或者实体)。NLU系统通常使用从域和语言特定的输入或者具有语义注释的数据训练的NLU模型。来自特征提取器的诸如单词N元语法、词典、个性化等的各种特征被用于建立NLU模型。在已经训练NLU之后对所接收的用户话语进行语义解码的运行时,也可以提取用于训练NLU模型的来自特征提取器的相同特征集合。因为视觉呈现用于传送对话系统或者应用的响应,统计自然语言理解中的人机交互已经随着视觉显示屏幕的添加而改变。在解译用户话语时,屏幕上项目标识和分辨(resolution)是实现自然和精确的人机通信的一个关键问题。消歧模型已经被设计为从用户话语准确地标识屏幕上项目。消歧模型用于通过使用由NLU系统从话语中提取的参考特征,来标识话语是否指向显示器上的项目中的至少一个,并且基于所提取的参考特征来标识所显示的项目中与话语相对应的项目。计算设备继而可以在标识显示器上与话语相对应的项目时执行与话语相本文档来自技高网
...

【技术保护点】
1.一种方法,包括:在显示器上显示多个项目;响应于显示所述多个项目,由计算设备接收第一语言的话语;由所述计算设备从所述话语中提取和与所述多个项目中的一个或多个项目相关联的特征具有关系的特征,以形成提取的特征;由所述计算设备使用语言独立消歧模型来标识所述话语指向所述显示器上的所述多个项目中的至少一个项目,其中所述语言独立消歧模型利用来自第二语言的数据而被训练,以及其中所述语言独立消歧模型通过以下来标识所述话语指向所述显示器上的所述多个项目中的所述至少一个项目:标识提取的所述特征中的域和语言独立特征;从提取的所述特征中选择所述域和语言独立特征以形成选择的特征;确定从所述话语中提取的选择的所述特征和与所述显示器上的所述多个项目中的一个或多个项目相关联的所述特征之间的重叠;以及基于所述重叠来标识所述显示器上的所述多个项目中与所述话语相对应的所述至少一个项目;以及响应于标识所述话语指向所述显示器上的所述多个项目中的所述至少一个项目,由所述计算设备执行与所述话语相关联的动作。

【技术特征摘要】
【国外来华专利技术】2015.12.11 US 14/966,2571.一种方法,包括:在显示器上显示多个项目;响应于显示所述多个项目,由计算设备接收第一语言的话语;由所述计算设备从所述话语中提取和与所述多个项目中的一个或多个项目相关联的特征具有关系的特征,以形成提取的特征;由所述计算设备使用语言独立消歧模型来标识所述话语指向所述显示器上的所述多个项目中的至少一个项目,其中所述语言独立消歧模型利用来自第二语言的数据而被训练,以及其中所述语言独立消歧模型通过以下来标识所述话语指向所述显示器上的所述多个项目中的所述至少一个项目:标识提取的所述特征中的域和语言独立特征;从提取的所述特征中选择所述域和语言独立特征以形成选择的特征;确定从所述话语中提取的选择的所述特征和与所述显示器上的所述多个项目中的一个或多个项目相关联的所述特征之间的重叠;以及基于所述重叠来标识所述显示器上的所述多个项目中与所述话语相对应的所述至少一个项目;以及响应于标识所述话语指向所述显示器上的所述多个项目中的所述至少一个项目,由所述计算设备执行与所述话语相关联的动作。2.根据权利要求1所述的方法,其中确定所述重叠包括:确定从所述话语中提取的选择的所述特征中的至少一个特征和与所述显示器上的所述多个项目中的所述至少一个项目相关联的所述特征中的至少一个特征之间的词法重叠。3.一种存储计算机可执行指令的计算机可读存储介质,当所述计算机可执行指令由计算设备执行时,使得所述计算设备执行包括以下的方法:发送指令以呈现多个项目;由所述计算设备接收第一语言的话语;由所述计算设备使用语言理解模型从所述话语中提取特征,以形成提取的特征;由所述计算设备通过使用语言独立灵活项目选择模型来确定所述话语指向所述多个项目中的至少一个项目,其中所述语言独立灵活项目选择模型尚未接收针对所述第一语言的训练数据,其中所述语言独立灵活项目选择模型通过以下来确定所述话语指向所述多个项目中的所述至少一个项目:将提取的所述特征中的一个或多个域独立特征和语言独立特征标识为通用特征;以及确定从所述话语中提取的一个或多个通用特征和与所述多个项目中的所述至少一个项目相关联的一个或多个特征之间的词法重叠;以及在确定所述话语指向所述多个项目之中的所述至少一个项目时,发送指令以执行与所述话语相关联的动作。4.一种计算设备,包括:至少一个处理器;以及存储器,所述存储器用于存储和编码计算机可执行指令,所述计算机可执行指令在由所述至少一个处理器执行时操作用于:接收话语;从所述话语中提取特征以形成提取的特征;使用语言独立消歧模型来标识所述话语指向多个项目中的至少一个项目,其中所述语言独立消歧模型通过以下来标识所述话语指向所述多个项目中的所述至少一个项目:将提取的所述特征中的一个或多个域独立特征和语言独立特征标识为通用特征;确定从所述话语中提取的一个或多个通用特征和与所述多个项目相关联的一个或多个特征之间的重叠;以及基于所述重叠来标识所述...

【专利技术属性】
技术研发人员:F·A·塞利基尔马兹Z·费佐拉希D·哈卡尼图尔R·萨里卡亚
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1