基于用户指定的兴趣的自然语言理解NLU处理制造技术

技术编号:15529701 阅读:125 留言:0更新日期:2017-06-04 16:59
用于基于用户指定的兴趣的自然语言理解(NLU)处理的方法和设备。经由用户界面接收指定多个领域中的每一个领域的权重的信息。多个领域中的每一个领域涉及用户感兴趣的潜在区域,而多个领域之中的一个领域的权重指示用户对该领域感兴趣的水平。使用训练数据来训练排序分类器,排序分类器用来对由NLU引擎生成的NLU假设进行排序,训练数据的特征是至少部分地基于指定多个领域中的每一个领域的权重的信息的。

NLU processing based on natural language understanding of user specified interests

Method and apparatus for natural language understanding (NLU) processing based on user specified interests. Receives information about the weight of each field in a plurality of domains via a user interface. Each field in multiple domains involves potential areas of interest to users, and the weight of one field in multiple domains indicates the level of interest that the user is interested in. Use the training data to train the classifier is used for sorting, ranking classifiers generated by the NLU engine NLU hypothesis ranking, features of training data is at least partially specify multiple fields in every field of weights based on the information.

【技术实现步骤摘要】
【国外来华专利技术】基于用户指定的兴趣的自然语言理解NLU处理
技术介绍
诸如智能电话和平板计算机之类的一些电子设备包括自然语言理解NLU引擎或与NLU引擎相关联,该NLU引擎解释用户输入以提供有意义的输出,或促进对于经由电子设备可访问的一个或多个应用的动作。虚拟代理或虚拟助理是一种这样类型的应用,它们得益于NLU处理以辅助用户执行诸如搜索网络(例如,因特网)上的内容以及与其他应用进行接口连接之类的功能。用户可以通过打字、触摸、语音或某些其他接口与虚拟代理进行交互。为确定用户输入的含义,NLU引擎解释用户输入,并且虚拟代理可以基于NLU结果来尝试推断用户希望执行的动作。
技术实现思路
一个实施例涉及一种训练由自然语言理解NLU引擎使用的排序分类器以为计算机系统的用户排序由所述NLU引擎生成的NLU假设的方法。该方法包括下列动作:经由用户界面接收指定多个领域中的每一个领域的权重的信息,其中,所述多个领域中的每一个领域涉及用户感兴趣的潜在区域,其中,所述多个领域之中的一个领域的权重指示用户对该领域感兴趣的水平,以及,使用训练数据来训练所述排序分类器,所述训练数据的特征是至少部分地基于指定所述多个领域中的每一个领域的权重的信息的。另一个实施例涉及编码有多个指令的非暂态计算机可读存储介质,所述多个指令当被计算机运行时执行一种方法。该方法包括使用自然语言理解NLU引擎来处理由用户提供的输入的文本表示以确定NLU输出的动作,其中,处理所述文本表示是至少部分地基于将权重与多个领域中的每一个领域相关联的特定于用户的信息来执行的,其中,所述多个领域中的每一个领域涉及用户感兴趣的潜在区域,其中,与所述多个领域中的每一个领域相关联的权重指示用户对相应的领域感兴趣的水平。另一个实施例涉及计算机系统,该计算机系统包括:用户界面,所述用户界面被配置成接收指定多个领域中的每一个领域的权重的信息,其中,所述多个领域中的每一个领域涉及用户感兴趣的潜在区域,其中,所述多个领域之中的一个领域的权重指示用户对该领域感兴趣的水平;以及至少一个处理器。所述至少一个处理器被编程为使用训练数据来训练所述排序分类器,所述训练数据的特征是至少部分地基于指定所述多个领域中的每一个领域的权重的信息的。应该理解,前述的概念以及下面更详细地讨论的附加概念(假设这样的概念不是相互不一致)的所有组合都是本文中所公开的独创性的主题的一部分。附图说明在附图中,各个附图中示出的每一个相同或近乎相同的组件由同样的标号来表示。为了清楚的目的,可能不是每一个组件都在每张附图中被标示。在附图中:图1是可以实现本专利技术的一些实施例的示例性计算环境的示意图;图2是根据本专利技术的一些实施例的用于创建经训练的排序引擎的说明性处理的流程图;图3是根据本专利技术的一些实施例的用于指定多个领域的权重的说明性用户界面,其中,权重被用来训练排序引擎;图4是根据本专利技术的一些实施例的用于生成用来训练排序引擎的训练数据的说明性处理的流程图;图5A和图5B示出根据一些实施例的可以被包括作为用来训练排序引擎的训练数据的说明性特征组;图6是根据本专利技术的一些实施例的用于至少部分地基于用户偏好选择NLU假设的说明性处理的流程图;图7是根据本专利技术的一些实施例的用于选择基于语音输入生成的NLU假设的说明性处理的流程图,其中,NLU假设是至少部分地基于用户偏好选择的;以及图8是可以实现本专利技术的一些实施例的示例性计算机系统。具体实施方式包括NLU引擎的一些系统基于从特定用户收集的历史使用信息,以自定义方式执行。例如,对于因特网上与在流行文化中也具有高关注度(highprofile)的专业运动员有关的信息的查询可能潜在地从体育相关的网站返回(例如,关于运动成绩、体育统计等等的)信息和/或从与流行文化相关的网站返回信息(例如,运动员在公共事件中的照片、约会信息、其他明星八卦等等)。感兴趣的信息可能在用户与用户之间不同。随着时间的推移,如果第一用户表现出对体育的兴趣(例如,基于选择了哪些返回的链接)但不对流行文化感兴趣,一些NLU引擎将学习该历史信息,并使用该历史信息以使为该用户返回的未来结果有倾向性(例如,通过当接收到与体育人士相关联的查询时返回体育相关的内容而不是流行文化内容)。相反地,对于表现出对流行文化的兴趣而对体育的兴趣不大的不同用户,一些NLU引擎将随着时间的推移学习该用户的偏好,并使返回的结果有偏向流行文化而不是体育的倾向性。专利技术人认识到,包括NLU引擎的系统的新用户没有历史信息,使得NLU引擎不能提供个性化的用户体验,直到用户使用了该系统达(潜在地,漫长的)一段时间。另外,这样的系统的用户也不具有在用户的兴趣随着时间的推移而变化的情况下对于重载NLU引擎的个性化倾向性的控制。为此,本专利技术的一些实施例涉及提供使得用户能够指定对于多个类别(本文中也被称为“领域”)中的一个或多个类别的预定信息(例如,经由一组权重)的用户界面,其中,预定信息反映用户对于接收与那些特定领域中的一个或多个领域相关联的NLU结果的兴趣。如下面进一步详细地讨论的,一些NLU引擎可包括排序引擎,该排序引擎可以使用预定信息以任何合适的方式来训练和/或修改,以基于所提供的信息来个性化用户的体验。本文中所描述的技术可以在使用基于NLU的处理的任何应用或系统中实现。在一些实施例中,如下面所描述的,使用本文中所描述的技术的NLU引擎可以用来促进用户和虚拟代理(例如,实现为在诸如智能电话之类的电子设备上执行的应用)之间的交互。然而,这只是本文中所描述的技术的一个说明性用途,因为它们可以在任何环境中与任何NLU引擎一起使用。图1示出根据本专利技术的一些实施例的可以使用的示例性计算环境100。计算环境100包括电子设备110。电子设备110包括被配置成接收用户输入的输入接口112。输入接口可以采取任何形式,因为本专利技术的各方面在这点上不受限制。在一些实施例中,输入接口112可包括多个输入接口,每一个输入接口被配置成接收一种或多种类型的用户输入。例如,输入接口112可包括键盘(例如,QWERTY键盘)、小键盘、触敏屏幕、鼠标或任何其他合适的用户输入设备。作为另一个示例,输入接口可包括麦克风,该麦克风当被激活时接收语音输入,并在电子设备上本地地、远程地((例如,在服务器上)或者在两者之间分布地执行自动语音识别(ASR)。接收到的语音输入可以存储在与电子设备110相关联的数据存储库中,以促进ASR处理。电子设备110还包括被配置成从电子设备110输出信息的输出接口114。输出接口可以采取任何形式,因为本专利技术的各方面在这点上不受限制。在一些实施例中,输出接口114可包括多个输出接口,每一个输出接口被配置成提供一种或多种类型的输出。例如,输出接口114可包括一个或多个显示器,一个或多个扬声器,或任何其他合适的输出设备。在电子设备110上执行的应用可以被编程为显示用户界面,以促进与该应用相关联的一个或多个动作的执行。在本文中描述的一个示例中,如下面更详细地描述的,应用会显示这样的用户界面,该用户界面使得用户能够提供描述用户感兴趣的潜在区域的、对于多个领域中的每一个领域的预定信息(例如,权重)。在下面的示例中,由用户对于多个领域中的每一个领域指定的预定信息是反映领域对特定用户的兴趣的相对重要性的权重。本文档来自技高网...
基于用户指定的兴趣的自然语言理解NLU处理

【技术保护点】
一种训练由自然语言理解NLU引擎使用的排序分类器以为计算机系统的用户排序由所述NLU引擎生成的NLU假设的方法,所述方法包括下列动作:经由用户界面接收指定多个领域中的每一个领域的权重的信息,其中,所述多个领域中的每一个领域涉及用户感兴趣的潜在区域,其中,所述多个领域之中的一个领域的权重指示用户对该领域感兴趣的水平;以及使用训练数据来训练所述排序分类器,所述训练数据的特征是至少部分地基于指定所述多个领域中的每一个领域的权重的信息的。

【技术特征摘要】
【国外来华专利技术】2014.10.01 US 14/503,4691.一种训练由自然语言理解NLU引擎使用的排序分类器以为计算机系统的用户排序由所述NLU引擎生成的NLU假设的方法,所述方法包括下列动作:经由用户界面接收指定多个领域中的每一个领域的权重的信息,其中,所述多个领域中的每一个领域涉及用户感兴趣的潜在区域,其中,所述多个领域之中的一个领域的权重指示用户对该领域感兴趣的水平;以及使用训练数据来训练所述排序分类器,所述训练数据的特征是至少部分地基于指定所述多个领域中的每一个领域的权重的信息的。2.如权利要求1所述的方法,进一步包括下列动作:跟踪用户的使用信息;以及至少部分地基于所跟踪的使用信息,重新训练所述排序分类器。3.如权利要求1所述的方法,其中,训练所述排序分类器包括:将所述训练数据提供为一组经注释的样例,其中,所述组中的每一个样例都与多个特征组相关联,其中,所述多个特征组中的每一个特征组都包括这样的值,该值包括所述多个领域、领域的权重和目标值之一。4.如权利要求3所述的方法,其中,所述多个特征组中的每一个特征组的值进一步包括由语音识别器和/或NLU引擎确定的排序信息。5.如权利要求4所述的方法,其中,所述多个特征组中的每一个特征组的值进一步包括由所述语音识别器确定的所述样例的语言模型分数。6.一种编码有多个指令的非暂态计算机可读存储介质,所述多个指令当被计算机运行时执行一种方法,所述方法包括下列动作:使用自然语言理解NLU引擎来处理由用户提供的输入的文本表示,以确定NLU输出,其中,处理所述文本表示是至少部分地基于将权重与多个领域中的每一个领域相关联的特定于用户的信息来执行的,其中,所述多个领域中的每一个领域涉及用户感兴趣的潜在区域,其中,与所述多个领域中的每一个领域相关联的权重指示用户对相应的领域感兴趣的水平。7.如权利要求6所述的计算机可读存储介质,其中,所述方法还包括下列动作:接收语音输入;以及利用语音识别器来处理所述语音输入,以确定所述文本表示的至少一部分。8.如权利要求6所述的计算机可读存储介质,其中,处理所述文本表示是进一步至少部分地基于至少一个特定于领域的语言模型分数来执行的。9.如权利要求6所述的计算机可读存储介质,其中,处理所述文本表示包括:确定所述文本表示的至少一个NLU假设,其中,所述至少一个NLU假设中的每一个NLU假设与所述文本表示的领域相关联;使用用户指定的信息对所述至少一个假设进行分类;以及选择所述至少一个假设...

【专利技术属性】
技术研发人员:M·荷伯特
申请(专利权)人:纽昂斯通讯公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1