在对话交互系统中推断搜索输入中的用户意图的方法和系统技术方案

技术编号:17138708 阅读:38 留言:0更新日期:2018-01-27 14:37
本发明专利技术公开涉及在对话交互系统中推断搜索输入中的用户意图的方法和系统。公开了在对话交互系统中推断搜索输入中的用户意图的方法。推断搜索输入中的用户意图的方法包括提供描述用户偏好的用户偏好签名、从用户接收要被用户用于识别至少一个期望的项的搜索输入,并且确定搜索输入的一部分包含歧义标识符。该歧义标识符要被用户用于至少部分地识别期望的项。该方法还包括基于搜索输入的部分与由用户偏好签名描述的用户偏好匹配而推断歧义标识符的含义并且基于将搜索输入及所推断的歧义标识符的含义与和内容项相关联的元数据的比较而从一组内容项中选择项。

Methods and systems for inferring user intentions in a search input in a dialogue interaction system

【技术实现步骤摘要】
在对话交互系统中推断搜索输入中的用户意图的方法和系统本申请是申请日为2013年7月19日、申请号为201380046675.3、专利技术名称为“在对话交互系统中推断搜索输入中的用户意图的方法和系统”的专利技术专利申请的分案申请。对相关申请的交叉引用本申请要求以下专利申请的权益,其内容通过引用被结合于此:于2013年5月1日提交的标题为“MethodofandSystemforInferringUserIntentinSearchInputinaConversationalInteractionSystem”的美国专利申请No.13/874,523;于2012年11月2日提交的标题为“MethodofandSystemforInferringUserIntentinSearchInputinaConversationalInteractionSystem”的美国专利申请No.13/667,400;于2012年11月2日提交的标题为“MethodofandSystemforUsingConversationStateInformationinaConversationalInteractionSystem”的美国专利申请No.13/667,388;于2012年10月11日提交的标题为“MethodofandSystemforContentSearchBasedonConceptualLanguageClustering”的美国临时专利申请No.61/712,721;及于2012年7月20日提交的标题为“AConversationalInteractionSystemforLargeCorpusInformationRetrieval”的美国临时专利申请No.61/673,867。
本专利技术一般地涉及对话交互技术,并且更具体地,涉及基于解决输入歧义和/或推断对话会话中已发生变化来推断用户意图。
技术介绍
对话系统有望成为跨一系列设备导航大型信息库的优选模式,其中设备包括:智能电话、平板电脑、TV/STB、多模态设备,诸如像“Goggles”(谷歌的太阳镜)的可穿戴计算设备、类似Xbox/Kinect的混合手势识别/语音识别系统、汽车信息系统以及一般的家庭娱乐系统。处于舞台中心、作为主要交互模式的基于触摸界面的时代也许慢慢地进入尾声,其中在许多日常生活的用例中,用户宁愿说出自己的意图,并且系统理解和按该意图执行。这同时被显著的硬件、软件和算法的进步所激发,这些进步使得与几年前相比,文本到语音有效得多。尽管正朝着纯对话接口做出进展,但是现有的简单请求响应方式的对话系统只够在小型信息库中解决面向特定任务的或者特定信息检索的问题-这些系统不能在大型语料信息库上很好的执行。其核心本质上是请求响应系统的当前系统试图提供诸如响应用户问题的对话方式的界面,如下:用户:我的支票账户余额是多少?系统:它是$2,459.34。用户:存款呢?系统:它是$6,209.012。用户:货币市场如何?系统:它是$14,599.33。这些本质上是提供对话连续性概念的面向目标的或面向任务的请求响应系统,尽管每个请求响应对都彼此独立并且所维护的唯一上下文是简单的上下文,即,用户的银行账户。当前对话系统的其它例子是那些使用户走过一系列良好定义的并通常预先确定的决策树路径以完成用户意图(诸如预定晚餐、预定机票等)的系统。申请人已发现,理解用户的意图(即使在其中用户意图可以跨单纯的信息检索到观看演出或预订演出/电影票的诸如数字娱乐的领域内)结合理解表达意图的用户话语的语义以提供匹配用户意图的清楚和简洁的响应是当前系统在对话空间中未能解决的难题。除具有明确意图表达的简单句子之外,通常难以提取表达意图的句子的意图和语义,即使在单个请求/响应交换式的交互中。不具有良好定义步骤的面向任务的意图增加了这种复杂性(诸如遍历预定的判定树)。同样有问题的是需要一系列用户请求和系统响应来使任务完成的那些交互(例如,像预定晚餐)。还有,丰富的信息库会尤其具有挑战性,因为对实体的用户意图表达可以采用许多有效且自然的形式,并且同一词汇标记(单词)会与许多不同的用户意图相关地出现。当语料库很大时,在不用对话来澄清词汇冲突和多种语义解释的情况下,这些冲突或歧义增加了满足用户意图的复杂性。有时,甚至不可能理解用户的意图,或者表达意图的句子的语义-类似于在现实生活中人之间的对话中所发生的。系统问最少量的问题(从在对话中理解另一个人的角度看)来理解用户意图的能力,正如人将会做的那样(一般来说其中参与方都知道所讨论的领域),将决定系统到人类对话的接近程度。超出简单的多步骤旅行/晚餐预订(例如,对话中的步骤是明确定义的请求/响应序列,在每一步中没有太多的歧义解决方案)的进行对话或交流的系统同样面临为了有效率而不得不维护对话状态的复杂性。例如,这些系统将需要推断对意图和实体的隐含引用(例如,对人、物体或任何名词的引用)以及在用户的句子中限定意图的属性(例如,“给我显示TomHanks最近的电影而不是老电影”;“给我显示更多的动作片和更少的暴力片”)。还有,申请人已发现,不仅跟踪由用户做出的对之前输入中的实体、属性等的引用,而且跟踪系统对用户的多模式响应的实体、属性等的引用是有益的。还有,申请人已发现,在用户/系统交流期间维护代词到宾语/主语的关联增强了用户的体验。例如,在诸如“在近期的DanielCraig电影的原声曲目中的LedZeppelin歌曲…谁演奏的它?”的复杂用户输入中将代词“它”关联到其宾语/主语“LedZeppelin歌曲”的语音分析器(或自然语言处理器)通过不需要用户始终使用特定的语法来帮助用户。但是,这种简单的代词到宾语/主语的关联在处理以下交流时是无效的:Q1:谁在新星球大战中扮演Obi-wanKenobi?A:EwanMcGregor。Q2:他与ScarletJohansson的电影有哪些?这里,在第二个问题中的“他”指响应中的人,而不是来自用户输入中的人。更复杂的例子如下:Q1:谁在Kramervs.Kramer中扮演主角?A1:MerylStreep和DustinHoffman。Q2:他的更多电影有哪些?A2:这里是一些DustinHoffman的电影…[DustinHoffman电影的列表]。Q3:她的更多电影有哪些?这里,在Q2中的“他的”和在Q3中的“她的”指回到响应A1。在这些情况下,在理解用户意图时,单独的自然语言处理器是无效的。在以下描述的几个实施例中,语言处理器与对话状态引擎以及特定于领域的信息一起工作,其中特定于领域的信息指示实体的男性和女性属性,这能够帮助解决这些对之前对话交流的代词指代。进行用户对话的系统面临的另一个挑战是对用户意图变化的确定,即使是在同一领域内。例如,用户可能以寻找例如娱乐领域中的问题的答案开始。在进行探索更多关于那个问题的对话的同时,决定寻求完全不同的意图路径。当前系统期望用户提供发起新对话的明确提示。如果用户未能提供那个重要提示,则系统响应仍将限制在用户已经下降到的探索路径的狭小范围,并且将用户的输入限制到那个狭小的上下文,这通常导致就算不是荒谬的也是不想要的响应。当用户选择在对话中间切换领域时,弄错上下文的结果本文档来自技高网
...
在对话交互系统中推断搜索输入中的用户意图的方法和系统

【技术保护点】
一种基于解决搜索输入的歧义部分来推断搜索输入中的用户意图的方法,所述方法包括:提供对一组内容项的访问,每个内容项都与描述相应内容项的元数据相关联,与内容项相关联的元数据包括与内容项相关联的实体之间的关系的映射;接收来自用户的搜索输入,用户意图将搜索输入用来识别至少一个期望的内容项,其中所述搜索输入包括:包含至少一个指定实体的第一部分,和包含对与所述至少一个期望的内容项有关的至少一个未指定实体的引用的第二部分,其中第二部分中的至少一个未指定实体不同于第一部分中的至少一个指定实体;在没有进一步用户输入的情况下:基于所述至少一个指定实体以及实体之间的关系的映射,推断所述第二部分中的至少一个未指定实体的可能含义;基于所述至少一个未指定实体的所推断的可能含义、所述至少一个指定实体、和与所述一组内容项中的内容项相关联的元数据,从所述一组内容项中选择至少一个共同内容项,其中所述至少一个共同内容项与至少一个指定实体和关系的映射中的至少一个未指定实体中的每一个有关;以及响应于从用户接收到的搜索输入,向用户呈现所选择的至少一个共同内容项。

【技术特征摘要】
2012.07.20 US 61/673,867;2012.10.11 US 61/712,721;1.一种基于解决搜索输入的歧义部分来推断搜索输入中的用户意图的方法,所述方法包括:提供对一组内容项的访问,每个内容项都与描述相应内容项的元数据相关联,与内容项相关联的元数据包括与内容项相关联的实体之间的关系的映射;接收来自用户的搜索输入,用户意图将搜索输入用来识别至少一个期望的内容项,其中所述搜索输入包括:包含至少一个指定实体的第一部分,和包含对与所述至少一个期望的内容项有关的至少一个未指定实体的引用的第二部分,其中第二部分中的至少一个未指定实体不同于第一部分中的至少一个指定实体;在没有进一步用户输入的情况下:基于所述至少一个指定实体以及实体之间的关系的映射,推断所述第二部分中的至少一个未指定实体的可能含义;基于所述至少一个未指定实体的所推断的可能含义、所述至少一个指定实体、和与所述一组内容项中的内容项相关联的元数据,从所述一组内容项中选择至少一个共同内容项,其中所述至少一个共同内容项与至少一个指定实体和关系的映射中的至少一个未指定实体中的每一个有关;以及响应于从用户接收到的搜索输入,向用户呈现所选择的至少一个共同内容项。2.如权利要求1所述的方法,还包括提供用户偏好签名,所述用户偏好签名描述用户对(i)特定的内容项和(ii)与内容项相关联的元数据中至少一个的偏好,其中推断所述至少一个未指定实体的可能含义还基于搜索输入的部分与由用户偏好签名描述的用户偏好的比较。3.如权利要求1所述的方法,还包括:提供用户偏好签名,所述用户偏好签名描述用户对(i)特定的内容项和(ii)与内容项相关联的元数据中至少一个的偏好;及基于由用户偏好签名描述的用户偏好预订所述至少一个共同内容项。4.一种基于解决搜索输入的歧义部分来推断搜索输入中的用户意图的系统,包括:一个或多个处理器,被配置为:提供对一组内容项的访问,每个内容项都与描述相应内容项的元数据相关联,与内容项相关联的元数据包括与内容项相关联的实体之间的关系的映射;接收来自用户的搜索输入,用户意图将搜索输入用来识别至少一个期望的内容项,其中所述搜索输入包括:包含至少一个指定实体的第一部分,和包含对与所述至少一个期望的内容项有关的至少一个未指定实体的引用的第二部分,其中第二部分中的至少一个未指定实体不同于第一部分中的至少一个指定实体;在没有进一步用户输入的情况下:基于所述至少一个指定实体以及实体之间的关系的映射,推断所述第二部分中的至少一个未指定实体的可能含义;基于所述至少一个未指定实体的所推断的可能含义、所述至少一个指定实体、和与所述一组内容项中的内容项相关联的元数据,从所述一组内容项中选择至少一个共同内容项,其中所述至少一个共同内容项与至少一个指定实体和关系的映射中的至少一个未指定实体中的每一个有关;以及响应于从用户接收到的搜索输入,向用户呈现所选择的至少一个共同内容项。5.如权利要求4所述的系统,其中所述一个或多个处理器还被配置为:提供用户偏好签名,所述用户偏好签名描述用户对(i)特定的内容项和(ii)与内容项相关联的元数据中至少一个的偏好,及基于搜索输入的部分与由用户偏好签名描述的用户偏好的比较,推断所述至少一个未指定实体的可能含义。6.如权利要求4所述的系统,其中所述一个或多个处理器还被配置为:提供用户偏好签名,所述用户偏好签名描述用户对(i)特定的内容项和(ii)与内容项相关联的元数据中至少一个的偏好;及基于由用户偏好签名描述的用户偏好预订所述至少一个共同内容项。7.一种推断搜索输入中的用户意图的计算机实现的方法,所述方法包括:接收一组内容项的信息,每个所述内容项与描述相应内容项的元数据相关联,并且每个所述内容项与至少一个信息域相关联;在一个或多个处理器处接收来自用户的搜索输入,用户意图将搜索输入用来识别至少一个期望的内容项;由一个或多个处理器推断搜索输入的第一部分包含具有多个可能含义的至少一个词的短语,其中多个可能含义中的每个可能含义与相应信息域相关联;由一个或多个处理器部分地基于所述搜索输入的第二部分而不是基于所述搜索输入的第一部分来确定与所述搜索输入相关的至少一个信息域;由一个或多个处理器基于所述搜索输入和被确定为与所述搜索输入相关的至少一个信息域而从所述多个可能含义中选择所述短语的一个可能含义;和由一个或多个处理器基于搜索输入、所述短语的一个可能含义、以及与所述内容项相关联的元数据来选择所述搜索输入的结果,其中所述结果包括来自所述一组内容项的至少一个内容项。8.如权利要求7所述的方法,还包括提供用户偏好签名,所述用户偏好签名描述用户对(i)特定的内容项和(ii)与内容项相关联的元数据中至少一个的偏好,其中选择所述短语的一个可能含义还基于搜索输入的部分与由用户偏好签名描述的用户偏好的比较。9.如权利要求7所述的方法,还包括:提供用户偏好签名,所述用户偏好签名描述用户对(i)特定的内容项和(ii)与内容项相关联的元数据中至少一个的偏好;及基于由用户偏好签名描述的用户偏好预订所述至少一个内容项。10.一种推断搜索输入中的用户意图的系统,所述系统包括:处理器,被配置为:接收一组内容项的信息,每个所述内容项与描述相应内容项的元数据相关联,并且每个所述内容项与至少一个信息域相关联;接收来自用户的搜索输入,用户意图将搜索输入用来识别至少一个期望的内容项;推断搜索输入的第一部分包含具有多个可能含义的至少一个词的短语,其中多个可能含义中的每个可能含义与相应信息域相关联;部分地基于所述搜索输入的第二部分而不是基于所述搜索输入的第一部分来确定与所述搜索输入相关的至少一个信息域;基于所述搜索输入和被确定为与所述搜索输入相关的至少一个信息域而从所述多个可能含义中选择所述短语的一个可能含义;和基于搜索输入、所述短语的一个可能含义、以及与所述内容项相关联的元数据来选择所述搜索输入的结果,其中所述结果包括来自所述一组内容项的至少一个内容项。11.如权利要求10所述的系统,其中所述处理器还被配置为提供用户偏好签名,所述用户偏好签名描述用户对(i)特定的内容项和(ii)与内容项相关联的元数据中至少一个的偏好,其中选择所述短语的一个可能含义还基于搜索输入的部分与由用户偏好签名描述的用户偏好的比较。12.如权利要求10所述的系统,其中所述处理器还被配置为:提供用户偏好签名,所述用户偏好签名描述用户对(i)特定的内容项和(ii)与内容项相关联的元数据中至少一个的偏好;及基于由用户偏好签名描述的用户偏好预订所述至少一个内容项。13.一种在与具有一个或多个处理器的交互性内容提供系统进行持续的用户交互期间推断对话会话的变化的计算机实现的方法,所述方法包括:提供对一组内容项的访问,每个所述内容项都具有在电子可读介质中存储的描述相应内容项的相关联的元数据;在一个或多个处理器接收来自用户的第一输入,第一输入包括用户意图用来识别至少一个期望的内容项的语言元素;由一个或多个处理器将第一输入的至少一个语言元素与第一对话会话相关联;由一个或多个处理器基于第一输入并且基于与内容项相关联的元数据提供第一响应;在一个或多个处理器接收来自该用户的第二输入;由一个或多个处理器推断来自该用户的第二输入是否与和第一对话会话相关联的至少一个语言元素有关;在其中第二输入被推断为与和第一对话会话相关联的至少一个语言元素有关的情况下,由一个或多个处理器基于与内容项相关联的元数据、第二输入以及和第一对话会话相关联的第一输入的至少一个语言元素来提供第二响应;及在其中第二输入被推断为与和第一对话会话相关联的至少一个语言元素无关的情况下,由一个或多个处理器基于与内容项相关联的元数据以及第二输入来提供第二响应。14.如权利要求13所述的方法,其中由一个或多个处理器推断来自用户的第二输入是否与和第一对话会话相关联的至少一个语言元素有关是基于对第二输入是否包含语言链接元素的确定。15.如权利要求14所述的方法,在其中第二输入不包含语言链接元素的情况下,还包括以下:由一个或多个处理器基于与内容项相关联的元数据,确定(i)第二输入的语言元素和(ii)与第一对话会话相关联的至少一个语言元素之间的关联性程度;在其中关联性程度等于或大于阈值的情况下,由一个或多个处理器进行的推断断定第二输入与和第一对话会话相关联的至少一个语言元素有关;及在其中关联性程度小于阈值的情况下,由一个或多个处理器进行的推断断定第二输入与和第一对话会话相关联的至少一个语言元素无关。16.如权利要求13所述的方法,其中由一个或多个处理器推断来自用户的第二输入是否与和第一对话会话相关联的至少一个语言元素有关包括:由一个或多个处理器识别与识别至少一个实体的第一对话会话相关联的语言元素;由一个或多个处理器识别第二输入的语言链接元素;由一个或多个处理器确定第二输入的语言链接元素是否是到与识别至少一个实体的所述第一...

【专利技术属性】
技术研发人员:R·巴尔维M·阿拉瓦穆丹S·万卡塔拉曼G·威林格
申请(专利权)人:韦韦欧股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1