在对话交互中消除用户意图歧义制造技术

技术编号:11696691 阅读:119 留言:0更新日期:2015-07-08 19:03
一种在用于信息检索的对话交互中消除用户意图歧义的方法。该方法包括提供对内容项集合的访问,其中内容项具有描述该内容项的元数据,并且提供对结构化知识的访问,其中结构化知识示出内容项之间的语义关系和链接。该方法还包括提供用户偏好签名、接收来自用户的第一输入、并且确定第一输入的歧义指数,其中用户想要第一输入识别至少一个期望的内容项。如果歧义指数高,则该方法基于第一输入以及结构化知识、用户偏好签名、用户的位置和第一输入的时间中的至少一个来确定查询输入,并且基于将该查询输入与和内容项相关联的元数据进行比较来选择内容项。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】在对话交互中消除用户意图歧义相关申请交叉引用本申请要求以下专利申请的权益,其内容通过引用被结合于此:于2013 年 3 月 13 日提交的标题为“Disambiguating User Intent inConversat1nal Interact1n System for Large Corpus Informat1n Retrieval,,的美国专利申请N0.13/801,812 ;及于2012 年 7 月 31 日提交的标题为“Disambiguating User Intent inConversat1nal Interact1n System for Large Corpus Informat1n Retrieval,,的美国临时专利申请N0.61/677,895。
本专利技术涉及在用于信息检索的对话交互系统中用于消除用户意图歧义的方法,并且更具体地涉及利用结构化信息和用户偏好的技术。
技术介绍
本专利技术涉及在用于大型语料信息检索的对话交互系统中用于“最优地”和“智能地”消除用户意图/输入的歧义的方法,其中意图/输入具有一种或多种的以下歧义:(1)词汇歧义(多个合格响应在词汇上与用户输入匹配)或(2)语义歧义,其中歧义在于时间(基于时间属性的多个合格响应),或者歧义在于位置(基于位置属性的多个合格响应),或者歧义在于任何内容属性或内容属性的组合(基于用户指定的一个或多个内容属性的多个合格响应)或者仅仅是在用户请求固有的非特殊性中产生的又导致多个合格响应的歧义(例如,宽泛的意图请求)。在本公开内容中描述的“最优”消除歧义方法的实现使得系统能够问最少量的澄清问题(在理想的情况下,根本不问任何问题)来理解用户意图。本公开内容中描述的“智能”消除歧义方法的实现使得系统能够自然地进行消除歧义的交流,类似于人类在对话中澄清歧义的方式。该系统利用特定于领域的结构化知识、时间、用户的位置(如果可以得到的话)、以及用户偏好签名(如果可以得到的话)来执行最优的和智能的歧义消除。本公开内容中描述的方法是语言无关的并且在特定于语言的模块的帮助下可以被应用到多种语言。此外,本文公开的方法尤其适于具有高度语义歧义和冲突的大型语料信息库,其中高度语义歧义和冲突是由于库中的给定实体或概念可以以多种方式被引用并且同一词语会在不同含义的上下文中出现的事实引起的。对话系统的关键性能度量不是当用户意图/输入没有歧义时它的响应多好地匹配用户意图,而是当用户意图/输入具有歧义时它如何响应。好的对话系统在其可能的响应策略的技能中不具有喷出大量响应的奢侈条件一一像搜索引擎将喷出结果那样,即使在用户输入/意图中存在歧义。对于搜索引擎而言,以某种相关性顺序为歧义的输入/意图显示所有的结果将会被赞美为好搜索引擎的标志。在对话系统中为歧义的用户输入/意图采用相同的方法将相当于在星巴克令人疑惑地遇到过分热心的销售人员,只因为用户健忘地不能描述用户脑中特定种类的咖啡(例如,Caffe Latte),销售人员就一口气地说出十种咖啡选项。这里,尽管销售人员清楚地理解意图是咖啡(而不是茶),但是销售人员没有留意存在许多与意图匹配的选项的事实一一更聪明的销售人员可能会说“噢,有多种咖啡可选,你想让我给你快速过一遍这些选项吗? ”本公开内容在宽泛意义上使用术语“歧义”来捕获当存在匹配用户输入的多个合格响应(有一个以下提到的例外)时的情形。如在本公开内容中所使用的,术语“歧义”的含义的一个例子可以从以下例子中得到理解:尽管好的对话系统将致力于理解用户意图并产生最简洁的针对性的响应,其中取决于问题,该响应可以理想地只是一个简洁的响应(例如,问题“今晚SOX比赛吗? ”可能产生只显示red sox比赛的时间和地点的响应,其中redsox是根据用户的签名推断出的),但是这并不一定暗示所有的用户问题都产生单个响应。这也不暗示对问题提供多个选项将是次优的。例如,如果用户陈述“给我显示附近的星巴克”,则最好的响应将是显示标有所有靠近该用户的星巴克结果的地图,使得用户可以从可视化地图中毫不费劲地选出任何一个。即使对于诸如“给我显示附近的餐馆”之类的更宽泛的意图请求,在地图上显示多个响应也是系统可以提供的最好响应。在这两个例子中意图都是清楚的一一但是响应在某种意义上是“歧义”的,因为它多于一个一一系统不知道用户会喜欢哪个特定的餐馆。但如果存在用户偏好签名,则它可以产生从其它响应中突出的具有最优选的星巴克/餐馆的响应。在以上提到的这些例子中,多个响应并不真正是歧义响应,而是都与用户意图匹配的一组“选项”(当然用户可能由于主观原因仍不选择星巴克或餐馆)。这里使用“选项”一词是为了与“响应”区分,以显示用户想要多个选项一一而不是只有一个选项(即使系统有用户偏好签名,它仍将提供多个“选项”)。另一个例子是--“给我显示Meryl Streep的电影(movies) ”。在这个例子中,用户想要Meryl Streep的多个电影以便从中“选择”。在本公开内容中描述的方法将着重于其中歧义(或多个合格响应)源于不能提供可通过良好的置信度被认为是与用户意图相匹配的一个清楚的“选项”或一组“选项”的情况。而且,当用户想要特定的一个或多个选项时,虽有挑选那个特定的选项或选项集合的词汇和/或语义歧义,但是负担落在系统上。这种歧义不是由于系统的缺陷或“缺少智能”,而正是由于用户提交的问题中的固有歧义(词汇或语义)。本公开内容中描述的方法将着重于为其中由于用户意图/输入中的固有歧义而不可能提供一组选项的这些歧义情况消除歧义的方法。星巴克/餐馆和“Meryl Streep"的响应是无需歧义解决方案的最好情况的情形。这些系统响应与上面提到的对问题“今晚有sox比赛吗”的简洁响应简直一样好——多个响应是“选项”而不是响应中有歧义。在本公开内容中还使用“歧义” 一词来处理例外情况一一当根本不存在与用户意图/输入相匹配的响应时。在这种边界条件下,歧义可能是由于多种多样的原因,从用户没有正确地表达意图到仅仅是在信息领域空间中不存在匹配。例如,如果用户问“今晚有SOX比赛吗”,但是今晚没有任何SOX比赛,那么这就是其中不存在与用户想看比赛的意图的匹配的例子。从严格的请求/响应来说,这里不存在歧义。但是在人类交互中,当用户表达不可被满足的意图时,会产生合理的问题“我能给用户提供可能接近满足原来意图的东西吗? ”。通常,提供接近的替代选项的响应常会被赞赏。在“今晚有SOX比赛吗”的例子中,响应“今晚没有,但是有一场昨天晚上你错过的比赛”(这种响应可以利用用户的偏好签名和过往历史记录来创建)。本专利技术的实施例将这种无响应的情况视为“空(null)响应歧义”的情况,并且产生尽量接近满足用户意图的响应。另一个例子是,“X和Y—起演过电视剧吗? ”。假设X和Y从来没有一起演过电视剧,那么本专利技术的实现将利用特定于领域的结构化知识来产生“没有,他们没有一起演过电视剧,但是回到1989年他们确实在电影Z中一起主演过”。这里,特定于领域的结构化知识被用于产生对“空响应歧义”情况的响应。本公开内容中描述的大多数歧义的例子主要基于数字娱乐空间。但是,本公开内容中描述的方法可以应用到任何信息领域(娱乐、诸如电子邮件、通本文档来自技高网...

【技术保护点】
一种在用于信息检索的对话交互中消除用户意图歧义的方法,该方法包括:提供对内容项集合的访问,每个内容项都与描述相应内容项的元数据相关联;提供对结构化知识的访问,结构化知识表示内容项之间的语义关系和链接;提供用户偏好签名,用户偏好签名描述用户对(i)特定内容项和(ii)与内容项相关联的元数据中的至少一个的偏好;接收来自用户的第一输入,用户想要第一输入识别至少一个期望的内容项;确定第一输入的歧义指数;在歧义指数超过第一阈值的条件下,基于结构化知识、用户偏好签名、用户的位置和第一输入的时间中的至少一个以及第一输入来确定查询输入,并且基于将该查询输入与和内容项子集相关联的元数据进行比较来从内容项集合中选择内容项子集;以及在歧义指数没有超过第一阈值的条件下,基于将第一输入与和内容项子集相关联的元数据进行比较来从内容项集合中选择内容项子集。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:M·阿拉瓦穆丹R·巴尔维S·万卡塔拉曼V·阿加瓦尔A·萨瓦尔卡G·拉马默尔赛A·N·莫海迪恩佩瑟迪恩K·C·S·雷迪
申请(专利权)人:韦韦欧股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1