通过消歧对话问题来进行查询消歧制造技术

技术编号:22334418 阅读:52 留言:0更新日期:2019-10-19 13:05
在各种示例中,存在一种信息检索系统,其具有存储项目的索引的存储器,每个项目具有多个特征中的一个或多个特征。对于每个项目,索引包括该项目的特征的指示;并且至少根据特征来配置。存储器存储关于项目的特征的多个问题。信息检索系统具有问题选择器,该问题选择器至少基于关于项目的问题的预期信息增益来选择至少一个问题。搜索组件使用从用户接收的所选择的问题的答案来搜索索引。

【技术实现步骤摘要】
【国外来华专利技术】通过消歧对话问题来进行查询消歧
技术介绍
信息检索是一项复杂的工程任务,特别是随着要搜索的项目的数量不断增加,终端用户检索相关项目的需求不断增长,并且越来越多地涉及使用小型资源受限设备,诸如智能手表、增强现实计算设备、智能手机和其他电子设备。通常,用户发现很难回忆可能对检索特定项目有用的特定事实。这在一般web搜索的情况下是一个问题,并且在作为操作系统、电子邮件客户端或用于搜索项目的个人集合的其他软件应用的一部分而提供的搜索工具的情况下也是一个问题。在用于搜索项目的个人集合的搜索工具被用在移动设备或其他资源受限设备上的情况下,终端用户特别难以检索特定项目。例如,当读者不能准确地回忆关于电子邮件的事实时,读者可能在尝试从他或她的电子邮件的个人集合中检索特定电子邮件时感到沮丧。搜索个人集合中的项目(诸如电子邮件、博客帖子、文本消息、文件、图像和其他内容项目的个人集合)对于终端用户来说通常是耗时且繁重的。为了有效地利用搜索项目的个人集合的当前搜索系统,用户需要理解高级查询语法,这对很多用户来说是一个重大的障碍。下面描述的实施例不限于解决已知的信息检索系统的任何或所有缺点的实现。
技术实现思路
以下呈现本公开的简化概述,以便向读者提供基本的理解。本“
技术实现思路
”不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。其唯一目的是以简化的形式呈现本文中公开的一些概念,作为稍后呈现的更详细地描述的序言。在各种示例中,存在一种信息检索系统,其具有存储项目的索引的存储器,每个项目具有多个特征中的一个或多个特征。对于每个项目,索引包括该项目的特征的指示;并且至少根据特征来配置。存储器存储关于项目的特征的多个问题。信息检索系统具有问题选择器,该问题选择器至少基于关于项目的问题的预期信息增益来选择至少一个问题。搜索组件使用从用户接收的所选择的问题的答案来搜索索引。通过参考结合附图考虑的以下详细描述,将更容易理解很多附带特征。附图说明从以下结合附图阅读的详细描述中将能更好地理解本说明书,在附图中:图1是作为搜索引擎的一部分或在终端用户设备上部署的信息检索系统100的示意图;图1A是图1的信息检索系统的用户界面的第一视图的示意图;图1B是图1的信息检索系统的用户界面的第二视图的示意图;图1C是图1的信息检索系统的用户界面的第三视图的示意图;图1D是图1的信息检索系统的用户界面的第四视图的示意图;图1E是图1的信息检索系统的用户界面的第五视图的示意图;图2是图1的信息检索系统的一种操作方法的流程图;图3是图1的信息检索系统的另一操作方法的流程图;图4是表示关于用户对问题的可回答性的信念的概率分布的示意图;图5是图3的方法的一部分的更详细的流程图;图6示出了信息检索系统的实施例在其中实现的示例性的基于计算的设备。在附图中,相同的附图标记用于表示相同的部分。具体实施方式以下结合附图提供的详细描述旨在作为本示例的描述,而非旨在表示构造或利用本示例的唯一形式。该描述阐述了示例的功能以及用于构造和操作示例的操作序列。然而,可以通过不同的示例来实现相同或等同的功能和序列。尽管本文中将一些本示例描述和示出为在电子邮件搜索系统中实现,但是所描述的系统是作为示例而非限制来提供的。如本领域技术人员将理解的,本示例适用于各种不同类型的信息检索系统,包括一般web搜索和个人集合的搜索,诸如电子邮件、图像、文件、博客帖子和其他项目的个人集合。图1是信息检索系统100的示意图,该信息检索系统100被部署为云服务和/或被部署为在诸如增强现实计算设备112、智能电话114、平板计算机116、智能手表118和其他终端用户计算设备等终端用户计算设备处的操作系统或软件应用的一部分。在信息检索系统100提供云服务的情况下,终端用户计算设备(诸如台式计算机122、膝上型计算机124和智能电话126)可以通过诸如因特网、内联网或任何其他通信网络等通信网络120访问。信息检索系统检索项目或项目的引用或地址,其中这些项目是任何内容项目110。内容项目的示例的非详尽列表是:电子邮件、图像、视频、文件、博客文章、文本消息、文档。内容项目是诸如可以通过一般web搜索找到的一般项目,或者是个人内容项目。个人内容项目与特定用户相关联,例如,由于该用户创作或者已经被该用户接收或编辑。但是,内容项目不必是用户特定的个人内容项目。这些项目位于终端用户计算设备和/或通过诸如因特网、内联网或任何其他通信网络等通信网络120与终端用户计算设备通信的实体处。信息检索系统包括存储多个问题的存储装置102、搜索组件104、用户界面106、问题选择器108和索引128。信息检索系统100是使用以下中的任何一个或多个实现的计算机:软件、硬件、固件。存储在存储装置102中的问题是关于项目110的,并且这些问题在某些情况下是预先指定的,或者是使用模板和/或使用生成机器学习模型或以其他方式自动创建的。在某些情况下,问题是使用生成机器学习模型生成的。在这种情况下,信息检索系统包括用于生成问题的生成机器学习模型,这些问题然后存储在存储装置102中。每个项目具有一个或多个特征,诸如项目的地址的一部分、与项目的创建相关联的时间或其他特征。在某些情况下,问题可以用是/否/不知道答案来回答,但这不是必要的,因为问题可能有潜在答案,即评级、类别或者不是是/否/不是知道答案的其他类型的答案。在电子邮件的个人集合中搜索的示例中,特征是:电子邮件是否是在最后一天内发送的电子邮件是否是由用户发送的(该用户拥有电子邮件的个人集合)电子邮件是否是在上周内发送的电子邮件是否是专门发送给用户的电子邮件是否是在上个月内发送的电子邮件是否是在抄送(cc)给用户的情况下发送的电子邮件是否是由用户的前三个最频繁的发送者之一发送的。在自动生成问题的情况下,可以使问题针对特定用户的项目集合进行定制。例如,给定多种可能类型的问题,使用来自特定用户的项目集合的特征生成这些类型的问题的实例。计算描述用户的项目集合的统计信息,诸如最常见的电子邮件发件人、最常访问的图像或其他统计信息,并且这些统计信息用于创建问题类型的实例。在一些示例中,关于与问题相关联的概率的信息也存储在存储装置102中。概率在下面更详细地描述。在一些示例中,对于每个单独的问题,概率包括特定用户可以回答该问题的概率。在某些情况下,对于每个单独的问题,概率包括任何用户可以回答该问题的概率。在一些示例中,在在线训练过程期间由问题选择器108学习概率。这里使用术语“在线”来表示在信息检索系统100的操作期间进行训练以检索内容项目110。存储在存储装置102中的关于概率的信息可以包括概率分布的统计信息(诸如均值和方差)、来自概率分布的样本或关于概率的其他信息。在一些情况下,存储在存储装置102中的关于概率的信息以图形模型或基于神经网络的模型的形式被保存。搜索组件104包括用于搜索索引128以从索引中检索与查询相关的项目的有序列表的排序算法。可以使用任何公知的排序算法。在一些情况下,排序算法是问题选择器108的一部分,如下所述。用户界面106是诸如在触摸屏或增强现实显示器上的图形用户界面,或者用户界面106是听觉界面、或者能够向用户呈现问题并且从用户接收这些问题的答案的任本文档来自技高网...

【技术保护点】
1.一种信息检索系统,包括:存储器,存储项目的索引,每个项目具有多个可能特征中的一个或多个特征;其中对于每个项目,所述索引包括所述项目的所述特征的指示;以及其中所述索引至少根据所述特征被配置;所述存储器存储关于所述项目的所述特征的多个问题;问题选择器,被配置为至少基于关于所述项目的所述问题的预期信息增益,来选择所述问题中的至少一个问题;以及搜索组件,被配置为使用从用户接收的所选择的所述问题的一个或多个答案,来搜索所述索引。

【技术特征摘要】
【国外来华专利技术】2016.12.06 GB 1620714.4;2017.03.04 US 15/449,9571.一种信息检索系统,包括:存储器,存储项目的索引,每个项目具有多个可能特征中的一个或多个特征;其中对于每个项目,所述索引包括所述项目的所述特征的指示;以及其中所述索引至少根据所述特征被配置;所述存储器存储关于所述项目的所述特征的多个问题;问题选择器,被配置为至少基于关于所述项目的所述问题的预期信息增益,来选择所述问题中的至少一个问题;以及搜索组件,被配置为使用从用户接收的所选择的所述问题的一个或多个答案,来搜索所述索引。2.根据权利要求1所述的信息检索系统,其中所述存储器存储关于与所述问题相关联的概率的信息,所述概率表示问题能够被回答的可能性。3.根据权利要求2所述的信息检索系统,其中所述存储器存储所述概率,使得所述概率是用户特定的。4.根据权利要求2所述的信息检索系统,其中所述存储器存储所述概率,使得所述概率包括对很多用户通用的概率。5.根据权利要求2至4中任一项所述的信息检索系统,其中所述问题选择器在所述信息检索系统的操作期间使用观察到的答案在线更新所述概率。6.根据权利要求2至5中任一项所述的信息检索系统,其中所述问题选择器通过对问题被选择的次数和问题被回答的次数进行计数,来计算关于概率的所述信息。7.根据权利要求2至6中任一项所述的信息检索系统,其中所述问题选择器通过更新概率分布的参数,来计算关于概率的所述信息,所述概...

【专利技术属性】
技术研发人员:M·沃南兹K·霍夫曼F·A·拉德林斯基B·布洛斯特
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1