【技术实现步骤摘要】
【国外来华专利技术】通过使用深度模型来构建查询的答案
技术介绍
[0001]计算机实现的搜索引擎被配置为接收查询并标识网页,该网页被搜索引擎视为包括与所接收的查询相关的内容。在操作中,传统搜索引擎从客户端计算设备接收查询,基于该查询在网页索引上进行搜索以标识与查询相关的多个网页,此后基于查询的特征和多个网页的特征对多个网页进行排名。然后,搜索引擎构建搜索引擎结果页面(SERP)并使SERP被传输到从其接收查询的客户端计算设备。SERP包括搜索结果的排名列表,其中搜索结果表示网页。
[0002]相对最近,搜索引擎已被配置为直接提供对基于事实的问题的答案;例如,当从客户端计算设备接收到查询“乔治华盛顿的生日”时,搜索引擎可以将查询的答案(1732年2月22日)作为SERP的一部分返回给客户端计算设备,其中SERP还包括搜索结果的排名列表。因而,提交查询的用户不需要选择SERP上的超链接来获取查询的答案。
[0003]另外,对于某些查询,传统的搜索引擎已经被配置为以列表形式返回答案。例如,当传统的搜索引擎接收到“世界上人口最多的国家”的查询时,搜索引擎可以返回包含若干列表元素的列表,其中该列表元素是世界所有国家当中人口最多的国家的标识。目前,通过离线构建列表,针对这些列表生成可搜索的列表索引,并且将列表存储在计算机可读存储装置中来,实现了这种类型的功能性。因此,当搜索引擎从客户端计算设备接收查询时,搜索引擎在列表索引上进行搜索以标识与查询相关的一个或多个列表,计算列表的得分(其中列表的得分表示该列表与查询有多相关),将得分当中的最高得分与预定义阈值进行 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种在至少一个处理器执行搜索引擎时由所述处理器执行的方法,所述方法包括:基于从客户端计算设备接收的查询来将网页标识为与所述查询相关,所述客户端计算设备与所述至少一个处理器网络通信;响应于标识所述网页,取回所述网页;从所述网页的内容构建答案,其中所述答案是列表形式,其中所述答案包括:第一元素,所述第一元素包括所述网页的第一文本;以及第二元素,所述第二元素包括所述网页的第二文本,其中所述第一文本和所述第二文本在所述答案中相邻,但在所述网页中被第三文本隔开;以及将所述答案传输到所述客户端计算设备,其中所述客户端计算设备被配置为通过与所述客户端计算设备相关联的输出接口向所述客户端计算设备的用户呈现所述答案。2.根据权利要求1所述的方法,还包括:响应于取回所述网页并且在构建所述答案之前,生成所述网页的第一表示和所述网页的第二表示,其中所述网页的所述第一表示与所述网页的所述第二表示彼此不同;将所述网页的所述第一表示提供给计算机实现的第一深度模型,所述计算机实现的第一深度模型被配置为基于被提供给所述计算机实现的第一深度模型的网页表示的文本来构建查询的答案;以及将所述网页的所述第二表示提供给计算机实现的第二深度模型,所述计算机实现的第二深度模型被配置为基于被提供给所述计算机实现的第二深度模型的网页表示的文本来构建查询的答案,其中所述答案由所述计算机实现的第一深度模型基于所述网页的所述第一表示来构建。3.根据权利要求2所述的方法,其中生成所述网页的所述第一表示和所述第二表示包括:在所述网页中划定第一片段和第二片段之间的边界,其中所述第一片段被包括在所述第一表示中并且所述第二片段被包括在所述第二表示中。4.根据权利要求2所述的方法,其中生成所述网页的所述第一表示和所述第二表示包括:在所述网页的HTML代码中标识列表标签,其中所述第一表示是基于在所述HTML代码中标识的列表标签而被生成的。5.根据权利要求2所述的方法,其中所述计算机实现的第二深度模型基于所述网页的所述第二表示来构建第二答案,其中所述第二答案不同于所述第一答案,所述方法还包括:计算所述答案的第一得分;计算所述第二答案的第二得分;以及基于相对于所述第二得分的所述第一得分来选择所述答案。6.根据权利要求2所述的方法,其中所述网页的所述第一表示包括第一片段和第二片段,其中所述第一片段是所述第一文本并且具有第一多个词,并且所述第二片段是所述第二文本并且具有第二多个词,并且进一步其中从所述网页的所述文本构建所述答案包括:将所述第一片段编码为第一向量,其中所述第一向量表示所述第一片段的语义含义;以及将所述第二片段编码为第二向量,其中所述第二向量表示所述第二片段的语义含义,
其中所述第一向量和所述第二向量具有相同的长度,并且进一步其中所述答案是基于所述第一向量和所述第二向量而被构建的。7.根据权利要求6所述的方法,其中从所述网页的所述文本构建所述答案还包括:提供所述第一向量和所述第二向量作为循环神经网络(RNN)的顺序输入;以及由所述RNN生成包括第三向量和第四向量的顺序输出,其中所述第三向量表示所述第一片段,并且所述第四向量表示所述第二片段,并且进一步其中所述答案是基于所述第三向量和所述第四向量而被构建的。8.根据权利要求7所述的方法,其中从所述网页的所述文本构建所述答案还包括:提供所述第三向量和所述第四向量作为第二RNN的顺序输入,其中所述第二RNN关注所述查询的编...
【专利技术属性】
技术研发人员:吴箫剑,D,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。