用于识别相关实体的方法、系统和装置制造方法及图纸

技术编号:18658064 阅读:42 留言:0更新日期:2018-08-11 14:27
本申请涉及用于识别相关实体的方法、系统和装置。用于识别与搜索查询所指向的实体相关的实体的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。一种方法包括接收搜索查询,其中该搜索查询已经被确定与第一实体类型的第一实体相关,并且其中第二实体类型的一个或多个实体与第一实体具有关系;接收针对该搜索查询的搜索结果;确定识别包含对第一实体的引用的资源的搜索结果的计数满足第一阈值;确定识别具有作为相关实体类型的第二实体类型的资源的搜索结果的计数满足第二阈值;并且传送识别第二实体类型的一个或多个实体的信息作为针对该搜索查询的响应的一部分。

Method, system and device for identifying related entities

The application relates to a method, system and device for identifying related entities. Methods, systems and apparatus for identifying entities associated with the entities to which the search query is directed include computer programs encoded on computer storage media. A method includes receiving a search query where the search query has been determined to be associated with a first entity of the first entity type, and where one or more entities of the second entity type have a relationship with the first entity; receiving a search result for the search query; and determining the identification of a reference containing a reference to the first entity. The count of search results for the source satisfies the first threshold; determines that the count of search results identifying resources having a second entity type as the associated entity type satisfies the second threshold; and transmits information identifying one or more entities of the second entity type as part of the response to the search query.

【技术实现步骤摘要】
用于识别相关实体的方法、系统和装置分案说明本申请属于申请日为2013年2月22日的中国专利技术专利申请No.201380020832.3的分案申请。相关申请的交叉引用本申请根据35U.S.C.§119(e)要求于2012年2月22日提交的题为“RelatedEntities”的美国专利申请No.61/601975、于2012年5月16日提交的题为“RelatedEntities”的美国专利申请No.61/647977、以及于2012年6月15日提交的题为“RelatedEntities”的美国专利申请No.61/660637的权益,所有这些申请通过引用全文结合于此。
本说明书涉及互联网搜索系统。
技术介绍
互联网搜索引擎旨在识别例如网页、图像、文本文档或多媒体内容的与用户需求相关的互联网资源并且以对用户最为有用的方式呈现与该资源相关的信息。互联网搜索引擎响应于用户所提交的查询而返回搜索结果的集合。互联网搜索引擎一般包括一个或多个服务,其能够对所接收的特定查询进行分类。这样的服务可以包括将查询分类为以下中的一个或多个的服务:色情的搜索,即寻找色情结果或者针对其返回识别已经被归类为色情的资源的大量搜索结果;导航至特定资源的查询,即寻找特定资源;作为本地查询的查询,即寻找与位于用户附近的商业相关的信息;或者寻找特定信息项的查询,例如查找作为查询中所提出的问题的答案的信息项。
技术实现思路
本说明书描述了涉及识别与搜索查询所指向的实体相关的实体的技术。总体上,本说明书中所描述的主题的一个新颖方面可以以方法来体现,其包括动作:从用户设备接收第一搜索查询,其中该第一搜索查询已经被确定为与第一实体类型的第一实体相关,并且其中第二实体类型的一个或多个实体与第一实体具有预定关系;接收由搜索引擎所提供的针对第一搜索查询的搜索结果,其中该搜索结果中的每一个识别相应资源;确定识别包含对第一实体的引用的资源的搜索结果的计数满足第一阈值;确定识别具有第二实体类型作为相关实体类型的资源的搜索结果的计数满足第二阈值;以及将识别第二实体类型的一个或多个实体的信息作为对于第一搜索查询的响应的一部分传送至用户设备。该方面的其它实施例包括相对应的计算机系统、装置以及记录在一个或多个计算机存储设备上的计算机程序,它们均被配置为执行该方法的动作。一个或多个计算机的系统能够被配置为通过使得安装在系统上的在操作中使得该系统执行该动作的软件、固件、硬件或者它们的组合来执行特定操作或动作。一个或多个计算机程序能够被配置为通过包括在被数据处理装置执行时使得该装置执行该动作的指令来执行特定操作或动作。这些和其它实施例可选地可以包括以下特征中的一个或多个。每个搜索结果可以包括从该搜索结果所识别的相应资源所提取的相应标题和相应文本摘录,并且确定识别包含对第一实体的引用的资源的搜索结果的计数满足第一阈值可以包括:确定搜索结果中所包括的相应标题或相应文本摘录中包括对第一实体的引用的搜索结果的计数满足第一阈值。识别第二实体类型的一个或多个实体的信息可以包括对应于所述一个或多个实体中的每一个实体的相应图像,并且该方法可以进一步包括:针对第二实体类型的所述一个或多个实体中的每一个实体,响应于从该实体的名称所得出的搜索查询而从图像搜索引擎获得对应于该实体的相应图像。针对第二类型的一个或多个实体中的特定实体获得图像可以包括:确定包括特定实体的名称的特定搜索查询是模糊的,包括从搜索引擎针对该特定搜索查询所提供的搜索结果中确定该特定搜索查询不与将多个资源中的每一个映射至特定类型的特定实体的索引中的任何实体相关或者与该索引中多于一个的实体相关;生成第二搜索查询,其包括该特定实体的名称以及以下中的至少一个:对第一实体类型的第一实体的引用或者对第二实体类型的引用;从图像搜索引擎获得针对第二搜索查询的图像搜索结果;并且从针对第二搜索查询的图像搜索结果所识别的图像中针对该特定实体选择图像。该方法可以进一步包括:确定第二搜索查询不是模糊的。从图像搜索结果所识别的图像中针对该特定实体选择图像可以包括:至少部分地基于图像的纵横比来选择图像。该方法可以进一步包括:从针对第一搜索查询的搜索结果确定第一搜索查询与第一实体类型的第一实体相关;包括:使用将多个资源中的每一个映射至特定类型的特定实体的索引确定识别被映射至第一实体的资源的搜索结果的数量超过第三阈值。该方法可以进一步包括:获得将搜索查询分类为不是色情查询、导航至特定资源的查询、本地查询或寻找特定信息项的查询中的任何一个的数据。识别一个或多个实体的信息可以包括识别一个或多个实体中的每一个的名称以及第二实体类型的信息。该方法可以进一步包括:针对第二实体类型的每一个实体确定相应排名分值;并且根据该排名分值对第二实体类型的实体进行排序。第二实体类型的特定实体的排名分值能够至少部分地基于所识别的对特定实体的引用与所识别的对第一实体的引用在由索引引擎所索引的资源中有多频繁地同时出现。第二实体类型的特定实体的排名分值能够至少部分地基于特定实体在提交了指向第一实体的搜索查询之后有多频繁地被用户搜索。第二实体类型的特定实体的排名分值能够至少部分地基于特定实体的全局流行度。第二实体类型的特定实体的排名分值能够至少部分地基于所识别的对特定实体的引用与所识别的对第一实体的引用有多频繁地同时出现在先前所提交的相同搜索查询中。该方法可以进一步包括:访问指示第二实体类型的所述实体中的两个或更多个实体是具有指定顺序的实体集合的成员的数据;并且对第二实体类型的所述两个或更多个实体的顺序进行调整以与所述指定顺序相匹配。该方法可以进一步包括:访问指示第二实体类型的所述实体中的两个或更多个实体更为人所知属于更宽大实体的一部分的数据;并且在对第二实体类型的所述实体的排序中利用该更宽大实体替代第二实体类型的所述两个或更多个实体。该说明书中所描述的主题能够在特定实施例中实施从而实现以下优势中的一个或多个。用户能够容易地查看与他们的搜索查询所指向的实体具有特定关系的实体相关的信息。具体地,用户能够通过向搜索引擎提交识别感兴趣实体的搜索查询而容易地获取识别与感兴趣实体相关的实体的信息。此外,用户能够容易地提交另一个搜索查询以获得关于相关实体的更多信息。用户能够通过查看关于与实体相关的实体的信息而了解其搜索查询所指向的实体。例如,用户能够通过向搜索引擎提交包括特定人的名称的查询而了解到该特定人是作家并且被呈现识别该特定人所写的图书的信息。此外,用户在提交指向实体的查询之后将可能存在的有关该实体的问题能够被预测并且与作为这些问题的答案的实体相关的信息能够作为针对该查询的一部分而被提供给用户,例如用户无需提交另一个搜索查询或者导航至另一个资源以找出该答案。例如,提交指向一个作家的查询的用户可能经常会在以后寻找与该作家所写的特定图书相关的信息。识别那些特定图书的信息可以作为针对该搜索查询的响应的一部分而被呈现给用户,而用户不必提交另外的查询或者导航至该查询的搜索结果所识别的资源。通过提交指向特定类型的实体的搜索查询,用户能够容易地获得与涉及该实体的特定类型的其它实体相关的信息并且提交指向它的查询。该说明书的主题的一个或多个实施例的细节在附图和以下的描述中给出。该主题的其它特征、方面和优势将从该本文档来自技高网...

【技术保护点】
1.一种由一个或多个计算机执行的方法,所述方法包括:对于多个实体中的每一个实体,保存权威性资源索引,所述权威性资源索引将一个或多个权威性资源映射至该实体,其中所述一个或多个权威性资源中的每一个权威性资源是该权威性资源在针对接收到的搜索查询的搜索结果中的出现已经被确定为所述接收到的搜索查询指向该实体的指示符的资源;从用户设备接收第一搜索查询;接收由搜索引擎所提供的针对所述第一搜索查询的搜索结果,其中所述搜索结果中的每一个识别相应资源;基于确定识别在所述权威性资源索引中已经被映射至所述第一实体的资源的针对所述第一搜索查询的搜索结果的计数超过第一阈值数量,确定所述第一搜索查询与第一实体类型的第一实体相关;以及响应于确定所述第一搜索查询与所述第一实体类型的所述第一实体相关,将识别与所述第一实体具有预定关系的、第二实体类型的一个或多个实体的信息作为针对所述第一搜索查询的响应的一部分而传送至所述用户设备。

【技术特征摘要】
2012.02.22 US 61/601,975;2012.05.16 US 61/647,977;1.一种由一个或多个计算机执行的方法,所述方法包括:对于多个实体中的每一个实体,保存权威性资源索引,所述权威性资源索引将一个或多个权威性资源映射至该实体,其中所述一个或多个权威性资源中的每一个权威性资源是该权威性资源在针对接收到的搜索查询的搜索结果中的出现已经被确定为所述接收到的搜索查询指向该实体的指示符的资源;从用户设备接收第一搜索查询;接收由搜索引擎所提供的针对所述第一搜索查询的搜索结果,其中所述搜索结果中的每一个识别相应资源;基于确定识别在所述权威性资源索引中已经被映射至所述第一实体的资源的针对所述第一搜索查询的搜索结果的计数超过第一阈值数量,确定所述第一搜索查询与第一实体类型的第一实体相关;以及响应于确定所述第一搜索查询与所述第一实体类型的所述第一实体相关,将识别与所述第一实体具有预定关系的、第二实体类型的一个或多个实体的信息作为针对所述第一搜索查询的响应的一部分而传送至所述用户设备。2.根据权利要求1所述的方法,其中所述第一实体类型与所述第二实体类型相同。3.根据权利要求1所述的方法,进一步包括:确定所述第二实体类型的所述一个或多个实体与和所述第一搜索查询相关的所述第一实体具有所述预定关系,包括确定相关实体索引将所述第一实体映射至所述第二实体类型的所述一个或多个实体。4.根据权利要求3所述的方法,进一步包括:获取识别所述第一实体和所述第一实体类型的数据;获取识别所述第二实体类型的所述一个或多个实体以及在所述第一实体和所述第二实体类型的所述一个或多个实体之间的所述关系的数据;以及在所述相关实体索引中生成在所述第一实体和所述第二实体类型的所述一个或多个实体之间的映射。5.根据权利要求1所述的方法,进一步包括:至少部分地基于以下数据来对所述第二实体类型的所述一个或多个实体进行排序:该数据针对所述第二实体类型的所述一个或多个实体中的每一个实体识别在提交了指向所述第一实体的查询之后该实体有多频繁地被用户搜索。6.根据权利要求1所述的方法,进一步包括:至少部分地基于对所述第二实体类型的所述一个或多个实体中的每一个实体的名称或者对该实体的所识别的引用与由索引引擎所索引的资源中的所述第一实体的名称或者对所述第一实体的所识别的引用有多频繁地同时出现,来对所述第二实体类型的所述一个或多个实体进行排序。7.根据权利要求1所述的方法,其中识别所述一个或多个实体的所述信息包括与所述相关实体索引中的所述第二实体类型的所述一个或多个实体相关联的元数据。8.根据权利要求1所述的方法,进一步包括:获取识别所述第一实体和所述第一实体类型的数据;获取识别与所述第一实体相关联的一个或多个资源的数据;以及在第二索引中生成在所述第一实体和与所述第一实体相关联的所述一个或多个资源中的每一个之间的相应映射。9.根据权利要求1所述的方法,其中从所述搜索结果中确定所述第一搜索查询与所述第一实体类型的所述第一实体相关进一步包括:确定识别包含对所述第一实体的引用的资源的搜索结果的数量超过第二阈值数量;以及基于(i)确定识别在所述权威性资源索引中已经被映射至所述第一实体的资源的针对所述第一搜索查询的搜索结果的所述计数超过所述第一阈值数量,以及(ii)确定识别包含对所述第一实体的引用的资源的搜索结果的所述数量超过所述第二阈值数量,来确定所述第一搜索查询与所述第一实体相关。10.根据权利要求1所述的方法,其中识别所述一个或多个实体的所述信息包括识别所述一个或多个实体中的每一个的名称以及所述第二实体类型的信息。11.根据权利要求1所述的方法,其中识别所述一个或多个实体的所述信息包括对应于所述一个或多个实体中的每一个的相应图像。12.根据权利要求11所述的方法,其中对于所述一个或多个实体中的每一个实体,对应于该实体的相应图像是响应于从该实体的名称导出的搜索查询而从图像搜索引擎获取的。13.根据权利要求11所述的方法,进一步包括:确定识别与所述第二实体类型有关的资源的搜索...

【专利技术属性】
技术研发人员:彼得·吉恩·洪普拉维尔·K·古普塔纳撒尼尔·J·盖林拉马克里希南·卡吉尤尔曼纳卡维·J·戈埃尔奥默·巴奥杰克·W·门泽尔克里斯蒂娜·R·达纳拉贾里德·L·莱维沙希德哈尔·A·塔库尔格雷斯·钟蔡秉洲
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1