当前位置: 首页 > 专利查询>邻客音公司专利>正文

将搜索结果分面制造技术

技术编号:16048996 阅读:43 留言:0更新日期:2017-08-20 08:43
搜索系统从用户接收包括搜索准则的第一搜索查询。系统执行第一搜索查询以基于搜索准则来检索关于商业联网系统的成员的信息以及基于搜索准则和方面值与用户的相关性的评分来检索关于商业联网系统的一个或多个方面值的附加信息。系统然后使用所述一个或多个检索到的方面值来执行第二搜索查询以确定满足搜索准则并包括所述一个或多个方面值的文档的计数。系统选择方面值的一部分以用于传输给用户,并且在用户设备上显示关于成员、所述一个或多个方面值以及所述一个或多个方面值的计数的信息。

【技术实现步骤摘要】
【国外来华专利技术】将搜索结果分面相关申请本申请要求2014年9月24日提交的美国专利申请序号14/495,351的优先权的权益,该美国专利申请要求2014年8月29日提交的美国临时专利申请序号62/043,661的优先权的权益,这两个美国专利申请被整体地通过引用结合到本文中。
本文中公开的主题一般地关于计算机系统,并且在实施例中关于包括搜索结果的分面(faceting)的搜索系统。相关申请本申请关于2014年7月31日提交的标题为FlexibleOperatorsForSearchQueries的美国临时专利申请号62/031,767,其内容被出于一切目的通过引用结合到本文中。
技术介绍
社交和/或商业联网系统维持关于成千上万人并且有可能数百万人的数据。这些数据可以包括社交联网系统的每个成员的简档。这些简档可以包括关于一个人的教育历史、雇佣历史、技能组合的信息以及关于这个人的其他相关信息。这样的社交联网系统正常地向其用户提供在系统上进行搜索的能力。这些搜索可以针对使用这个人的姓名的系统中的特定人和/或可以包括对满足特定搜索准则的人(诸如在某个工作技能方面有经验的人)的搜索。这些搜索可以返回关于其简档满足搜索的一个或多个准则的成员的信息,并且可以进一步返回关于搜索准则的附加信息或方面(facet)数据。附图说明在附图的各图中通过示例而非限制的方式图示出一些实施例。图1是报告社交联网系统上的方面值和方面计数的示例用户界面。图2A、2B、2C和2D是图示出用于将搜索结果分面的系统和方法的操作和特征的框图。图3是图示出机器的组件的框图,所述机器能够从机器可读介质(例如,机器可读存储介质)读取指令并执行本文中讨论的方法中的任何一个或多个。具体实施方式示例方法和系统针对社交和/或商业联网服务中的搜索引擎,其返回关于提供的搜索准则的方面值和方面计数。示例仅仅代表可能的变化。除非另外明确地说明,否则组件和功能是可选的并且可以被组合或细分,并且操作可以在序列方面改变或者被组合或细分。在以下描述中,出于解释的目的,阐述了许多特定细节以提供对示例实施例的透彻理解。然而,对于本领域的技术人员而言将明显的是,可在没有这些特定细节的情况下实践本主题。分面可以是社交和/或商业联网系统的搜索中的重要特征。简言之,分面提供关于搜索结果的重要辅助信息。例如,如图1中图示的那样,通过运行查询“javamountainview(山景城)”,用户可以被呈现报告具有最高数目的java开发者130的位置(国家)110和公司120的方面。在图1的示例中,“当前公司”被称为方面,而“IBM”、“甲骨文”等被称为方面值。邻近于方面值的号码112、122表示系统中的具有相应方面值的文档的数目。具体地,在图1的示例中,与搜索准则(在本示例中为“javamountainview”)匹配的在给定公司处工作的人的数目称为方面计数。确定方面计数的过程可以称为进行方面计数。用户可以选择方面值,使得将发生搜索结果的过滤。虽然方面可以具有任意数目的分层级别,但在实施例中,两个级别正常地足够(即,方面名称和方面值)。在实施例中,分面支持搜索的提早终止(例如,因为搜索正在识别太多命中,占用太多计算资源和/或花费太长时间)。因此,实施例支持进行近似方面计数。一些方面可能具有非常高的基数。例如,涉及搜索词语(term)“工程师”的查询的方面“经验年限”可能取决于数据库而生成数百万个命中。在实施例中,当确定方面值的计数时,方面值的计数不影响同一方面内的值。然而,其影响其他方面中的值的计数。例如,如果第一方面关于国家,并且第二方面关于公司,则在选择国家方面中的特定国家将不影响国家方面中的方面计数,但是其将影响公司方面中的方面计数。因此,实施例包括在选择准则保持启用时开启和关掉方面计数的能力。在实施例中,方面被按照其值如何被发现和计数而分类。针对方面值发现,可能存在具有可发现值的方面、具有被配置的值的方面以及具有被供应的值的方面。针对具有可发现值的方面,这些方面的值是在运行时间发现的。这些通常是具有大量值的方面。例如,针对“行业”方面,存在数百个行业,其必须被针对给定查询进行发现和计数。针对具有被配置的值的方面,在配置文件中指定这些方面的值。这些通常是具有少数值的方面。例如,针对“简档语言”的方面,仅区分少数语言。针对具有被供应的值的方面,这些方面的值是在请求期间供应的。可以在需要对来自外部源的方面值的子集进行计数时执行所述请求。例如,与示出社交联网服务内的所有群组的“群组”的方面相比,针对社交网络内的“我的群组”的方面仅显示当前用户的群组。针对方面值计数,存在自定义计数和方面值排序。针对自定义计数,这些类型的方面定义自定义分面器(faceter),其允许人创建计数查询。每个方面值都要求自定义分面器。可以针对任何其他类型的方面定义自定义分面器,即,所述方面是可发现的或者其具有被配置或供应的值。通常,在配置文件中指定自定义方面的值。针对方面值排序,在默认情况下按计数下降来对方面值排序。针对具有被配置或供应的值的方面,保持值的顺序是可能的。例如,针对“简档语言”的方面,方面将被以其在搜索请求中出现的相同方式排序,无论计数如何。当按计数排序时,具有零值的方面可能未被返回。当保持顺序时,所有方面值都被返回,包括具有零计数的那些。在实施例中,针对方面值发现和方面值计数二者,使用具有加权的OR(或)(WOR)的搜索查询。WOR允许在搜索查询中的每个子句上放置权重并针对整个查询应用阈值。当且仅当所匹配的子句的权重的和大于或等于阈值时,查询才返回匹配。例如,诸如“WORn1:ibm%1类型:C%1类型:P%1[2]”之类的查询在匹配三个词语(即,ibm、C和/或P)当中的至少两个时返回匹配。更具体地,针对方面值发现,当存在方面值选择(例如,如上面所解释的那样,选择国家位置内的方面以确定其对当前公司的方面计数的影响)时,WOR查询如下发现(针对每个具有N1……NK个方面值选择的K个方面的)方面值---+rewritten_query+(WOR(facet_value_selection_1...facet_value_selection_N1)%1...(facet_value_selection_1...facet_value_selection_NK)%1[K-1])。请注意,用于WOR的阈值被设置成方面的数目-1(K-1),其意味着每次仅一个方面可以失配。可以以类似方式构造方面计数查询,诸如以下---+query_condition+(WOR(facet_value_selection_1...facet_value_selection_N1)%1...(facet_value_selection_1...facet_value_selection_NK)%1[K-1])(not_selected_facet_value1...not_selected_facet_valueM)。如上面提到的那样,在计数查询中,不跨所有方面选择方面值。实施例使用两通道(pass)方法。第一通道发现要计数的方面值,并且第二通道对发现的方面值进行计数并选择要发送给用户或客户端的方面值。可以将第一通道称为方面值发现通本文档来自技高网...
将搜索结果分面

【技术保护点】
一种搜索系统,包括:计算机处理器,其被配置成:从用户接收包括搜索准则的第一搜索查询;执行第一搜索查询以基于搜索准则来检索关于联网系统的成员的信息以及基于搜索准则和方面值与用户的相关性的评分来检索关于联网系统的一个或多个方面值的附加信息;使用一个或多个检索到的方面值来执行第二搜索查询以确定满足准则并包括所述一个或多个方面值的文档的计数;选择方面值的一部分以用于传输给用户;以及在用户设备上显示关于成员、所述一个或多个方面值以及所述一个或多个方面值的计数的信息。

【技术特征摘要】
【国外来华专利技术】2014.08.29 US 62/043661;2014.09.24 US 14/4953511.一种搜索系统,包括:计算机处理器,其被配置成:从用户接收包括搜索准则的第一搜索查询;执行第一搜索查询以基于搜索准则来检索关于联网系统的成员的信息以及基于搜索准则和方面值与用户的相关性的评分来检索关于联网系统的一个或多个方面值的附加信息;使用一个或多个检索到的方面值来执行第二搜索查询以确定满足准则并包括所述一个或多个方面值的文档的计数;选择方面值的一部分以用于传输给用户;以及在用户设备上显示关于成员、所述一个或多个方面值以及所述一个或多个方面值的计数的信息。2.权利要求1的系统,其中计算机处理器被配置成基于相关性按照顺序在用户设备上显示方面值。3.权利要求1或权利要求2的系统,其中计算机处理器被配置成生成一个或多个倒排列表,每个倒排列表包括具有特定方面值的文档。4.权利要求3的系统,其中计算机处理器被配置成在第二搜索查询完成之前终止第二搜索查询;以及估计方面值中的每个的计数。5.权利要求4的系统,其中估计方面值中的每个的计数,估计包括将特定倒排列表中的文档的总数乘以在第二搜索查询终止时从特定倒排列表检索到的满足搜索准则的文档的数目,从而生成结果,并且将结果除以特定倒排列表中的满足搜索准则的最后检索到的文档在特定倒排列表中的排序位置。6.权利要求4的系统,其中通过统计近似来估计计数。7.权利要求6的系统,其中统计近似包括指数回归或多项式回归。8.任何在前权利要求的系统,其中计算机处理器被配置成在第一搜索查询内并行地执行基于搜索准则的关于商业联网系统的所述一个或多个方面值的附加信息的检索以及方面值与用户的相关性的评分。9.任何在前权利要求的系统,其中方面值的评分基于用户的简档。10.任何在前权利要求的系统,其中计算机处理器被配置成使用倒排索引对方面值中的每个进行计数。11.权利要求10的系统,其中对关于联网系统的所述一个或多个方面值的附加信息的检索包括重写查询,使得如果至少一个搜索准则的权重等于100,则具有等于100的权重的所有搜索准则被置于搜索查询中并通过AND子句耦合;如果查询中的至少一个搜索准则的权重大于0,则具有大于0的权重的所有搜索准则被置于搜索查询中并用OR子句耦合;并且如果所有搜索准则具有大于0的权重,则所有搜索准则被置于搜索查询中并用OR子句耦合。12.任何在前权利要求的系统,其中对方面值的评分基于用户的浏览历史、用户的关系、用户的跟随以及与方面值相关联的检索到的文档中的搜索准则的计数中的一个或多个。13.任何在前权利要求的系统,其中计算机处理器被...

【专利技术属性】
技术研发人员:DA伊夫琴科
申请(专利权)人:邻客音公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1