一种搜索优化方法及装置制造方法及图纸

技术编号:18940595 阅读:142 留言:0更新日期:2018-09-15 11:05
本发明专利技术公开了一种搜索优化方法及装置,该搜索优化方法包括:接收到查询请求后,获取与所述查询请求相关的实体集合;对所述实体集合中的任一实体,获取所述实体集合中与所述实体存在关联关系的关联实体;获取所述实体与所述查询请求的第一相关性,以及所述关联实体与所述查询请求的第二相关性,根据所述第一相关性与所述第二相关性确定所述实体与所述查询请求的最终相关性。本发明专利技术实施例所述方案使用关联实体的相关性来确定实体的最终相关性,并根据最终相关性对实体进行排序后输出,能更准确的反映出实体与搜索之间的相关性,更加精准快速帮助用户定位到其所关心的实体。

A search optimization method and device

The invention discloses a search optimization method and a device, which comprises: after receiving a query request, acquiring an entity set related to the query request; acquiring an associated entity in the entity set associated with the entity set for any of the entities; acquiring the fact; The first correlation between the body and the query request and the second correlation between the associated entity and the query request determine the final correlation between the entity and the query request according to the first correlation and the second correlation. The scheme according to the embodiment of the present invention uses the correlation of related entities to determine the final correlation of entities, and outputs the ordered entities according to the final correlation, which can more accurately reflect the correlation between entities and searches, and more accurately and quickly help users locate the entities they care about.

【技术实现步骤摘要】
一种搜索优化方法及装置
本专利技术涉及信息处理技术,尤指一种搜索优化方法及装置。
技术介绍
在实体搜索领域,目前最流行的结果排名算法主要基于Lucene中的PSF(PracticalScoringFunction)算法来计算命中实体与查询的相关性,同时加入搜索意图识别。搜索意图识别是指通过用户输入的请求来获取用户的真实需求,靠规则或者机器学习的方法来完成一个分类的问题。该搜索方法只考虑单个实体本身的属性,具有一定的局限性和片面性,从而影响用户真正需求结果的可视性,有碍用户快速定位到其真正感兴趣的实体对象。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种搜索优化方法及装置,对现有搜索方法进行优化,有利于用户快速定位到其真正感兴趣的实体对象。为了达到本专利技术目的,本专利技术提供了一种搜索优化方法,包括:接收到查询请求后,获取与所述查询请求相关的实体集合;对所述实体集合中的任一实体,获取所述实体集合中与所述实体存在关联关系的关联实体;获取所述实体与所述查询请求的第一相关性,以及所述关联实体与所述查询请求的第二相关性,根据所述第一相关性与所述第二相关性确定所述实体与所述查询请求的最终相关性。可选的,所述方法还包括:确定所述实体集合中每个实体的最终相关性后,根据各实体的最终相关性对所述实体集合中的实体进行排序后输出。可选的,所述获取所述实体集合中与所述实体存在关联关系的关联实体包括:获取所述实体集合中与所述实体的关联关系满足预设条件的关联实体。可选的,所述预设条件为:所述关联实体相对于所述实体的关系权重值大于0。可选的,所述根据所述第一相关性与所述第二相关性确定所述实体与所述查询请求的最终相关性包括:根据所述第一相关性、所述第二相关性以及所述关联实体相对于所述实体的关系权重值确定所述实体与所述查询请求的最终相关性。可选的,所述根据所述第一相关性与所述第二相关性确定所述实体与所述查询请求的最终相关性包括:且所述所述score_mx(q,d)为所述实体与所述查询请求的最终相关性,所述score(q,d)为所述实体与所述查询请求的第一相关性,所述α为所述实体的权重,且0≤α≤1,所述score(q,dri)为所述实体的关联实体dri与所述查询请求的第二相关性,所述boosti为所述关联实体dri相对于所述实体的关系权重值,所述i=1~m。本专利技术实施例还提供一种搜索优化装置,包括:搜索单元,用于接收查询请求后,获取与所述查询请求相关的实体集合;关联实体确定单元,用于对所述实体集合中的任一实体,获取所述实体集合中与所述实体存在关联关系的关联实体;优化单元,用于获取所述实体与所述查询请求的第一相关性,获取所述关联实体与所述查询请求的第二相关性,根据所述第一相关性与所述第二相关性确定所述实体与所述查询请求的最终相关性。可选的,所述装置还包括:输出单元,用于确定所述实体集合中每个实体的所述最终相关性后,根据各实体的最终相关性对所述实体集合中的实体进行排序后输出。可选的,所述关联实体确定单元获取所述实体集合中与所述实体存在关联关系的关联实体包括:获取所述实体集合中与所述实体的关联关系满足预设条件的关联实体。可选的,所述预设条件为:所述关联实体相对于所述实体的关系权重值大于0。可选的,所述优化单元根据所述第一相关性与所述第二相关性确定所述实体与所述查询请求的最终相关性包括:根据所述第一相关性、所述第二相关性以及所述关联实体相对于所述实体的关系权重值确定所述实体与所述查询请求的最终相关性。可选的,所述优化单元根据所述第一相关性与所述第二相关性确定所述实体与所述查询请求的最终相关性包括:且所述所述score_mx(q,d)为所述实体d与所述查询请求q的最终相关性,所述score(q,d)为所述实体d与所述查询请求q的第一相关性,所述α为所述实体d的权重,且0≤α≤1,所述score(q,dri)为所述实体d的关联实体dri与所述查询请求q的第二相关性,所述boosti为所述关联实体dri相对于所述实体d的关系权重值,所述i=1~m。与现有技术相比,本专利技术实施例所述方案使用实体的关联实体的相关性来确定实体的最终相关性,并根据最终相关性对实体进行排序后输出,能更准确的反映出实体与搜索之间的相关性,更加精准快速帮助用户定位到其所关心的实体。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本专利技术的技术方案,并不构成对本专利技术技术方案的限制。图1为本专利技术实施例搜索优化方法流程图;图2为本专利技术实施例搜索优化装置框图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。现有技术中,使用PSF进行搜索计算时,所基于的信息完全来自实体本身的属性,而并未考虑影响实体的另一个关键信息“关系”。本专利技术实施例中,考虑了与实体有关联关系的其他实体,与实体有关的其他实体的特征对实体有着与属性相同的代表性,使用与实体有关联关系的实体的相关性值来修正实体的相关性值。图1为本专利技术实施例提供的搜索优化方法流程图。如图1所示,本专利技术实施例提供的一种搜索优化方法,包括:步骤101,接收到查询请求;步骤102,获取与所述查询请求相关的实体集合;步骤103,对所述实体集合中的任一实体,获取所述实体集合中与所述实体存在关联关系的关联实体;步骤104,获取所述实体与所述查询请求的第一相关性,以及所述关联实体与所述查询请求的第二相关性,根据所述第一相关性与所述第二相关性确定所述实体与所述查询请求的最终相关性。在本专利技术另一实施例中,所述方法还包括步骤105,确定所述实体集合中每个实体的最终相关性后,根据各实体的最终相关性对所述实体集合中的实体进行排序后输出。其中,所述步骤102中的实体可以是现实中不再做进一步分割的一类对象,通常被定义为在系统中会被主要分析的对象种类,如人,车,户籍等。每个实体包括代表该实体特征的属性信息。比如,实体为人时,其属性信息可以包括如下之一或其组合:姓名、年龄、性别、籍贯、是否有犯罪记录、重点人类别(比如涉毒、涉恐等)、行为习惯等。其中,实体之间的关联关系是刻画实体间各种关系的一类对象,通常被定义为实体之间的关联,比如,实体为人时,关联关系包括配偶、父子,夫妻,母子、同行、同住、同学关系等,还可包括人和户籍的所属关系。人与人之间的部分关联关系可从户口薄中提取。其中,上述实体的属性信息和实体之间的关联关系可以存储在数据库中。该数据库可以是图数据库,实体的属性信息用点进行标记、实体之间的关联关系以边进行标记。其中,所述步骤102中,可以使用现有的搜索算法获取与所述查询请求相关的实体集合。比如,可以使用PSF算法。当本文档来自技高网...

【技术保护点】
1.一种搜索优化方法,其特征在于,包括:接收到查询请求后,获取与所述查询请求相关的实体集合;对所述实体集合中的任一实体,获取所述实体集合中与所述实体存在关联关系的关联实体;获取所述实体与所述查询请求的第一相关性,以及所述关联实体与所述查询请求的第二相关性,根据所述第一相关性与所述第二相关性确定所述实体与所述查询请求的最终相关性。

【技术特征摘要】
1.一种搜索优化方法,其特征在于,包括:接收到查询请求后,获取与所述查询请求相关的实体集合;对所述实体集合中的任一实体,获取所述实体集合中与所述实体存在关联关系的关联实体;获取所述实体与所述查询请求的第一相关性,以及所述关联实体与所述查询请求的第二相关性,根据所述第一相关性与所述第二相关性确定所述实体与所述查询请求的最终相关性。2.如权利要求1所述的方法,其特征在于,所述方法还包括:确定所述实体集合中每个实体的最终相关性后,根据各实体的最终相关性对所述实体集合中的实体进行排序后输出。3.如权利要求1所述的方法,其特征在于,所述获取所述实体集合中与所述实体存在关联关系的关联实体包括:获取所述实体集合中与所述实体的关联关系满足预设条件的关联实体。4.如权利要求3所述的方法,其特征在于,所述预设条件为:所述关联实体相对于所述实体的关系权重值大于0。5.如权利要求1所述的方法,其特征在于,所述根据所述第一相关性与所述第二相关性确定所述实体与所述查询请求的最终相关性包括:根据所述第一相关性、所述第二相关性以及所述关联实体相对于所述实体的关系权重值确定所述实体与所述查询请求的最终相关性。6.如权利要求1至5任一所述的方法,其特征在于,所述根据所述第一相关性与所述第二相关性确定所述实体与所述查询请求的最终相关性包括:且所述所述score_mx(q,d)为所述实体与所述查询请求的最终相关性,所述score(q,d)为所述实体与所述查询请求的第一相关性,所述α为所述实体的权重,且0≤α≤1,所述score(q,dri)为所述实体的关联实体dri与所述查询请求的第二相关性,所述boosti为所述关联实体dri相对于所述实体的关系权重值,所述i=1~m。7.一种搜索优化装置,其特征在于,包括:搜索单元,用于接收查...

【专利技术属性】
技术研发人员:李梅雯王啸风孟嘉邵蓥侠傅强冯是聪
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1