搜索结果召回方法、装置、服务器和介质制造方法及图纸

技术编号:22364160 阅读:33 留言:0更新日期:2019-10-23 04:43
本发明专利技术实施例公开了一种搜索结果召回方法、装置、服务器和介质。所述方法包括:从用户的历史搜索日志中,挖掘每一次搜索过程中用户输入过的各搜索片段与用户在本次搜索过程触发的搜索需求结果之间的点击关系;依据历史搜索日志,统计每一组点击关系发生的频次,并将频次满足预设频次阈值的至少一个点击关系作为预测点击关系进行存储;其中,预测点击关系用于与线上实时的目标搜索请求进行搜索片段匹配,以便将相匹配的搜索片段所在的预测点击关系中的搜索需求结果,作为目标搜索请求的预测目标搜索结果召回。本发明专利技术实施例能够有效降低用户搜索时的输入成本,提高搜索效率,同时提升系统的召回率和产品的转化率。

Search results recall methods, devices, servers, and media

【技术实现步骤摘要】
搜索结果召回方法、装置、服务器和介质
本专利技术实施例涉及互联网技术,尤其涉及一种搜索结果召回方法、装置、服务器和介质。
技术介绍
在现有的很多搜索场景下,例如地图应用中对POI的搜索场景,通常需要根据用户实时输入的片段对用户需求进行预测,以便缩短用户输入与查找的时间。而现有技术通常是采用前缀匹配来进行预测和召回,也就是说,基于用户输入片段的字面来进行实体匹配,因此,用户输入的片段越完整,预测和召回的结果才能越符合用户真实的需求。然而,用户输入一个完整的检索词通常要经历一系列的过程,尤其是受到输入法的制约,经常会存在输错或误输入的情形,此时,如果按照现有技术中的字面匹配,则无法召回准确的用户需求,用户也需要对输入的片段进行反复纠正,才能搜到真实需求。这一过程中用户需要花费更大的代价来找到其需求,给用户造成了很大的输入成本,搜索时间长,搜索效率低。
技术实现思路
本专利技术实施例提供一种搜索结果召回方法、装置、服务器和介质,以解决用户使用搜索引擎时,因为输入法制约导致用户输错或误输入搜索词,从而需要进行反复纠正搜索词的搜索效率低的问题。第一方面,本专利技术实施例提供了一种搜索结果召回方法,所述方法包括:从用户的历史搜索日志中,挖掘每一次搜索过程中用户输入过的各搜索片段与触发的搜索需求结果之间的点击关系;依据所述历史搜索日志,统计每一组点击关系发生的频次,并将频次满足预设频次阈值的至少一组点击关系作为预测点击关系进行存储;其中,所述预测点击关系用于与线上实时的目标搜索请求进行搜索片段匹配,以便将相匹配的搜索片段所在的预测点击关系中的搜索需求结果,作为所述目标搜索请求的预测目标搜索结果召回。第二方面,本专利技术实施例提供了一种搜索结果召回装置,所述装置包括:点击关系获取模块,用于从用户的历史搜索日志中,挖掘每一次搜索过程中用户输入过的各搜索片段与触发的搜索需求结果之间的点击关系;预测点击关系存储模块,用于依据所述历史搜索日志,统计每一组点击关系发生的频次,并将频次满足预设频次阈值的至少一组点击关系作为预测点击关系进行存储;其中,所述预测点击关系用于与线上实时的目标搜索请求进行搜索片段匹配,以便将相匹配的搜索片段所在的预测点击关系中的搜索需求结果,作为所述目标搜索请求的预测目标搜索结果召回。第三方面,本专利技术实施例提供了一种服务器,所述服务器还包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术实施例中任一所述的一种搜索结果召回方法。第四方面,本专利技术实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例中任一所述的一种搜索结果召回方法。本专利技术实施例通过获取用户的历史搜索日志中搜索片段与搜索需求结果之间的点击关系,并将频次满足预设频次阈值的至少一个点击关系作为预测点击关系进行本地存储,当线上产生实时的目标搜索请求时,可先与本地存储的点击关系进行匹配,若能匹配上,则将相匹配的点击关系中的搜索需求结果作为当前实时的搜索请求的预测结果进行召回,从而有效降低用户搜索时的输入成本,提高搜索效率,同时提升系统的召回率和产品的转化率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1是本专利技术实施例一提供的一种搜索结果召回方法的流程图;图2为本专利技术实施例二提供的一种搜索结果召回方法的流程图;图3为本专利技术实施例三提供的一种搜索结果召回装置的结构示意图;图4为本专利技术实施例四提供的一种服务器的结构示意图。具体实施方式下面结合附图和实施例对本专利技术实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术实施例,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术实施例相关的部分而非全部结构。实施例一图1是本专利技术实施例一提供的一种搜索结果召回方法的流程图。本实施例适用于用户在搜索引擎中或者任一软件应用的搜索框中输入搜索词进行需求搜索的情况,该方法可以由本专利技术实施例提供的搜索结果召回装置来执行,该装置可以采用软件和/或硬件的方式实现,并可配置在服务器中。如图1所示,该方法可以包括:S101、从用户的历史搜索日志中,挖掘每一次搜索过程中用户输入过的各搜索片段与触发的搜索需求结果之间的点击关系。其中,用户的历史搜索日志是用来记录不同用户在历史搜索过程中涉及到的相关信息,例如用户的session日志。可选的包括搜索片段、搜索结果、搜索需求结果、搜索时间以及搜索耗时等等。搜索片段指的是用户完成搜索词输入所涉及的字符信息,例如用户在搜索引擎中,通过手写汉字输入搜索词“酒店”,那么对应的搜索片段为“酒”和“酒店”,又例如用户在搜索引擎中通过“拼音输入法”输入搜索词“酒店”,那么对应的搜索片段为“j”、“ji”、“jiu”、“jiud”、“jiudi”、“jiudia”以及“jiudian”。用户每输入一个搜索片段,即向服务器发出一次搜索请求,服务器就会根据搜索请求反馈给用户与输入搜索片段相关的搜索结果,如果用户对于某个搜索结果触发了点击操作,则该搜索结果即为搜索需求结果。通过获取搜索片段与触发的搜索需求结果之间的点击关系,确定了用户输入的每个搜索片段对应的搜索需求结果,为后续存储预测点击关系奠定了数据基础。S102、依据所述历史搜索日志,统计每一组点击关系发生的频次,并将频次满足预设频次阈值的至少一组点击关系作为预测点击关系进行存储。其中,预设频次阈值可以根据用户使用搜索引擎的频率来自行设定,可选的,预设频次阈值与用户使用搜索引擎的频率成正比,即用户使用搜索引擎的频率越高,则对应预设频次阈值就越高,相应的,用户使用搜索引擎的频率越低,则对应预设频次阈值就越低。所述预测点击关系用于与线上实时的目标搜索请求进行搜索片段匹配,以便将相匹配的搜索片段所在的预测点击关系中的搜索需求结果,作为所述目标搜索请求的预测目标搜索结果召回。可选的,所述预测点击关系中的搜索片段与搜索需求结果是以键值对的方式存储在缓存。其中,键值对表示key(键)与value(值)的对应关系,例如搜索片段“dishini”、“迪士尼”以及“迪士尼xz”在预测点击关系中的搜索需求结果都为“迪士尼小镇”,则搜索片段“dishini”、“迪士尼”以及“迪士尼xz”即为key1、key2以及key3,对应的“迪士尼小镇”即为value。通过将满足预设频次阈值的至少一组点击关系作为预测点击关系进行存储,为后续当线上产生实时的目标搜索请求时,可先与本地存储的预测点击关系进行匹配奠定了数据基础。本专利技术实施例提供的技术方案,通过获取用户的历史搜索日志中搜索片段与搜索需求结果之间的点击关系,并将频次满足预设频次阈值的至少一个点击关系作为预测点击关系进行本地存储,当线上产生实时的目标搜索请求时,可先与本地存储的预测点击关系进行匹配,若能匹配上,则将相匹配的预测点击关系中的搜索需求结果作为当前实时的搜索请求的预测结果进行召回,从而有效本文档来自技高网...

【技术保护点】
1.一种搜索结果召回方法,其特征在于,所述方法包括:从用户的历史搜索日志中,挖掘每一次搜索过程中用户输入过的各搜索片段与触发的搜索需求结果之间的点击关系;依据所述历史搜索日志,统计每一组点击关系发生的频次,并将频次满足预设频次阈值的至少一组点击关系作为预测点击关系进行存储;其中,所述预测点击关系用于与线上实时的目标搜索请求进行搜索片段匹配,以便将相匹配的搜索片段所在的预测点击关系中的搜索需求结果,作为所述目标搜索请求的预测目标搜索结果召回。

【技术特征摘要】
1.一种搜索结果召回方法,其特征在于,所述方法包括:从用户的历史搜索日志中,挖掘每一次搜索过程中用户输入过的各搜索片段与触发的搜索需求结果之间的点击关系;依据所述历史搜索日志,统计每一组点击关系发生的频次,并将频次满足预设频次阈值的至少一组点击关系作为预测点击关系进行存储;其中,所述预测点击关系用于与线上实时的目标搜索请求进行搜索片段匹配,以便将相匹配的搜索片段所在的预测点击关系中的搜索需求结果,作为所述目标搜索请求的预测目标搜索结果召回。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:针对每一组预测点击关系中的搜索片段,利用泛化技术进行泛化,得到各搜索片段对应的至少一个泛化片段;将每个泛化片段与其对应的搜索片段所在的预测点击关系中的搜索需求结果组成新的预测点击关系进行存储。3.根据权利要求2所述的方法,其特征在于,所述针对每一组预测点击关系中的搜索片段,利用泛化技术进行泛化,得到各搜索片段对应的至少一个泛化片段,包括:针对每一组预测点击关系中的搜索片段进行分词,得到分词集合;对所述分词集合进行关键词识别,将所述分词集合中存在的至少一个关键词作为各搜索片段对应的至少一个泛化片段。4.根据权利要求1所述的方法,其特征在于,所述预测点击关系中的搜索片段与搜索需求结果是以键值对的方式存储在缓存。5.根据权利要求1所述的方法,其特征在于,所述将频次满足预设频次阈值的至少一个点击关系作为预测点击关系进行存储之后,还包括:获取线上实时的目标搜索请求,其中,所述目标搜索请求中包含目标搜索片段;将所述目标搜索片段与所述预测点击关系中的搜索片段进行匹配,并将相匹配的搜索片段所在的预测点击关系中的搜索需求结果,作为所述目标搜索请求的预测目标搜索结果召回。6.一种搜索结果召回装置,其特征在于,所述装置包括:点击关系获取模块,用于从用户的历史搜索日志中,挖掘每一次搜索过程中用户输入过的各搜索片段与触发的搜索需求结果之间的点击关系;预测点击关系存储模块,用于依据所述历史搜索日志,统计每...

【专利技术属性】
技术研发人员:陈加钏
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1