搜索结果处理方法、装置及服务器制造方法及图纸

技术编号:18940611 阅读:34 留言:0更新日期:2018-09-15 11:05
本发明专利技术提供了一种搜索结果处理方法、装置及服务器,属于计算机技术领域。本搜索结果处理方法在获取到搜索词、搜索词的搜索次数及与搜索词对应的多个搜索结果的特征信息后;根据搜索次数及特征信息获取每个搜索结果的有效值;根据每个搜索结果的有效值构建对应于搜索词的第一搜索结果序列;根据搜索词对应的搜索页面中每个搜索结果的展现位置构建对应于搜索词的第二搜索结果序列;对比第一搜索结果序列和第二搜索结果序列,得到多个搜索结果中的坏例。本搜索结果处理方法能够实现与搜索词对应的多个搜索结果中坏例的自动挖掘,节省了大量的人力,提高了坏例挖掘效率。

Search result processing method, device and server

The invention provides a search result processing method, a device and a server, belonging to the field of computer technology. The search result processing method obtains the search words, the search times of the search words and the characteristic information of the search results corresponding to the search words; obtains the valid value of each search result according to the search times and the characteristic information; constructs the first search result sequence corresponding to the search words according to the valid value of each search result. The second search result sequence corresponding to the search word is constructed according to the display position of each search result in the search page corresponding to the search word. By comparing the first search result sequence with the second search result sequence, bad examples in multiple search results are obtained. This search result processing method can realize the automatic mining of bad cases in multiple search results corresponding to search words, save a lot of manpower and improve the efficiency of bad case mining.

【技术实现步骤摘要】
搜索结果处理方法、装置及服务器
本专利技术涉及计算机
,具体而言,涉及一种搜索结果处理方法、装置及服务器。
技术介绍
用户在搜索引擎中搜索搜索词(query)时,有时会出现一些不符合搜索意图、低质、与真实页面不相关、死链接等搜索结果,这部分搜索结果可以称为坏例(badcase)。badcase的存在极大地影响了搜索质量即用户搜索满意度。目前,badcase主要是通过用户反馈或内部工作人员自测等方式发现,例如,人工搜索多个热门query和随机query,查找这些query对应的搜索结果中的坏例。这种方式需要花费大量的时间和人力,且发现的badcase有限,效率低下。此外,这种方式完全依靠人工,比较被动,无法及时发现搜索页面中的badcase并对其进行调整。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种搜索结果处理方法、装置及服务器,以改善现有的坏例发现方法存在的效率低下的问题。为了实现上述目的,本专利技术实施例采用的技术方案如下:第一方面,本专利技术实施例提供了一种搜索结果处理方法,所述方法包括:获取搜索词、所述搜索词的搜索次数及与所述搜索词对应的多个搜索结果的特征信息;根据所述搜索次数及所述特征信息获取每个所述搜索结果的有效值;根据每个所述搜索结果的有效值构建对应于所述搜索词的第一搜索结果序列;根据所述搜索词对应的搜索页面中每个所述搜索结果的展现位置构建对应于所述搜索词的第二搜索结果序列;对比所述第一搜索结果序列和所述第二搜索结果序列,得到所述多个搜索结果中的坏例。第二方面,本专利技术实施例还提供了一种搜索结果处理装置,所述装置包括:第一获取模块、第二获取模块、第一构建模块、第二构建模块以及对比模块。其中,第一获取模块,用于获取搜索词、所述搜索词的搜索次数及与所述搜索词对应的多个搜索结果的特征信息。第二获取模块,用于根据所述搜索次数及所述特征信息获取每个所述搜索结果的有效值。第一构建模块,用于根据每个所述搜索结果的有效值构建对应于所述搜索词的第一搜索结果序列。第二构建模块,用于根据所述搜索词对应的搜索页面中每个所述搜索结果的展现位置构建对应于所述搜索词的第二搜索结果序列。对比模块,用于对比所述第一搜索结果序列和所述第二搜索结果序列,得到所述多个搜索结果中的坏例。第三方面,本专利技术实施例还提供了一种服务器,所述服务器包括处理器以及存储器,所述存储器耦接到所述处理器。所述存储器存储指令,当所述指令由所述处理器执行时使所述服务器执行以下操作:获取搜索词、所述搜索词的搜索次数及与所述搜索词对应的多个搜索结果的特征信息;根据所述搜索次数及所述特征信息获取每个所述搜索结果的有效值;根据每个所述搜索结果的有效值构建对应于所述搜索词的第一搜索结果序列;根据所述搜索词对应的搜索页面中每个所述搜索结果的展现位置构建对应于所述搜索词的第二搜索结果序列;对比所述第一搜索结果序列和所述第二搜索结果序列,得到所述多个搜索结果中的坏例。本专利技术实施例提供的搜索结果处理方法、装置及服务器,能够实现与搜索词对应的多个搜索结果中坏例的自动挖掘,节省了大量的人力,提高了坏例挖掘效率。此外,相比于现有的比较被动的人工挖掘方式,有利于快速发现搜索页面中的坏例以及时对其进行处理。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1示出了一种可应用于本专利技术实施例的服务器的结构框图;图2示出了本专利技术第一实施例提供的搜索结果处理方法的方法流程图;图3示出了本专利技术第一实施例提供的搜索结果处理方法中步骤S102的流程图;图4示出了本专利技术第二实施例提供的搜索结果处理方法的方法流程图;图5示出了本专利技术第三实施例提供的搜索结果处理方法的方法流程图;图6示出了本专利技术第三实施例提供的搜索结果处理方法中策略过滤步骤的流程图;图7示出了本专利技术第四实施例提供的搜索结果处理装置的功能模块框图;图8示出了本专利技术第五实施例提供的搜索结果处理装置的功能模块框图;图9示出了本专利技术第六实施例提供的搜索结果处理装置的功能模块框图。具体实施方式图1示出了一种可应用于本专利技术实施例中的服务器的结构框图。如图1所示,服务器100包括:存储器110、处理器120以及网络模块130。存储器110可用于存储软件程序以及模块,如本专利技术实施例中的搜索结果处理方法及装置对应的程序指令/模块,处理器120通过运行存储在存储器110内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现本专利技术实施例中的搜索结果处理方法。存储器110可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。网络模块130用于接收以及发送网络信号。上述网络信号可包括无线信号或者有线信号。可以理解,图1所示的结构仅为示意,服务器100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。需要说明的是,本专利技术实施例提供的搜索结果处理方法及装置除了应用于服务器外,还可以应用于其它终端设备。下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。第一实施例图2示出了本专利技术第一实施例提供的一种搜索结果处理方法的流程图,请参阅图2,所述方法包括:步骤S101,获取搜索词、所述搜索词的搜索次数及与所述搜索词对应的多个搜索结果的特征信息;搜索词,即query,为用户在搜索引擎中输入的搜索词语或句子。当用户在搜索引擎中输入搜索词时,将展现搜索页面,搜索页面中包括多个搜索结果,每个搜索结果均具有相应的特征信息。本实施例中,特征信息具体可以包括但不限于展现次数、展现位置以及点击数据。例如,除此之外,特征信息还可以包括搜索结果的标题、展现URL等用于标识搜索结果的信息。其中,该搜索词的每一次搜索均对应于一个搜索页面,展现次数为该搜索结果出现在该搜索词对应的搜索页面中的次数,例如,该搜索词的搜索次数为3,则对应3个搜索页面,假设某搜索结果在3个搜索页面中均出现,则该搜索结果的展现次数为3。展现位置表示搜索结果在该搜索词的每一次搜索的搜索页面中的排列位置。例如,该搜索词的搜索次数为3,第一次搜索该搜索词时对应的搜索页面中也有10条依次排列的搜索结果,其中,某搜索结果排在第5位;第二次搜索该搜索词时对应的搜索页面中也有10条依次排列的搜索结果,该搜索结果排在第5位;第三次搜索该搜索词时对应的搜索页面中也有10条依次排列的搜索结果,该搜索结果本文档来自技高网...

【技术保护点】
1.一种搜索结果处理方法,其特征在于,所述方法包括:获取搜索词、所述搜索词的搜索次数及与所述搜索词对应的多个搜索结果的特征信息;根据所述搜索次数及所述特征信息获取每个所述搜索结果的有效值;根据每个所述搜索结果的有效值构建对应于所述搜索词的第一搜索结果序列;根据所述搜索词对应的搜索页面中每个所述搜索结果的展现位置构建对应于所述搜索词的第二搜索结果序列;对比所述第一搜索结果序列和所述第二搜索结果序列,得到所述多个搜索结果中的坏例。

【技术特征摘要】
1.一种搜索结果处理方法,其特征在于,所述方法包括:获取搜索词、所述搜索词的搜索次数及与所述搜索词对应的多个搜索结果的特征信息;根据所述搜索次数及所述特征信息获取每个所述搜索结果的有效值;根据每个所述搜索结果的有效值构建对应于所述搜索词的第一搜索结果序列;根据所述搜索词对应的搜索页面中每个所述搜索结果的展现位置构建对应于所述搜索词的第二搜索结果序列;对比所述第一搜索结果序列和所述第二搜索结果序列,得到所述多个搜索结果中的坏例。2.根据权利要求1所述的方法,其特征在于,所述根据所述搜索次数及所述特征信息获取每个所述搜索结果的有效值,包括:根据每个所述搜索结果的展现次数以及在每次展现该搜索结果的搜索页面中的展现位置获取每个所述搜索结果的加权展现次数;根据预设的分频权重、预设的零值权重、每个所述搜索结果的第一点击量及每个所述搜索结果的所述加权展现次数得到每个所述搜索结果的第一相关系数,其中,所述分频权重根据所述搜索词对应的搜索次数及预设分频规则设置;根据所述分频权重、所述零值权重、每个所述搜索结果的所述第一点击量及每个所述搜索结果的第二点击量得到每个所述搜索结果的第二相关系数;根据所述第一相关系数和所述第二相关系数得到每个所述搜索结果的有效值。3.根据权利要求2所述的方法,其特征在于,所述根据每个所述搜索结果的展现次数以及在每次展现该搜索结果的搜索页面中的展现位置获取每个所述搜索结果的加权展现次数,包括:根据公式:获取每个所述搜索结果的加权展现次数,其中,m表示当前搜索结果的展现次数,i为1至m的整数,psc(i)表示在第i次展现当前搜索结果的搜索页面中,当前搜索结果所对应的展现位置,pmax(i)表示在第i次展现当前搜索结果的搜索页面中,位于被点击的搜索结果最末端的搜索结果所对应的展现位置。4.根据权利要求2所述的方法,其特征在于,所述根据预设的分频权重、预设的零值权重、每个所述搜索结果的第一点击量及每个所述搜索结果的所述加权展现次数得到每个所述搜索结果的第一相关系数,包括:根据公式:得到每个所述搜索结果的所述第一相关系数,其中,click表示当前搜索结果的所述第一点击量,r_zero表示所述零值权重,exam表示所述当前搜索结果的所述加权展现次数,pv_weight表示所述分频权重。5.根据权利要求2所述的方法,其特征在于,所述根据所述分频权重、所述零值权重、每个所述搜索结果的所述第一点击量及每个所述搜索结果的第二点击量得到每个所述搜索结果的第二相关系数,包括:根据公式:得到每个所述搜索结果的所述第二相关系数,其中,last_click表示当前搜索结果的所述第二点击量,click表示当前搜索结果的所述第一点击量,r_zero表示所述零值权重,pv_weight表示所述分频权重。6.根据权利要求2所述的方法,其特征在于,所述根据所述第一相关系数和所述第二相关系数得到每个所述搜索结果的有效值,包括:根据公式:u·ξ+v·η获得每个所述搜索结果的有效值,其中,ξ表示所述第一相关系数,η表示所述第二相关系数,u表示预设的第一权重,v表示预设的第二权重。7.根据权利要求1所述的方法,其特征在于,所述对比所述第一搜索结果序列和所述第二搜索结果序列,得到所述多个搜索结果中的坏例,包括:将每个所述搜索结果在所述第一搜索结果序列中的排列位置与在所述第二搜索结果序列中的排列位置之间的差值作为该搜索结果的伤害值,将该搜索结果的伤害值与预设的伤害阈值进行比较,若该搜索结果的伤害值大于所述伤害阈值,判定该搜索结果为坏例。8.根据权利要求7所述的方法,其特征在于,所述对比所述第一搜索结果序列和所述第二搜索结果序列,得到所述多个搜索结果中的坏例之后,还包括:若所述第二搜索结果序列中排列位置为预设位置处的搜索结果为坏例,将该坏例对应的所述伤害值乘以预设的惩罚系数,以更新该坏例对应的所述伤害值。9.根据权利要求1所述的方法,其特征在于,所述获取搜索词、所述搜索词的搜索次数及与所述搜索词对应的多个搜索结果的特征信息,包括:根据spark算法,从用户搜索日志中获取搜索词、所述搜索词的搜索次数及与所述搜索词对应的多个搜索结果的特征信息。10.根据权利要求1所述的方法,其特征在于,所述对比所述第一搜索结果序列和所述第二搜索结果序列,得到所述多个搜索结果中的坏例之后,还包括:获...

【专利技术属性】
技术研发人员:侯守虎张驰蔡明宸
申请(专利权)人:广东神马搜索科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1