搜索结果处理方法、装置及服务器制造方法及图纸

技术编号：18940611 阅读：34 留言：0更新日期：2018-09-15 11:05

本发明专利技术提供了一种搜索结果处理方法、装置及服务器，属于计算机技术领域。本搜索结果处理方法在获取到搜索词、搜索词的搜索次数及与搜索词对应的多个搜索结果的特征信息后；根据搜索次数及特征信息获取每个搜索结果的有效值；根据每个搜索结果的有效值构建对应于搜索词的第一搜索结果序列；根据搜索词对应的搜索页面中每个搜索结果的展现位置构建对应于搜索词的第二搜索结果序列；对比第一搜索结果序列和第二搜索结果序列，得到多个搜索结果中的坏例。本搜索结果处理方法能够实现与搜索词对应的多个搜索结果中坏例的自动挖掘，节省了大量的人力，提高了坏例挖掘效率。

Search result processing method, device and server

The invention provides a search result processing method, a device and a server, belonging to the field of computer technology. The search result processing method obtains the search words, the search times of the search words and the characteristic information of the search results corresponding to the search words; obtains the valid value of each search result according to the search times and the characteristic information; constructs the first search result sequence corresponding to the search words according to the valid value of each search result. The second search result sequence corresponding to the search word is constructed according to the display position of each search result in the search page corresponding to the search word. By comparing the first search result sequence with the second search result sequence, bad examples in multiple search results are obtained. This search result processing method can realize the automatic mining of bad cases in multiple search results corresponding to search words, save a lot of manpower and improve the efficiency of bad case mining.

全部详细技术资料下载

【技术实现步骤摘要】
搜索结果处理方法、装置及服务器
本专利技术涉及计算机
，具体而言，涉及一种搜索结果处理方法、装置及服务器。
技术介绍
用户在搜索引擎中搜索搜索词(query)时，有时会出现一些不符合搜索意图、低质、与真实页面不相关、死链接等搜索结果，这部分搜索结果可以称为坏例(badcase)。badcase的存在极大地影响了搜索质量即用户搜索满意度。目前，badcase主要是通过用户反馈或内部工作人员自测等方式发现，例如，人工搜索多个热门query和随机query，查找这些query对应的搜索结果中的坏例。这种方式需要花费大量的时间和人力，且发现的badcase有限，效率低下。此外，这种方式完全依靠人工，比较被动，无法及时发现搜索页面中的badcase并对其进行调整。
技术实现思路
有鉴于此，本专利技术的目的在于提供一种搜索结果处理方法、装置及服务器，以改善现有的坏例发现方法存在的效率低下的问题。为了实现上述目的，本专利技术实施例采用的技术方案如下：第一方面，本专利技术实施例提供了一种搜索结果处理方法，所述方法包括：获取搜索词、所述搜索词的搜索次数及与所述搜索词对应的多个搜索结果的特征信息；根据所述搜索次数及所述特征信息获取每个所述搜索结果的有效值；根据每个所述搜索结果的有效值构建对应于所述搜索词的第一搜索结果序列；根据所述搜索词对应的搜索页面中每个所述搜索结果的展现位置构建对应于所述搜索词的第二搜索结果序列；对比所述第一搜索结果序列和所述第二搜索结果序列，得到所述多个搜索结果中的坏例。第二方面，本专利技术实施例还提供了一种搜索结果处理装置，所述装置包括：第一获取模块...

【技术保护点】
1.一种搜索结果处理方法，其特征在于，所述方法包括：获取搜索词、所述搜索词的搜索次数及与所述搜索词对应的多个搜索结果的特征信息；根据所述搜索次数及所述特征信息获取每个所述搜索结果的有效值；根据每个所述搜索结果的有效值构建对应于所述搜索词的第一搜索结果序列；根据所述搜索词对应的搜索页面中每个所述搜索结果的展现位置构建对应于所述搜索词的第二搜索结果序列；对比所述第一搜索结果序列和所述第二搜索结果序列，得到所述多个搜索结果中的坏例。

【技术特征摘要】
1.一种搜索结果处理方法，其特征在于，所述方法包括：获取搜索词、所述搜索词的搜索次数及与所述搜索词对应的多个搜索结果的特征信息；根据所述搜索次数及所述特征信息获取每个所述搜索结果的有效值；根据每个所述搜索结果的有效值构建对应于所述搜索词的第一搜索结果序列；根据所述搜索词对应的搜索页面中每个所述搜索结果的展现位置构建对应于所述搜索词的第二搜索结果序列；对比所述第一搜索结果序列和所述第二搜索结果序列，得到所述多个搜索结果中的坏例。2.根据权利要求1所述的方法，其特征在于，所述根据所述搜索次数及所述特征信息获取每个所述搜索结果的有效值，包括：根据每个所述搜索结果的展现次数以及在每次展现该搜索结果的搜索页面中的展现位置获取每个所述搜索结果的加权展现次数；根据预设的分频权重、预设的零值权重、每个所述搜索结果的第一点击量及每个所述搜索结果的所述加权展现次数得到每个所述搜索结果的第一相关系数，其中，所述分频权重根据所述搜索词对应的搜索次数及预设分频规则设置；根据所述分频权重、所述零值权重、每个所述搜索结果的所述第一点击量及每个所述搜索结果的第二点击量得到每个所述搜索结果的第二相关系数；根据所述第一相关系数和所述第二相关系数得到每个所述搜索结果的有效值。3.根据权利要求2所述的方法，其特征在于，所述根据每个所述搜索结果的展现次数以及在每次展现该搜索结果的搜索页面中的展现位置获取每个所述搜索结果的加权展现次数，包括：根据公式：获取每个所述搜索结果的加权展现次数，其中，m表示当前搜索结果的展现次数，i为1至m的整数，psc(i)表示在第i次展现当前搜索结果的搜索页面中，当前搜索结果所对应的展现位置，pmax(i)表示在第i次展现当前搜索结果的搜索页面中，位于被点击的搜索结果最末端的搜索结果所对应的展现位置。4.根据权利要求2所述的方法，其特征在于，所述根据预设的分频权重、预设的零值权重、每个所述搜索结果的第一点击量及每个所述搜索结果的所述加权展现次数得到每个所述搜索结果的第一相关系数，包括：根据公式：得到每个所述搜索结果的所述第一相关系数，其中，click表示当前搜索结果的所述第一点击量，r_zero表示所述零值权重，exam表示所述当前搜索结果的所述加权展现次数，pv_weight表示所述分频权重。5.根据权利要求2所述的方法，其特征在于，所述根据所述分频权重、所述零值权重、每个所述搜索结果的所述第一点击量及每个所述搜索结果的第二点击量得到每个所述搜索结果的第二相关系数，包括：根据公式：得到每个所述搜索结果的所述第二相关系数，其中，last_click表示当前搜索结果的所述第二点击量，click表示当前搜索结果的所述第一点击量，r_zero表示所述零值权重，pv_weight表示所述分频权重。6.根据权利要求2所述的方法，其特征在于，所述根据所述第一相关系数和所述第二相关系数得到每个所述搜索结果的有效值，包括：根据公式：u·ξ+v·η获得每个所述搜索结果的有效值，其中，ξ表示所述第一相关系数，η表示所述第二相关系数，u表示预设的第一权重，v表示预设的第二权重。7.根据权利要求1所述的方法，其特征在于，所述对比所述第一搜索结果序列和所述第二搜索结果序列，得到所述多个搜索结果中的坏例，包括：将每个所述搜索结果在所述第一搜索结果序列中的排列位置与在所述第二搜索结果序列中的排列位置之间的差值作为该搜索结果的伤害值，将该搜索结果的伤害值与预设的伤害阈值进行比较，若该搜索结果的伤害值大于所述伤害阈值，判定该搜索结果为坏例。8.根据权利要求7所述的方法，其特征在于，所述对比所述第一搜索结果序列和所述第二搜索结果序列，得到所述多个搜索结果中的坏例之后，还包括：若所述第二搜索结果序列中排列位置为预设位置处的搜索结果为坏例，将该坏例对应的所述伤害值乘以预设的惩罚系数，以更新该坏例对应的所述伤害值。9.根据权利要求1所述的方法，其特征在于，所述获取搜索词、所述搜索词的搜索次数及与所述搜索词对应的多个搜索结果的特征信息，包括：根据spark算法，从用户搜索日志中获取搜索词、所述搜索词的搜索次数及与所述搜索词对应的多个搜索结果的特征信息。10.根据权利要求1所述的方法，其特征在于，所述对比所述第一搜索结果序列和所述第二搜索结果序列，得到所述多个搜索结果中的坏例之后，还包括：获...

【专利技术属性】
技术研发人员：侯守虎，张驰，蔡明宸，
申请(专利权)人：广东神马搜索科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人