当前位置: 首页 > 专利查询>清华大学专利>正文

搜索评价方法及装置制造方法及图纸

技术编号:19903701 阅读:49 留言:0更新日期:2018-12-26 02:59
本公开涉及一种搜索评价方法及装置,所述方法包括:根据搜索结果的相关性评分和点击必要性评分,确定搜索结果被点击的概率;根据搜索结果的摘要的深度、目标页面的深度以及被点击的概率,确定搜索结果的期望浏览深度;根据搜索结果的期望浏览深度,确定搜索结果的期望浏览起始深度;根据搜索结果的期望浏览起始深度、摘要的深度、目标页面的深度、相关性评分以及浏览深度分布函数,确定搜索结果的收益;根据搜索结果的收益,确定搜索页面的评分。根据本公开的实施例的搜索评价方法及装置,在确定搜索页面的评分时,将搜索结果的摘要的深度和目标页面的深度考虑到指标的设计中,可较好地反映用户的使用体验。

【技术实现步骤摘要】
搜索评价方法及装置
本公开涉及计算机领域,尤其涉及一种搜索评价方法及装置。
技术介绍
在移动互联时代,搜索引擎收到的来自移动端的搜索请求不断增长。目前的移动搜索技术主要是迁移自传统的桌面搜索,对移动搜索的评价方法也主要是采用传统的桌面搜索的评价指标,如nDCG,RBP,ERR等。对搜索的评价是信息检索领域的重要部分,它能帮助研究者衡量搜索结果的质量,反映搜索用户的搜索体验,为搜索系统的性能提升指导方向。目前应用广泛的评价指标都是基于搜索结果的相关性标注,考虑搜索结果收益随搜索结果排序的衰减,利用搜索结果页面上所有结果的整体收益作为评价分数来对搜索页面进行评价。由于传统桌面搜索中搜索结果大多数是同质的,现有的评价指标在考虑收益的衰减时主要是基于结果的排序,以nDCG为例,第k个结果的收益的衰减函数为1/log2(1+k)。然而,移动搜索在很多方面都与传统桌面搜索存在着显著区别:信息需求分布不同,在移动设备上,人们会更多地搜索与地理位置、娱乐等信息相关的内容;交互方式不同,在传统的桌面搜索中,人们主要是用鼠标键盘进行交互,而在移动设备上多使用更小尺寸的多点触控屏幕等等。另一方面,搜索结果本文档来自技高网...

【技术保护点】
1.一种搜索评价方法,其特征在于,包括:根据搜索页面中的多个搜索结果的相关性评分和点击必要性评分,确定每个搜索结果被点击的概率,其中,所述相关性评分用于表征搜索关键词和所述搜索结果之间的相关性,所述点击必要性评分用于表征搜索结果的摘要的完善程度;根据每个搜索结果的摘要的深度、每个搜索结果的目标页面的深度以及所述每个搜索结果被点击的概率,确定每个搜索结果的期望浏览深度,其中,所述目标页面为搜索结果受到点击后跳转的页面;根据每个搜索结果的期望浏览深度,确定每个搜索结果的期望浏览起始深度;根据每个搜索结果的期望浏览起始深度、每个搜索结果的摘要的深度、每个搜索结果的目标页面的深度、每个搜索结果的相关性...

【技术特征摘要】
1.一种搜索评价方法,其特征在于,包括:根据搜索页面中的多个搜索结果的相关性评分和点击必要性评分,确定每个搜索结果被点击的概率,其中,所述相关性评分用于表征搜索关键词和所述搜索结果之间的相关性,所述点击必要性评分用于表征搜索结果的摘要的完善程度;根据每个搜索结果的摘要的深度、每个搜索结果的目标页面的深度以及所述每个搜索结果被点击的概率,确定每个搜索结果的期望浏览深度,其中,所述目标页面为搜索结果受到点击后跳转的页面;根据每个搜索结果的期望浏览深度,确定每个搜索结果的期望浏览起始深度;根据每个搜索结果的期望浏览起始深度、每个搜索结果的摘要的深度、每个搜索结果的目标页面的深度、每个搜索结果的相关性评分以及浏览深度分布函数,确定每个搜索结果的收益;根据多个搜索结果的收益,确定所述搜索页面的评分。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在训练集中的训练搜索页面的训练搜索结果中,确定具有各种相关性评分和点击必要性评分的训练搜索结果被点击的概率,其中,所述训练搜索页面与训练搜索关键词相对应。3.根据权利要求2所述的方法,其特征在于,在训练集中的训练搜索页面的训练搜索结果中,确定具有各种相关性评分和点击必要性评分的训练搜索结果被点击的概率,包括:在所述训练搜索页面的训练搜索结果中,确定具有第一相关性评分和第一点击必要性评分的训练搜索结果的第一数量;在具有第一相关性评分和第一点击必要性评分的训练搜索结果中,确定受到点击的训练搜索结果的第二数量;将所述第二数量与所述第一数量的比值确定为具有第一相关性评分和第一点击必要性评分的训练搜索结果被点击的概率。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:根据训练集中的训练搜索页面的浏览深度,确定所述浏览深度分布函数,其中,所述浏览深度用于表征所述训练搜索页面的被显示的最深的位置在训练搜索页面中的深度。5.根据权利要求4所述的方法,其特征在于,根据训练集中的训练搜索页面的浏览深度,确定所述浏览深度分布函数,包括:确定所述浏览深度与每个浏览深度的训练搜索页面的数量之间的关系曲线;对所述关系曲线进行拟合,确定所述浏览深度分布函数。6.根据权利要求5所述的方法,其特征在于,对所述关系曲线进行拟合,确定所述浏览深度分布函数,包括:根据公式对所述关系曲线进行拟合,确定所述浏览深度分布函数,其中,D(h)为所述浏览深度分布函数,h为所述浏览...

【专利技术属性】
技术研发人员:罗成刘奕群张帆毛佳昕许静芳汪萌张敏马少平
申请(专利权)人:清华大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1