【技术实现步骤摘要】
本申请涉及数据搜索
,尤其涉及一种搜索结果排序方法及设备、搜索方法及设备。
技术介绍
在互联网搜索
中,基于搜索关键词的搜索是指由搜索引擎服务器根据用户输入的搜索关键词(也称查询关键词,即query),从基于海量数据而建立的索引中搜索与搜索关键词相匹配的索引,并将该索引所对应的搜索结果(即搜索到的数据)呈现给用户。在呈现搜索结果时,可以按照搜索结果与搜索关键词的相关性先对搜索结果进行排序后再呈现。一般地,在呈现搜索结果的网页页面上对搜索结果进行排序的原则是:搜索结果与搜索关键词之间由大至小的相关性对应于由上至下(或由前至后)的搜索结果排列顺序。由于衡量搜索结果与搜索关键词之间相关性大小的相关性值反映了搜索结果与用户搜索意图之间的相关程度,因此,采用上述排序原则的好处在于,能够将体现用户搜索意图的搜索结果呈现在页面比较靠上(或靠前)的位置,使得这些搜索结果更容易受到用户关注,从而可以提高用户的搜索体验。为了实现按照搜索结果与搜索关键词的相关性对搜索结果进行排序,现有技术提供了一些排序模型,其中比较成熟的模型之一是“基于每千次展现搜索结果可以获得的广告收入(ECPM,Effective Cost Per Mille)的排序模型”,简称ECPM模型。ECPM模型的基本思想在于,分别计算各个搜索结果的排序分数值,并根据计算得到的排序分数值确定搜索结果的排列顺序。具体地,该模型中所采用的计算排序分数值的公式如下式[I]所示:
【技术保护点】
一种搜索结果排序方法,其特征在于,包括:确定与搜索关键词相关的关键词单元;并针对根据所述搜索关键词搜索得到的每个搜索结果,执行从预先存储的关键词单元、搜索结果和用于衡量搜索结果与关键词单元相关性大小的第一相关性值的对应关系中,分别确定与根据所述搜索关键词搜索得到的搜索结果、确定的关键词单元同时对应的所有第一相关性值,并分别确定用于衡量所述搜索关键词与所述确定的各个关键词单元相关性大小的第二相关性值;以及根据第一相关性值和第二相关性值,分别确定根据所述搜索关键词搜索得到的每个搜索结果的排序分数值;以及根据所述每个搜索结果的排序分数值,确定用于指示根据所述搜索关键词搜索得到的搜索结果的排列顺序的排序信息。
【技术特征摘要】
1.一种搜索结果排序方法,其特征在于,包括: 确定与搜索关键词相关的关键词单元;并 针对根据所述搜索关键词搜索得到的每个搜索结果,执行从预先存储的关键词单元、搜索结果和用于衡量搜索结果与关键词单元相关性大小的第一相关性值的对应关系中,分别确定与根据所述搜索关键词搜索得到的搜索结果、确定的关键词单元同时对应的所有第一相关性值,并分别确定用于衡量所述搜索关键词与所述确定的各个关键词单元相关性大小的第二相关性值;以及 根据第一相关性值和第二相关性值,分别确定根据所述搜索关键词搜索得到的每个搜索结果的排序分数值;以及 根据所述每个搜索结果的排序分数值,确定用于指示根据所述搜索关键词搜索得到的搜索结果的排列顺序的排序信息。2.按权利要求1所述的方法,其特征在于,根据第一相关性值和第二相关性值,分别确定根据所述搜索关键词搜索得到的每个搜索结果的排序分数值,具体包括: 针对根据所述搜索关键词搜索得到的每个搜索结果,分别执行下述步骤: 针对确定的每个关键词单元,确定在以该关键词单元作为搜索关键词时每次展现该搜索结果所能获得的最高广告收入数据值;并 针对确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值以及相应的所述最高广告收入数据值,确定该搜索结果的排序分数值;以及 从确定的分别针对不同关键词单 元的排序分数值中,选取最大的排序分数值作为该搜索结果的排序分数值。3.按权利要求2所述的方法,其特征在于,针对确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值以及相应的所述最高广告收入数据值,确定该搜索结果的排序分数值,具体包括: 针对确定的每个关键词单元,确定衡量该搜索结果所属信息类别与该关键词单元所属信息类别相关性大小的类目属性得分数据值;以及 针对确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值、相应的所述最高广告收入数据值以及所述类目属性得分数据值,确定该搜索结果的排序分数值。4.按权利要求2所述的方法,其特征在于,针对确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值以及相应的所述最高广告收入数据值,确定该搜索结果的排序分数值,具体包括: 针对确定的每个关键词单元,确定该搜索结果在以该关键词单元作为搜索关键词时的被点击率;并 针对确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值、相应的所述最高广告收入数据值以及所述被点击率,确定该搜索结果的排序分数值。5.按权利要求4所述的方法,其特征在于,针对确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值、相应的所述最高广告收入数据值以及所述被点击率,确定该搜索结果的排序分数值,具体包括: 针对确定的每个关键词单元,确定衡量该搜索结果所属信息类别与该关键词单元所属信息类别相关性大小的类目属性得分数据值;以及 针对确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值、相应的所述最高广告收入数据值、相应的所述被点击率以及类目属性得分数据值...
【专利技术属性】
技术研发人员:周恒民,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。