搜索结果排序方法及系统、搜索结果排序优化方法及系统技术方案

技术编号:9667904 阅读:133 留言:0更新日期:2014-02-14 06:20
本申请提供了一种搜索结果排序方法,包括获取原始特征集合;基于历史交易数据从原始特征集合提取有效特征,有效特征指能够对搜索结果的排序产生影响的特征;基于历史交易数据确定各有效特征的初始权重,并利用历史交易数据和预定训练模型对初始权重进行训练得到最终权重;基于最终权重对搜索结果进行排序。本申请还提供了一种实现前述方法的搜索结果排序系统,以及对前述方法进行优化的搜索结果排序优化方法及系统。本申请的搜索结果排序方法及系统、搜索结果排序优化方法及系统,能够保证排序结果的客观性和准确性,避免用户因为排序结果不准确而额外的向服务器发送新搜索请求,从而可以减少服务器的负担以及减少数据的传输量。

【技术实现步骤摘要】
搜索结果排序方法及系统、搜索结果排序优化方法及系统
本申请涉及计算机数据处理
,特别是涉及一种搜索结果排序方法及系统、搜索结果排序优化方法及系统。
技术介绍
随着电子商务的发展,越来越多的用户选择在电子商务网站进行商品的购买。一般情况下一个电子商务网站,通常拥有千万甚至几亿的产品,用户要在繁多的产品中找到自己需要的,利用关键词进行搜索是常见的一种方法。所谓搜索,即用户输入关键词,网站返回与关键词相关的搜索结果供用户筛选。在很多情况下,一个关键词可能会有较大数量的搜索结果,那么搜索结果在展示必然需要按照一定的顺序排列,如何对这些搜索结果进行排序需要网站进行综合考虑。例如,可以根据搜索结果与关键词的相关性、搜索结果在之前的点击率、成交情况等等。对于电子商务网站来说,其主要目的是提高商品的销售量,因此,其在对搜索结果进行排序时除了考虑相关性,还需要考虑搜索结果的可成交性,例如成交转化率、好评率等等。目前,常见的电子商务网站对搜索结果进行排序时,相关性和可成交性预测主要通过人工对历史数据进行分析并根据经验来确定搜索结果(即具体商品)的特征和权重,并根据一定公式计算得到。其中,商品特征是指能够影响商品可成交性的因素,例如销售量、好评率、成交转化率等等。因为在确定特征和权重时凭经验设定,较为盲目和主观,往往会与实际情况出现误差。因此,其返回的排序后的搜索结果可能与用户期望会出现较大的差异,用户期望的搜索结果可能被排在靠后的位置,因为搜索结果数量通常较大,为了减少数据传输量,服务器通常会分段返回排序后的搜索结果,先返回部分结果,若用户提交请求,则再返回部分结果。当排序后的搜索结果与用户期望出现较大差异时,那么用户则可能不断的请求查看剩余搜索结果或者重新通过客户端向服务器提交新的搜索请求来获取其所期望的搜索结果。那么就会增加服务器的数据传输量,那么这无疑会增加服务器的负载,占用大量的网络资源,甚至可能造成网络堵塞。同时也说明服务器返回的排序后的搜索结果中有大量的无关数据,这部分数据的传输无疑是对服务器资源和网络资源的浪费和不必要的占用。
技术实现思路
本申请提供一种搜索结果排序方法及系统、搜索结果排序优化方法及系统,能够解决搜索结果与用户预期不同,用户通过客户端反复的发送搜索请求而导致的服务器负担增加以及网络堵塞的问题。为了解决上述问题,本申请公开了一种搜索结果排序方法,包括以下步骤:获取原始特征集合,所述原始特征包括预先设定的可能对搜索结果的排序产生影响的特征;基于历史交易数据从原始特征集合提取有效特征,所述有效特征指根据历史交易数据确定的能够对搜索结果的排序产生影响的特征;基于历史交易数据确定各有效特征的初始权重,并利用历史交易数据和预定训练模型对初始权重进行训练得到最终权重;基于所述有效特征的最终权重对搜索结果进行排序。进一步地,所述基于历史交易数据从原始特征集合提取有效特征包括:基于历史交易数据选取两组测试产品,其中一组为有成交记录的产品,另外一组为没有成交记录的产品;从历史交易数据中分别提取所述两组测试产品在一定时间段内的相关数据,并利用所述相关数据计算两组测试产品各原始特征的特征值;比较所述两组测试产品相同原始特征的特征值的差值,若超过阈值,则选取所述原始特征为有效特征。进一步地,所述基于历史交易数据从原始特征集合提取有效特征包括:从历史交易数据中提取预定时间段内的交易数据,计算该预定时间段内各产品的成交转化率;选取成交转化率差值大于阈值的两组产品作为测试产品;从历史交易数据中提取所述两组测试产品在所述预定时间段之后的一定时间段内的交易数据,并计算两组测试产品的原始特征集合中各原始特征的特征值;比较所述两组测试产品相同原始特征的特征值的差值,若超过阈值,则选取所述原始特征为有效特征。进一步地,所述基于历史交易数据确定各有效特征的初始权重,并利用历史交易数据和训练模型对初始权重进行训练得到最终权重包括:确定有效特征的初始权重;将历史交易数据和初始权重代入预定训练模型中,计算理论数据;比较理论数据与实际数据,若二者差异在预定范围内,则确定该初始权重为有效特征的最终权重,反之,则返回确定有效特征的初始权重这一步骤。进一步地,所述基于所述有效特征的最终权重对搜索结果进行排序包括:确定搜索结果的实际有效特征值;基于有效特征的最终权重和实际有效特征值计算搜索结果的预测成交转化率;按照预测成交转化率对搜索结果进行排序。本申请还公开了一种搜索结果排序优化方法,包括以下步骤:分别获取搜索结果的有效特征的各组备选权重值;分别采用各备选权重值计算某一预定时间点的搜索结果的理论排序分数,并根据理论排序分数对搜索结果进行排序得到各组排序结果;分别获取各组排序结果排在前面预定数量的搜索结果,并获取所述搜索结果在所述预定时间点以后的交易数据;根据所述交易数据计算各组排序结果中排在前面预定数量的搜索结果的实际排序分数;选取实际排序分数最高的一组排序结果所对应的备选权重值作为有效特征的最终权重值。进一步地,所述理论排序分数为单一特征预测值或者特征组合的预测值,所述实际排序分数为与所述理论排序分数对应的单一特征实际值或者特征组合的实际值。进一步地,所述理论排序分数为预测成交转化率,所述实际排序分数为实际成交转化率;或者所述理论排序分数为预测好评率,所述实际排序分数为实际好评率。进一步地,所述选取实际排序分数最高的一组排序结果所对应的备选权重值作为有效特征的最终权重值包括:选取实际排序分数总和或平均值最高的一组排序结果所对应的备选权重值作为有效特征的最终权重值。本申请还公开了一种搜索结果排序优化方法,包括以下步骤:获取某一预定时间点根据搜索结果的理论排序分数进行排序的排序结果,所述理论排序分数根据有效特征的最终权重和各搜索结果的实际有效特征值得到;获取所述排序结果中排列在前面预定数量的搜索结果在所述预定时间点后的交易数据,并根据所述交易数据计算所述搜索结果的实际排序分数;比较所述实际排序分数和理论排序分数,若两者差值大于阈值,则优化所述有效特征的最终权重。进一步地,所述理论排序分数为预测成交转化率,所述实际排序分数为实际成交转化率;或者所述理论排序分数为预测好评率,所述实际排序分数为实际好评率。本申请还公开了一种搜索结果排序系统,包括:原始特征集合获取模块,用于获取原始特征集合,所述原始特征包括预先设定的可能对搜索结果的排序产生影响的特征;有效特征提取模块,用于基于历史交易数据从原始特征集合提取有效特征,所述有效特征指根据历史交易数据确定的能够对搜索结果的排序产生影响的特征;有效特征权重确定模块,用于基于历史交易数据确定各有效特征的初始权重,并利用历史交易数据和预定训练模型对初始权重进行训练得到最终权重;排序模块,用于基于所述有效特征的最终权重对搜索结果进行排序。进一步地,所述有效特征提取模块包括:测试产品选取子模块,用于基于历史交易数据选取两组测试产品,其中一组为有成交记录的产品,另外一组为没有成交记录的产品;特征值计算子模块,用于从历史交易数据中分别提取所述两组测试产品在一定时间段内的相关数据,并利用所述相关数据计算两组测试产品各原始特征的特征值;比较子模块,用于比较所述两组测试产品相同原始特征的特征值的差本文档来自技高网
...
搜索结果排序方法及系统、搜索结果排序优化方法及系统

【技术保护点】
一种搜索结果排序方法,其特征在于,包括以下步骤:获取原始特征集合,所述原始特征包括预先设定的可能对搜索结果的排序产生影响的特征;基于历史交易数据从原始特征集合提取有效特征,所述有效特征指根据历史交易数据确定的能够对搜索结果的排序产生影响的特征;基于历史交易数据确定各有效特征的初始权重,并利用历史交易数据和预定训练模型对初始权重进行训练得到最终权重;基于所述有效特征的最终权重对搜索结果进行排序。

【技术特征摘要】
1.一种搜索结果排序方法,其特征在于,包括以下步骤: 获取原始特征集合,所述原始特征包括预先设定的可能对搜索结果的排序产生影响的特征; 基于历史交易数据从原始特征集合提取有效特征,所述有效特征指根据历史交易数据确定的能够对搜索结果的排序产生影响的特征; 基于历史交易数据确定各有效特征的初始权重,并利用历史交易数据和预定训练模型对初始权重进行训练得到最终权重; 基于所述有效特征的最终权重对搜索结果进行排序。2.如权利要求1所述的搜索结果排序方法,其特征在于,所述基于历史交易数据从原始特征集合提取有效特征包括: 基于历史交易数据选取两组测试产品,其中一组为有成交记录的产品,另外一组为没有成交记录的产品; 从历史交易数据中分别提取所述两组测试产品在一定时间段内的相关数据,并利用所述相关数据计算两组测试产品各原始特征的特征值; 比较所述两组测试产品相同原始特征的特征值的差值,若超过阈值,则选取所述原始特征为有效特征。3.如权利要求1所述的搜索结果排序方法,其特征在于,所述基于历史交易数据从原始特征集合提取有效特征包括: 从历史交易数据中提取预定时 间段内的交易数据,计算该预定时间段内各产品的成交转化率; 选取成交转化率差值大于阈值的两组产品作为测试产品; 从历史交易数据中提取所述两组测试产品在所述预定时间段之后的一定时间段内的交易数据,并计算两组测试产品的原始特征集合中各原始特征的特征值; 比较所述两组测试产品相同原始特征的特征值的差值,若超过阈值,则选取所述原始特征为有效特征。4.如权利要求1所述的搜索结果排序方法,其特征在于,所述基于历史交易数据确定各有效特征的初始权重,并利用历史交易数据和训练模型对初始权重进行训练得到最终权重包括: 确定有效特征的初始权重; 将历史交易数据和初始权重代入预定训练模型中,计算理论数据; 比较理论数据与实际数据,若二者差异在预定范围内,则确定该初始权重为有效特征的最终权重,反之,则返回确定有效特征的初始权重这一步骤。5.如权利要求1所述的搜索结果排序方法,其特征在于,所述基于所述有效特征的最终权重对搜索结果进行排序包括: 确定搜索结果的实际有效特征值; 基于有效特征的最终权重和实际有效特征值计算搜索结果的预测成交转化率; 按照预测成交转化率对搜索结果进行排序。6.一种搜索结果排序优化方法,其特征在于,包括以下步骤: 分别获取搜索结果的有效特征的各组备选权重值;分别采用各备选权重值计算某一预定时间点的搜索结果的理论排序分数,并根据理论排序分数对搜索结果进行排序得到各组排序结果; 分别获取各组排序结果排在前面预定数量的搜索结果,并获取所述搜索结果在所述预定时间点以后的交易数据; 根据所述交易数据计算各组排序结果中排在前面预定数量的搜索结果的实际排序分数; 选取实际排序分数最高的一组排序结果所对应的备选权重值作为有效特征的最终权重值。7.如权利要求6所述的搜索结果排序优化方法,其特征在于,所述理论排序分数为单一特征预测值或者特征组合的预测值,所述实际排序分数为与所述理论排序分数对应的单一特征实际值或者特征组合的实际值。8.如权利要求7所述的搜索结果排序优化方法,其特征在于,所述理论排序分数为预测成交转化率,所述实际排序分数为实际成交转化率;或者 所述理论排序分数为预测好评率,所述实际排序分数为实际好评率。9.如权利要求6至8任一项所述的搜索...

【专利技术属性】
技术研发人员:林锋汤佳宇
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1