【技术实现步骤摘要】
一种提升样本排序多样性方法以及装置
本公开涉及计算机
,具体而言,涉及一种提升样本排序多样性方法、装置、电子设备以及计算机可读存储介质。
技术介绍
个性化推荐系统的出现为用户处理信息过载问题提供了一个有效的工具,通过对海量的用户历史购物信息进行学习,向用户推荐用户感兴趣的信息和商品。但在提高推荐算法的精确度的同时,也引发了如下的问题:首页推荐出现同类商品刷屏现象严重,容易导致审美疲劳;用户看到的商品类别越来越少,降低了用户体验。现有常见的提高多样性的方式主要分为两类:一是基于商品相似度的多样化研究;二是基于主题多样性的多样化研究。现有商品相似度的多样化研究基于MMR框架方案是一种贪婪式的解,它的计算复杂度是样本总数的立方,当样本较大或者分类较多时,对样本的多样性排序需要占用巨大的计算资源。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种提升样本排序多样性方法、装置、电子设备以 ...
【技术保护点】
1.一种提升样本排序多样性方法,其特征在于,包括:/n商品排序步骤,通过预设算法对样本中的商品进行正则化排序;/n排序值计算步骤,根据所述商品排序建立预测模型,通过模型预测测试数据集,计算样本中各商品的受试者工作特征曲线排序值AUC;/n相似度计算步骤,根据样本中各商品预设分类,计算样本的相似度;/n多样性排序步骤,根据所述排序值AUC及相似度,计算生成多样性值,并按照所述多样性值对样本中各商品再次排序。/n
【技术特征摘要】
1.一种提升样本排序多样性方法,其特征在于,包括:
商品排序步骤,通过预设算法对样本中的商品进行正则化排序;
排序值计算步骤,根据所述商品排序建立预测模型,通过模型预测测试数据集,计算样本中各商品的受试者工作特征曲线排序值AUC;
相似度计算步骤,根据样本中各商品预设分类,计算样本的相似度;
多样性排序步骤,根据所述排序值AUC及相似度,计算生成多样性值,并按照所述多样性值对样本中各商品再次排序。
2.根据权利要求1所述的方法,其特征在于,所述商品排序步骤包括:通过预设xgboost算法对样本中的商品进行正则化排序。
3.根据权利要求1所述的方法,其特征在于,所述排序值计算步骤还包括,在计算样本中各商品的排序值AUC后,按照所述排序值对样本中各商品降序排序。
4.根据权利要求1所述的方法,其特征在于,所述相似度计算步骤包括:
将样本中各商品按照一、二、三级分类;
将首次出现的一级分类的相似度置为0;
将再次出现的一级分类的相似度值加1,将再次出现的二级分类的相似度值加2,将再次出现的三级分类的相似度值加3,直到对比样本中所有商品,计算和值为所述样本的相似度。
5.根据权利要求1所述的方法,其特征在于,所述多样性排序步骤还包括,在多样性排序前,对所述排...
【专利技术属性】
技术研发人员:胡喆,易铎,王伟,闵金涛,宫继龙,赵航,
申请(专利权)人:北京值得买科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。