一种提升样本排序多样性方法以及装置制造方法及图纸

技术编号:24856737 阅读:19 留言:0更新日期:2020-07-10 19:09
本公开是关于一种提升样本排序多样性方法、装置、电子设备以及存储介质,涉及计算机技术领域。该方法包括:通过预设算法对样本中的商品进行正则化排序;根据所述商品排序建立预测模型,通过模型预测测试数据集,计算样本中各商品的受试者工作特征曲线排序值AUC;根据样本中各商品预设分类,计算样本的相似度;根据所述排序值AUC及相似度,计算生成多样性值,并按照所述多样性值对样本中各商品再次排序。本公开可以根据样本相似度计算实现样本的多样性的快速高效调整。

【技术实现步骤摘要】
一种提升样本排序多样性方法以及装置
本公开涉及计算机
,具体而言,涉及一种提升样本排序多样性方法、装置、电子设备以及计算机可读存储介质。
技术介绍
个性化推荐系统的出现为用户处理信息过载问题提供了一个有效的工具,通过对海量的用户历史购物信息进行学习,向用户推荐用户感兴趣的信息和商品。但在提高推荐算法的精确度的同时,也引发了如下的问题:首页推荐出现同类商品刷屏现象严重,容易导致审美疲劳;用户看到的商品类别越来越少,降低了用户体验。现有常见的提高多样性的方式主要分为两类:一是基于商品相似度的多样化研究;二是基于主题多样性的多样化研究。现有商品相似度的多样化研究基于MMR框架方案是一种贪婪式的解,它的计算复杂度是样本总数的立方,当样本较大或者分类较多时,对样本的多样性排序需要占用巨大的计算资源。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种提升样本排序多样性方法、装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。根据本公开的一个方面,提供一种提升样本排序多样性方法,包括:商品排序步骤,通过预设算法对样本中的商品进行正则化排序;排序值计算步骤,根据所述商品排序建立预测模型,通过模型预测测试数据集,计算样本中各商品的受试者工作特征曲线排序值AUC;相似度计算步骤,根据样本中各商品预设分类,计算样本的相似度;多样性排序步骤,根据所述排序值AUC及相似度,计算生成多样性值,并按照所述多样性值对样本中各商品再次排序。在本公开的一种示例性实施例中,所述商品排序步骤包括:通过预设xgboost算法对样本中的商品进行正则化排序。在本公开的一种示例性实施例中,所述排序值计算步骤还包括,在计算样本中各商品的排序值AUC后,按照所述排序值对样本中各商品降序排序。在本公开的一种示例性实施例中,所述相似度计算步骤包括:将样本中各商品按照一、二、三级分类;将首次出现的一级分类的相似度置为0;将再次出现的一级分类的相似度值加1,将再次出现的二级分类的相似度值加2,将再次出现的三级分类的相似度值加3,直到对比样本中所有商品,计算和值为所述样本的相似度。在本公开的一种示例性实施例中,所述多样性排序步骤还包括,在多样性排序前,对所述排序值AUC及相似度进行归一化计算。在本公开的一种示例性实施例中,所述多样性排序步骤还包括:引入调节参数与所述排序值AUC及相似度计算多样性值。在本公开的一种示例性实施例中,所述多样性排序步骤还包括:通过贝叶斯调参包改变调节参数实现多样性排序调整;及通过海明距离对所述样本的多样性进行评估。在本公开的一个方面,提供一种提升样本排序多样性装置,包括:商品排序模块,用于通过预设算法对样本中的商品进行正则化排序;排序值计算模块,用于根据所述商品排序建立预测模型,通过模型预测测试数据集,计算样本中各商品的受试者工作特征曲线排序值AUC;相似度计算模块,用于根据样本中各商品预设分类,计算样本的相似度;多样性排序模块,用于根据所述排序值AUC及相似度,计算生成多样性值,并按照所述多样性值对样本中各商品再次排序。在本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现根据上述任意一项所述的方法。在本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据上述任意一项所述的方法。本公开的示例性实施例中的提升样本排序多样性方法,通过预设算法对样本中的商品进行正则化排序;根据所述商品排序建立预测模型,通过模型预测测试数据集,计算样本中各商品的受试者工作特征曲线排序值AUC;根据样本中各商品预设分类,计算样本的相似度;根据所述排序值AUC及相似度,计算生成多样性值,并按照所述多样性值对样本中各商品再次排序。一方面,基于样本中各商品的受试者工作特征曲线排序值AUC的相似度计算分类,可以节省计算资源,提高多样性分类效率;另一方面,引入调节参数和多样性评估方法,可以实现样本多样性的自适应调节。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明通过参照附图来详细描述其示例实施例,本公开的上述和其它特征及优点将变得更加明显。图1示出了根据本公开一示例性实施例的提升样本排序多样性方法的流程图;图2示出了根据本公开一示例性实施例的提升样本排序多样性装置的示意框图;图3示意性示出了根据本公开一示例性实施例的电子设备的框图;以及图4示意性示出了根据本公开一示例性实施例的计算机可读存储介质的示意图。具体实施方式现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有所述特定细节中的一个或更多,或者可以采用其它的方法、组元、材料、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现、材料或者操作以避免模糊本公开的各方面。附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个软件硬化的模块中实现这些功能实体或功能实体的一部分,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。在本示例实施例中,首先提供了一种提升样本排序多样性方法,可以应用于计算机等电子设备;参考图1中所示,该提升样本排序多样性方法可以包括以下步骤:商品排序步骤S110,通过预设算法对样本中的商品进行正则化排序;排序值计算步骤S120,根据所述商品排序建立预测模型,通过模型预测测试数据集,计算样本中各商品的受试者工作特征曲线排序值AUC;相似度计算步骤S130,根据样本中各商品预设分类,计算样本的相似度;多样性排序步骤S140,根据所述排序值AUC及相似度,计算生成多样性值,并按照所述多样性值对样本中各商品再次排序。根据本示例实施例中的提升样本排序多样性方法,一方面,基于样本中各商品的受试者工作特征曲线排序值AUC的相似度计算分类,可以节省计算资源,提高多样性分类效率;另一方面,引入调节参数和多样性评估方法,可以本文档来自技高网...

【技术保护点】
1.一种提升样本排序多样性方法,其特征在于,包括:/n商品排序步骤,通过预设算法对样本中的商品进行正则化排序;/n排序值计算步骤,根据所述商品排序建立预测模型,通过模型预测测试数据集,计算样本中各商品的受试者工作特征曲线排序值AUC;/n相似度计算步骤,根据样本中各商品预设分类,计算样本的相似度;/n多样性排序步骤,根据所述排序值AUC及相似度,计算生成多样性值,并按照所述多样性值对样本中各商品再次排序。/n

【技术特征摘要】
1.一种提升样本排序多样性方法,其特征在于,包括:
商品排序步骤,通过预设算法对样本中的商品进行正则化排序;
排序值计算步骤,根据所述商品排序建立预测模型,通过模型预测测试数据集,计算样本中各商品的受试者工作特征曲线排序值AUC;
相似度计算步骤,根据样本中各商品预设分类,计算样本的相似度;
多样性排序步骤,根据所述排序值AUC及相似度,计算生成多样性值,并按照所述多样性值对样本中各商品再次排序。


2.根据权利要求1所述的方法,其特征在于,所述商品排序步骤包括:通过预设xgboost算法对样本中的商品进行正则化排序。


3.根据权利要求1所述的方法,其特征在于,所述排序值计算步骤还包括,在计算样本中各商品的排序值AUC后,按照所述排序值对样本中各商品降序排序。


4.根据权利要求1所述的方法,其特征在于,所述相似度计算步骤包括:
将样本中各商品按照一、二、三级分类;
将首次出现的一级分类的相似度置为0;
将再次出现的一级分类的相似度值加1,将再次出现的二级分类的相似度值加2,将再次出现的三级分类的相似度值加3,直到对比样本中所有商品,计算和值为所述样本的相似度。


5.根据权利要求1所述的方法,其特征在于,所述多样性排序步骤还包括,在多样性排序前,对所述排...

【专利技术属性】
技术研发人员:胡喆易铎王伟闵金涛宫继龙赵航
申请(专利权)人:北京值得买科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1