一种物品推荐方法及装置制造方法及图纸

技术编号:23767814 阅读:38 留言:0更新日期:2020-04-11 20:47
本发明专利技术公开了一种物品推荐方法及装置,涉及计算机技术领域。该方法的一具体实施方式包括:从样本集中选择正负训练样本;循环执行以下步骤,训练用于物品推荐的判别器,直至达到训练停止准则:根据正负训练样本分别指示的属性特征和行为特征,计算正负训练样本的距离以及负训练样本的判别参数,判别参数指示了负训练样本作为正训练样本的概率;根据距离和判别参数,从训练样本集中重新选择正训练样本及其相关的负训练样本;根据重新选择的正负训练样本,训练判别器;利用判别器从待推荐样本集中确定待推荐正样本,将待推荐正样本对应的物品推荐给用户。该实施方式提高了判别器的预测准确度,从而提高了利用判别器进行物品推荐的准确度。

A recommended method and device for articles

【技术实现步骤摘要】
一种物品推荐方法及装置
本专利技术涉及计算机
,尤其涉及一种物品推荐方法及装置。
技术介绍
推荐系统作为电子商务的一种智能应用,能够帮助用户获取基于用户需求和偏好的产品。具体来说,推荐系统可基于训练出的用户行为模型,为用户推荐其偏好的产品。其中,用户行为模型可基于多种类型的模型训练生成。判别器作为用户行为模型的一种,在对判别器进行训练时,一般从包含正负训练样本的样本集中,随机选择多个正负训练样本对,并根据随机选择的正负样本对来训练判别器。其中,训练样本集中的正训练样本对应于曝光且被点击的物品,负训练样本对应于曝光但未被点击的物品。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:样本集一般基于用户的历史反馈数据所生成,而用户的历史反馈数据往往具有极大的稀疏性,使得样本集中负训练样本的数量远远大于正训练样本的数量,而随机选择的正负训练样本对不能反映负训练样本相对于正训练样本的相关性,从而影响判别器的训练效果,使得判别器的预测准确度较低,进而导致推荐的物品的准确度较低。
技术实现思路
有鉴于此,本专利技术实施例提供一种物品推荐方法及装置,能够根据正训练样本与负训练样本之间的距离,选择与正训练样本相关的负训练样本,并利用选择出的正训练样本和负训练样本对判别器进行训练,以提高判别器的预测准确性,从而提高物品推荐的准确性。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种物品推荐方法。本专利技术实施例的一种物品推荐方法包括:获取样本集,所述样本集中的训练样本指示了物品的属性特征和用户针对所述物品的行为特征;从所述样本集中选择正训练样本和负训练样本,其中,所述正训练样本对应的物品被曝光且被点击,所述负训练样本对应的物品被曝光且未被点击;循环执行以下步骤,训练用于物品推荐的判别器,直至达到训练停止准则:根据所述正训练样本和所述负训练样本分别指示的所述属性特征和所述行为特征,计算所述正训练样本与所述负训练样本之间的距离;计算所选择的负训练样本的判别参数,所述判别参数指示了所述负训练样本作为正训练样本的概率;根据所述距离和所述判别参数,从所述训练样本集中重新选择正训练样本以及与重新选择的正训练样本相关的负训练样本;根据重新选择的正训练样本和负训练样本,训练所述判别器;利用所述判别器从待推荐样本集中确定出待推荐正样本,并将所述待推荐正样本对应的物品推荐给用户。可选地,所述根据所述距离和所述判别参数,从所述训练样本集中重新选择正训练样本以及与重新选择的正训练样本相关的负训练样本,包括:将所述距离、所述判别参数以及所述判别参数对应的负训练样本作为用于选择样本的生成器的输入,以对所述生成器进行优化;利用优化后的生成器,选择所述正训练样本以及与重新选择的正训练样本相关的负训练样本。可选地,根据所述距离和所述判别参数,计算所述生成器的优化梯度,并基于所述优化梯度、利用随机梯度法对所述生成器进行优化。可选地,所述从所述训练样本集中重新选择正训练样本以及与重新选择的正训练样本相关的负训练样本,包括:利用所述生成器从所述样本集中随机选择正训练样本,并根据所述正训练样本所指示的物品的属性特征和用户针对所述物品的行为特征,选择与所述正训练样本的相关度大于第一阈值的负训练样本。可选地,所述训练停止准则为:所述判别器计算出的负训练样本的判别参数与正训练样本的判别参数之差小于第二阈值,或循环训练所述判别器的次数大于第三阈值。可选地,重新选择出的所述负训练样本的判别参数与重新选择出的所述正训练样本和所述负训练样本之间的距离之差大于第四阈值。可选地,所述根据所述正训练样本和所述负训练样本分别指示的所述属性特征和所述行为特征,计算所述正训练样本与所述负训练样本之间的距离,包括:根据所述属性特征和所述行为特征,预训练所述判别器,并根据预训练后的所述判别器计算所述正训练样本与所述负训练样本之间的距离。为实现上述目的,根据本专利技术实施例的又一方面,提供了一种物品推荐装置。本专利技术实施例的一种物品推荐装置包括:样本获取模块、样本选择模块、训练模块和推荐模块;其中,所述样本获取模块,用于获取样本集,所述样本集中的训练样本指示了物品的属性特征和用户针对所述物品的行为特征;所述样本选择模块,用于从所述样本集中选择正训练样本和负训练样本,其中,所述正训练样本对应的物品被曝光且被点击,所述负训练样本对应的物品被曝光且未被点击;所述训练模块,用于循环执行以下步骤,训练用于物品推荐的判别器,直至达到训练停止准则:根据所述正训练样本和所述负训练样本分别指示的所述属性特征和所述行为特征,计算所述正训练样本与所述负训练样本之间的距离;计算所选择的负训练样本的判别参数,所述判别参数指示了所述负训练样本作为正训练样本的概率;根据所述距离和所述判别参数,从所述训练集中重新选择正训练样本以及与重新选择的正训练样本相关的负训练样本,根据重新选择的正训练样本和负训练样本,训练所述判别器;所述推荐模块,用于利用所述判别器从待推荐样本集中确定出待推荐正样本,并将所述待推荐正样本对应的物品推荐给用户。可选地,所述训练模块,用于将所述距离、所述判别参数以及所述判别参数对应的负训练样本作为用于选择样本的生成器的输入,以对所述生成器进行优化,并利用优化后的生成器,选择所述正训练样本以及与重新选择的正训练样本相关的负训练样本。可选地,所述训练模块,利用所述生成器从所述样本集中随机选择正训练样本,并根据所述正训练样本所指示的物品的属性特征和用户这对所述物品的行为特征,选择与所述正训练样本的相关度大于第一阈值的负训练样本。可选地,所述训练停止准则为:所述判别器计算出的负训练样本的判别参数与正训练样本的判别参数之差小于第二阈值,或循环训练所述判别器的次数大于第三阈值。为实现上述目的,根据本专利技术实施例的又一方面,提供了一种物品推荐的电子设备。本专利技术实施例的一种物品推荐的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术实施例的一种物品推荐的方法。为实现上述目的,根据本专利技术实施例的再一方面,提供了一种计算机可读存储介质。本专利技术实施例的一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本专利技术实施例的一种物品推荐的方法。上述专利技术中的一个实施例具有如下优点或有益效果:根据正训练样本和负训练分别指示的属性特征和行为特征,计算正训练样本与负训练样本之间的距离,然后根据该距离以及负训练样本的判别参数,重新选择正训练样本和与该正训练样本相关的负训练样本,并利用重新选择的正训练样本和负训练样本训练判别器,以提高判别器的训练效果,从而提高判别器的预测准确度,进而提高利用判别器进行物品推荐时所推荐本文档来自技高网...

【技术保护点】
1.一种物品推荐方法,其特征在于,包括:/n获取样本集,所述样本集中的训练样本指示了物品的属性特征和用户针对所述物品的行为特征;/n从所述样本集中选择正训练样本和负训练样本,其中,所述正训练样本对应的物品被曝光且被点击,所述负训练样本对应的物品被曝光且未被点击;/n循环执行以下步骤,训练用于物品推荐的判别器,直至达到训练停止准则:/n根据所述正训练样本和所述负训练样本分别指示的所述属性特征和所述行为特征,计算所述正训练样本与所述负训练样本之间的距离;/n计算所选择的负训练样本的判别参数,所述判别参数指示了所述负训练样本作为正训练样本的概率;/n根据所述距离和所述判别参数,从所述训练样本集中重新选择正训练样本以及与重新选择的正训练样本相关的负训练样本;/n根据重新选择的正训练样本和负训练样本,训练所述判别器;/n利用所述判别器从待推荐样本集中确定出待推荐正样本,并将所述待推荐正样本对应的物品推荐给用户。/n

【技术特征摘要】
1.一种物品推荐方法,其特征在于,包括:
获取样本集,所述样本集中的训练样本指示了物品的属性特征和用户针对所述物品的行为特征;
从所述样本集中选择正训练样本和负训练样本,其中,所述正训练样本对应的物品被曝光且被点击,所述负训练样本对应的物品被曝光且未被点击;
循环执行以下步骤,训练用于物品推荐的判别器,直至达到训练停止准则:
根据所述正训练样本和所述负训练样本分别指示的所述属性特征和所述行为特征,计算所述正训练样本与所述负训练样本之间的距离;
计算所选择的负训练样本的判别参数,所述判别参数指示了所述负训练样本作为正训练样本的概率;
根据所述距离和所述判别参数,从所述训练样本集中重新选择正训练样本以及与重新选择的正训练样本相关的负训练样本;
根据重新选择的正训练样本和负训练样本,训练所述判别器;
利用所述判别器从待推荐样本集中确定出待推荐正样本,并将所述待推荐正样本对应的物品推荐给用户。


2.根据权利要求1所述的方法,其特征在于,所述根据所述距离和所述判别参数,从所述训练样本集中重新选择正训练样本以及与重新选择的正训练样本相关的负训练样本,包括:
将所述距离、所述判别参数以及所述判别参数对应的负训练样本作为用于选择样本的生成器的输入,以对所述生成器进行优化;
利用优化后的生成器,重新选择所述正训练样本以及与重新选择的正训练样本相关的负训练样本。


3.根据权利要求2所述的方法,其特征在于,
根据所述距离和所述判别参数,计算所述生成器的优化梯度,并基于所述优化梯度、利用随机梯度法对所述生成器进行优化。


4.根据权利要求2所述的方法,其特征在于,所述从所述训练样本集中重新选择正训练样本以及与重新选择的正训练样本相关的负训练样本,包括:
利用所述生成器从所述样本集中随机选择正训练样本,并根据所述正训练样本所指示的物品的属性特征和用户针对所述物品的行为特征,选择与所述正训练样本的相关度大于第一阈值的负训练样本。


5.根据权利要求1所述的方法,其特征在于,
所述训练停止准则为:所述判别器计算出的负训练样本的判别参数与正训练样本的判别参数之差小于第二阈值,或循环训练所述判别器的次数大于第三阈值。


6.根据权利要求1所述的方法,其特征在于,
重新选择出的所述负训练样本的判别参数与重新选择出的所述正训练样本和所述负训练样本之间的距离之差大于第四阈值。


7.根据权利要求1所述的方法,其特征在于,所述根据所述正训练样本和所述负训练样本分别指示的所述属性特征和所述行为特征,计...

【专利技术属性】
技术研发人员:张亮张波王一凯
申请(专利权)人:北京沃东天骏信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1