商品推荐方法、装置、系统、计算机设备及存储介质制造方法及图纸

技术编号:23513559 阅读:28 留言:0更新日期:2020-03-18 00:35
本发明专利技术涉及商品推荐方法、装置、系统、计算机设备及存储介质,属于信息推荐技术领域。该方法包括:获取预先构建的第一样本采集模型;所述第一样本采集模型用于表征曝光商品负样本和初始商品负样本之间的相关性;所述初始商品负样本中包含有未曝光商品负样本;根据所述第一样本采集模型,从所述初始商品负样本中确定目标采样商品负样本;根据所述目标采样商品负样本确定目标推荐商品。上述技术方案,解决了传统商品推荐方法不能得到准确的商品推荐结果的问题。能从包含有未曝光商品负样本的初始商品负样本中选取出代表用户真实负向喜好的负样本,进而得到准确的商品推荐结果。

Recommended methods, devices, systems, computer equipment and storage media

【技术实现步骤摘要】
商品推荐方法、装置、系统、计算机设备及存储介质
本专利技术涉及信息推荐
,特别是涉及商品推荐方法、装置、系统、计算机设备及存储介质。
技术介绍
推荐系统是一种信息过滤系统,用于预测用户对信息的“评分”或“偏好”并向用户推荐相应的信息,广泛应用于电商、搜索等领域。例如在电商场景下,个性化的推荐系统可以为用户推荐可能购买的商品。在大多数应用场景下,推荐系统只能通过用户与商品之间隐式的反馈行为(如购买属于隐式反馈,而对商品的评分则属于显式反馈)进行推断,这种系统称为隐反馈系统。在实现本专利技术过程中,专利技术人发现传统方式中至少存在如下问题:隐反馈推荐系统的特点是仅能观察到用户的正反馈行为(如购买商品),而真正的负反馈(用户实际上没有兴趣购买该商品)和缺失值(用户可能有兴趣购买,只是没有发现这件商品)却未观察到(即一个用户未购买某样商品)。隐反馈推荐系统的难点在于未观察数据(负样本)的处理,面向隐反馈推荐系统的负采样方法在采样过程中倾向于选择梯度最大方向的困难样本作为负样本,这样虽然能加快收敛速度,提高最终推荐效果,但存在训练过程不稳定、选取负样本不能代表用户真实负向喜好的问题。因此,传统的方法并不能得到准确的商品推荐结果。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
基于此,本专利技术实施例提供了商品推荐方法、装置、系统、计算机设备及存储介质,能选取出代表用户真实负向喜好的负样本,得到准确的商品推荐结果。本专利技术实施例的内容如下:在一个实施例中,提供一种商品推荐方法,包括以下步骤:获取预先构建的第一样本采集模型;所述第一样本采集模型用于表征曝光商品负样本和初始商品负样本之间的相关性;所述初始商品负样本中包含有未曝光商品负样本;根据所述第一样本采集模型,从所述初始商品负样本中确定目标采样商品负样本;根据所述目标采样商品负样本确定目标推荐商品。在一个实施例中,提供一种商品推荐装置,包括:模型获取模块,用于获取预先构建的第一样本采集模型;所述第一样本采集模型用于表征曝光商品负样本和初始商品负样本之间的相关性;所述初始商品负样本中包含有未曝光采样商品负样本;目标负样本确定模块,用于根据所述第一样本采集模型,从所述初始商品负样本中确定目标采样商品负样本;推荐商品确定模块,用于根据所述目标采样商品负样本确定目标推荐商品。在一个实施例中,所述商品推荐装置,还包括:表达式获取模块,用于获取目标用户对初始商品负样本的第一喜好程度表达式;第一采集模型构建模块,用于根据所述第一喜好程度表达式构建第二样本采集模型;所述目标负样本确定模块,包括:模型优化子模块,用于通过所述第二样本采集模型对所述第一样本采集模型进行优化,得到第三样本采样模型;目标负样本确定子模块,用于通过所述第三样本采样模型,从所述初始商品负样本中确定目标采样商品负样本。在一个实施例中,所述模型优化子模块,包括:加权和计算单元,用于根据预先确定的第一调整权重,确定所述第一样本采集模型和所述第二样本采集模型的第一加权和;采集模型确定单元,用于将所述第一加权和,确定为所述第三样本采集模型。在一个实施例中,目标负样本确定子模块,包括:模型优化单元,用于基于强化学习策略梯度方法的梯度准则,对所述第三样本采集模型进行优化;商品负样本确定单元,用于通过优化后的所述第三样本采集模型,从所述初始商品负样本中确定目标采样商品负样本。在一个实施例中,所述第一采集模型构建模块,包括:标准差获取子模块,用于获取所述初始商品负样本的标准差;乘积确定子模块,用于确定所述标准差和所述第一喜好程度表达式的乘积;采集模型确定子模块,用于根据所述乘积的第一数学期望表达式,得到所述第二样本采集模型。在一个实施例中,所述推荐商品确定模块,包括:排序模型获取子模块,用于获取预先构建的排序模型;所述排序模块根据所述第一喜好程度表达式和第二喜好程度表达式构建;所述第二喜好程度表达式为所述目标用户对商品正样本的喜好程度表达式;喜好程度值获取子模块,用于获取所述第二喜好程度表达式对应的喜好程度分值,得到正样本喜好程度值;模型计算子模块,用于将所述正样本喜好程度值代入所述排序模型的第二喜好程度表达式中,以使所述排序模型对应的损失函数最大化所述第一喜好程度表达式和所述正样本喜好程度值之间的差值,根据最大化处理结果确定与所述第一喜好程度表达式对应的喜好程度值,得到负样本喜好程度值,并根据所述负样本喜好程度值得到对所述初始商品负样本进行排序的排序结果;推荐商品确定子模块,用于根据所述排序模型输出的排序结果,确定针对所述目标用户的目标推荐商品。在一个实施例中,所述相关性包括交叠程度;所述目标负样本确定模块,还用于根据所述第一样本采集模型,确定与所述曝光商品负样本交叠程度最大的初始商品负样本,作为所述目标采样商品负样本。在一个实施例中,所述商品推荐装置,还包括:二值函数确定模块,用于根据所述初始商品负样本,确定与所述曝光商品负样本对应的二值函数;其中,若目标采样商品负样本存在于所述曝光商品负样本中,则对应的二值函数的输出为1,否则为0;第二采集模型构建模块,用于根据所述二值函数对应的第二数学期望表达式,构建所述第一样本采集模型。在一个实施例中,所述第二采集模型构建模块,包括:平均差异确定子模块,用于确定所述初始商品负样本与所述曝光商品负样本的最大平均差异表达式;加权和计算子模块,用于根据预先确定的第二调整权重,计算所述二值函数和所述最大平均差异表达式的第二加权和;数学期望计算子模块,用于根据所述第二加权和的数学期望,得到所述第二数学期望表达式。在一个实施例中,提供一种商品推荐系统,包括:网络连接的采样器和推荐器;所述采样器,用于获取预先构建的第一样本采集模型;所述第一样本采集模型用于表征曝光商品负样本和初始商品负样本之间的相关性;所述初始商品负样本中包含有未曝光商品负样本;根据所述第一样本采集模型,从所述初始商品负样本中确定目标采样商品负样本;所述推荐器,用于根据所述目标采样商品负样本确定目标推荐商品。在一个实施例中,所述商品推荐系统,还包括控制器;所述控制器分别与所述采样器和所述推荐器网络连接;所述控制器,用于通过对抗生成网络对所述采样器和所述推荐器进行训练。在一个实施例中,所述控制器,还用于确定所述曝光商品负样本的第一梯度以及所述目标采样商品负样本的第二梯度,获取预先确定的步长,根据所述步长、第一梯度以及第二梯度更新所述第一样本采样模型的模型参数。在一个实施例中,提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取预先构建的第一样本采集模型;所述第一样本采集模型用于表征曝光商品负样本和初始商品负样本之间的相关性;所述初始商品负样本中包含有未曝光商品负样本;根据所述第一样本采集模型,从所述初始商品负样本中确定目标采样商品负样本;根据所述目标采样商品负样本确定目标推本文档来自技高网...

【技术保护点】
1.一种商品推荐方法,其特征在于,包括:/n获取预先构建的第一样本采集模型;所述第一样本采集模型用于表征曝光商品负样本和初始商品负样本之间的相关性;所述初始商品负样本中包含有未曝光商品负样本;/n根据所述第一样本采集模型,从所述初始商品负样本中确定目标采样商品负样本;/n根据所述目标采样商品负样本确定目标推荐商品。/n

【技术特征摘要】
1.一种商品推荐方法,其特征在于,包括:
获取预先构建的第一样本采集模型;所述第一样本采集模型用于表征曝光商品负样本和初始商品负样本之间的相关性;所述初始商品负样本中包含有未曝光商品负样本;
根据所述第一样本采集模型,从所述初始商品负样本中确定目标采样商品负样本;
根据所述目标采样商品负样本确定目标推荐商品。


2.根据权利要求1所述的方法,其特征在于,所述获取预先构建的第一样本采集模型的步骤之前,还包括:
获取目标用户对初始商品负样本的第一喜好程度表达式;
根据所述第一喜好程度表达式构建第二样本采集模型;
所述根据所述第一样本采集模型,从所述初始商品负样本中确定目标采样商品负样本的步骤,包括:
通过所述第二样本采集模型对所述第一样本采集模型进行优化,得到第三样本采样模型;
通过所述第三样本采样模型,从所述初始商品负样本中确定目标采样商品负样本。


3.根据权利要求2所述的方法,其特征在于,所述通过所述第二样本采集模型对所述第一样本采集模型进行优化,得到第三样本采样模型的步骤,包括:
根据预先确定的第一调整权重,确定所述第一样本采集模型和所述第二样本采集模型的第一加权和;
将所述第一加权和,确定为所述第三样本采集模型。


4.根据权利要求3所述的方法,其特征在于,所述通过所述第三样本采样模型,从所述初始商品负样本中确定目标采样商品负样本的步骤,包括:
基于强化学习策略梯度方法的梯度准则,对所述第三样本采集模型进行优化;
通过优化后的所述第三样本采集模型,从所述初始商品负样本中确定目标采样商品负样本。


5.根据权利要求2所述的方法,其特征在于,所述根据所述第一喜好程度表达式构建第二样本采集模型的步骤,包括:
获取所述初始商品负样本的标准差;
确定所述标准差和所述第一喜好程度表达式的乘积;
根据所述乘积的第一数学期望表达式,得到所述第二样本采集模型。


6.根据权利要求2所述的方法,其特征在于,所述根据所述目标采样商品负样本确定目标推荐商品的步骤,包括:
获取预先构建的排序模型;所述排序模块根据所述第一喜好程度表达式和第二喜好程度表达式构建;所述第二喜好程度表达式为所述目标用户对商品正样本的喜好程度表达式;
获取所述第二喜好程度表达式对应的喜好程度分值,得到正样本喜好程度值;
将所述正样本喜好程度值代入所述排序模型的第二喜好程度表达式中,以使所述排序模型对应的损失函数最大化所述第一喜好程度表达式和所述正样本喜好程度值之间的差值,根据最大化处理结果确定与所述第一喜好程度表达式对应的喜好程度值,得到负样本喜好程度值,并根据所述负样本喜好程度值得到对所述初始商品负样本进行排序的排序结果;
根据所述排序模型输出的排序结果,确定针对所述目标用户的目标推荐商品。


7.根据权利要求1所述的方法,其特征在于...

【专利技术属性】
技术研发人员:杨建博李勇丁璟韬全雨晗
申请(专利权)人:腾讯科技深圳有限公司清华大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1