基于用户群组采样的推荐方法、装置、设备和存储介质制造方法及图纸

技术编号:38996462 阅读:13 留言:0更新日期:2023-10-07 10:27
本发明专利技术公开了一种基于用户群组采样的推荐方法、装置、设备和存储介质。该推荐方法基于从互联网平台获取的用户的隐式反馈数据,通过在动态更新的模型上对物品熵进行建模,在优化中充分利用物品全局评分信息和用户共同的交互行为,采样更为可靠的相似用户群组。使用成对的群组偏好范式学习用户群组偏好,挖掘出用户潜在喜欢的物品,在改进模型推荐效果的同时还具有高度的可解释性和算法通用性。还具有高度的可解释性和算法通用性。还具有高度的可解释性和算法通用性。

【技术实现步骤摘要】
基于用户群组采样的推荐方法、装置、设备和存储介质


[0001]本专利技术涉及机器学习和推荐系统
,具体地,涉及一种基于用户群组采样的推荐方法、装置、设备和存储介质。

技术介绍

[0002]协同过滤已广泛应用于推荐系统,它利用历史行为数据来预测用户偏好。在现实场景中,收集的数据往往是隐式反馈的数据,也就是只能访问观察到的用户和物品之间的交互行为,例如社交媒体上的“点赞”或购物网站上的“购买”。隐式反馈数据不涉及数值评级,不能直接体现用户的偏好程度,大量的未被商业平台观察到的反馈信息不能简单被理解为用户对这些物品存在负反馈。其中,对级方法是处理隐式反馈的主流方法之一,其关注独立的用户

物品对之间的相对顺序,并试图最大化成对偏好的可能性。贝叶斯个性化排名正是代表性方法之一,很多对级排序方法基于贝叶斯个性化排名进行了研究和改进并且在实践中证明了其有效性。
[0003]隐式反馈数据的特点为改进推荐算法准确学习用户偏好带来了很大困扰,尽管上述对级排序方法在解决隐式反馈问题上有效,但这些方法大多数受到用户彼此独立的假设的影响,这与现实中用户总是相互关联的事实相矛盾,使得推荐系统无法充分挖掘用户之间丰富的交互信息。基于群偏好的贝叶斯个性化排名引入相似用户群组放松了用户独立性假设,为对级排序方法学习群组偏好提供了一种范式。但是,它采样相似用户群组时,仅仅关注在局限的相似交互行为,考虑到隐式反馈数据通常是十分稀疏的,采样到的用户群组的可靠性很可能不高。有许多尝试建模用户之间相似性的研究为采样相似用户提供了参考,然而其中绝大多数都聚焦在用户对物品的显示评分上。在隐式反馈场景下用户对所有交互过的物品都持有“相同”态度使得难以直接建模用户偏好的不同,想要采样相似的用户群组也更加困难,进而限制了推荐系统对用户偏好的精准学习。

技术实现思路

[0004]本专利技术的目的是提供一种基于用户群组采样的推荐方法,该方法能够构建更加可靠的相似用户群组,为个性化推荐系统引入更丰富可靠的用户交互信息,提升对于用户群组偏好的学习能力,改善推荐系统为用户提供个性化推荐的服务质量。
[0005]为了实现上述目的,本专利技术第一方面提供了一种基于用户群组采样的推荐方法,该方法包括:
[0006]步骤1、数据收集,从互联网在线平台获取用户的隐式反馈数据;
[0007]步骤2、数据预处理,根据步骤1中获取的隐式反馈数据划分训练数据和测试数据,用随机梯度下降算法并结合训练数据来优化用户和物品特征,基于随机初始化或引入群组偏好的对级排序目标学习,得到当前模型下用户的隐向量表示和物品的隐向量表示;
[0008]步骤3、相似性矩阵计算,基于全部用户对物品的预测评分为每个物品计算评分熵,再基于两两用户之间共同交互过的物品的预测评分差建模用户之间相似性,结合物品
的评分熵加权计算得到用户之间的相似性矩阵;
[0009]步骤4、用户群组采样,在每一次的更新中,随机选定一位用户,依照预先计算的相似性矩阵选取与该用户最相似的指定数量的用户构成用户组;
[0010]步骤5、结合不同目标采样对应数量的正负物品样本,形成基于群组偏好的排序对继续优化,根据模型最终学习的结果,按照预测的用户对物品的偏好程度,将排名靠前的若干物品作为用户可能喜欢的物品推荐给用户。
[0011]优选地,步骤1包括:
[0012]采用爬虫技术从互联网在线平台获取隐式反馈数据,其中,
[0013]对于不同的在线平台,收集相应不同的数据;
[0014]对于在线社交平台爬取用户对其他用户的关注记录;
[0015]对于在线媒体平台爬取用户对现在媒体的浏览记录;
[0016]对于在线电商平台根据开源数据获取用户对商品的购买记录;
[0017]根据收集到的数据,对其构建用户

物品矩阵,假设用户为u,物品为i,用户

物品矩阵中的元素(u,i)记录了用户u对物品i的操作记录,如果对应元素为1时,则表示此用户曾经与此物品产生过交互,此用户对此物品产生了正反馈。
[0018]优选地,步骤2包括:
[0019]使用表示用户集合,使用表示物品集合;其中,n和m分别表示用户的数量和物品的数量;对于每个用户u∈U,已经在物品集上表达了正反馈;为建模用户偏好,使用矩阵分解模型,其预测用户对于物品评分通过计算得到;其中,f
ui
表示用户u对物品i的预测评分,U
u
·
表示描述用户u特征的隐向量,V
i.
表示描述物品i特征的隐向量;进行推荐的目标即是从未交互过的物品集合中为每位用户按照用户对物品预测评分降序排列得到一个个性化的物品列表。
[0020]优选地,在步骤2中引入贝叶斯个性化排名BPR,BPR假设用户u偏好交互过的物品i胜过未交互物品j,即优化一种相对顺序,使得用户u对物品i的排序相对物品j的排序更靠前;BPR的成对偏好范式为:
[0021]f
BPR
=f
ui

f
uj
[0022]其中,
[0023]针对真实世界中用户总是互相联系,个性化的偏好会受到群组效应的影响这一情况,引入基于群组偏好的贝叶斯个性化排名G

BPR,以向成对排序目标中引入了群组偏好;用户群组G对于物品i的群组偏好由G中用户的个体偏好估计得到:
[0024]为更好学习个体偏好和群偏好,将二者线性组合得到融合偏好f
Gui
=ρf
Gi
+(1

\rho)f
ui
;其中,ρ是一个权衡参数;
[0025]针对在物品i的融合偏好f
Gui
大概率大于用户u在未交互过的物品上的偏好f
uj
,引入群组偏好的成对偏好顺序优化目标:
[0026]f
G

BPR
=f
Gui

f
uj

[0027]基于以上的优化目标,最大化一个优化成对排序目标的最大似然函数作为目标函
数,基于矩阵分解的模型,通过随机梯度下降的方式优化用户特征隐向量和物品特征隐向量。
[0028]优选地,步骤3包括:
[0029]对于两个特定用户u和v,使用I
u,v
表示他们共同交互过的物品集合,将基于全体用户对物品的得分计算物品评分的熵E(i)引入相似性度量中,并基于熵建立可靠的具有相近偏好的用户群组;
[0030]在协同过滤问题中,对于特定的物品i,熵用来描述不同用户对它产生不同评价的可能性;如果用户对物品的态度以不同程度表达从l
min
到l
max
,用l
i
表示物品i的评分标签,计算物品i的评分熵E(i)为:
[0031][0032]其中,如果用l表示从用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用户群组采样的推荐方法,其特征在于,所述方法包括:步骤1、数据收集,从互联网在线平台获取用户的隐式反馈数据;步骤2、数据预处理,根据步骤1中获取的隐式反馈数据划分训练数据和测试数据,用随机梯度下降算法并结合训练数据来优化用户和物品特征,基于随机初始化或引入群组偏好的对级排序目标学习,得到当前模型下用户的隐向量表示和物品的隐向量表示;步骤3、相似性矩阵计算,基于全部用户对物品的预测评分为每个物品计算评分熵,再基于两两用户之间共同交互过的物品的预测评分差建模用户之间相似性,结合物品的评分熵加权计算得到用户之间的相似性矩阵;步骤4、用户群组采样,在每一次的更新中,随机选定一位用户,依照预先计算的相似性矩阵选取与该用户最相似的指定数量的用户构成用户组;步骤5、结合不同目标采样对应数量的正负物品样本,形成基于群组偏好的排序对继续优化,根据模型最终学习的结果,按照预测的用户对物品的偏好程度,将排名靠前的若干物品作为用户可能喜欢的物品推荐给用户。2.根据权利要求1所述的基于用户群组采样的推荐方法,其特征在于,步骤1包括:采用爬虫技术从互联网在线平台获取隐式反馈数据,其中,对于不同的在线平台,收集相应不同的数据;对于在线社交平台爬取用户对其他用户的关注记录;对于在线媒体平台爬取用户对现在媒体的浏览记录;对于在线电商平台根据开源数据获取用户对商品的购买记录;根据收集到的数据,对其构建用户

物品矩阵,假设用户为u,物品为i,用户

物品矩阵中的元素(,i)记录了用户u对物品i的操作记录,如果对应元素为1时,则表示此用户曾经与此物品产生过交互,此用户对此物品产生了正反馈。3.根据权利要求1所述的基于用户群组采样的推荐方法,其特征在于,步骤2包括:使用表示用户集合,使用表示物品集合;其中,n和m分别表示用户的数量和物品的数量;对于每个用户u∈U,已经在物品集上表达了正反馈;为建模用户偏好,使用矩阵分解模型,其预测用户对于物品评分通过计算得到;其中,f
ui
表示用户u对物品i的预测评分,U
u
·
表示描述用户u特征的隐向量,V
i
·
表示描述物品i特征的隐向量;进行推荐的目标即是从未交互过的物品集合中为每位用户按照用户对物品预测评分降序排列得到一个个性化的物品列表。4.根据权利要求3所述的基于用户群组采样的推荐方法,其特征在于,在步骤2中引入贝叶斯个性化排名BPR,BPR假设用户u偏好交互过的物品i胜过未交互物品j,即优化一种相对顺序,使得用户u对物品i的排序相对物品j的排序更靠前;BPR的成对偏好范式为:f
BPR
=f
ui

f
uj
其中,针对真实世界中用户总是互相联系,个性化的偏好会受到群组效应的影响这一情况,引入基于群组偏好的贝叶斯个性化排名G

BPR,以向成对排序目标中引入了群组偏好;用户
群组G对于物品i的群组偏好由G中用户的个体偏好估计得到:为更好学习个体偏好和群偏好,将二者线性组合得到融合偏好f
Gui
=ρf
Gi
+(1

\rho)f
ui
;其中,ρ是一个权衡参数;针对在物品i的融合偏好f
Gui
大概率大于用户u在未交互过的物品上的偏好f
uj
,引入群组偏好的成对偏好顺序优化目标:f
G

VPR
=...

【专利技术属性】
技术研发人员:陈恩红刘淇陈宇杰黄振亚于润龙
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1