基于用户群组采样的推荐方法、装置、设备和存储介质制造方法及图纸

技术编号：38996462 阅读：13 留言：0更新日期：2023-10-07 10:27

本发明专利技术公开了一种基于用户群组采样的推荐方法、装置、设备和存储介质。该推荐方法基于从互联网平台获取的用户的隐式反馈数据，通过在动态更新的模型上对物品熵进行建模，在优化中充分利用物品全局评分信息和用户共同的交互行为，采样更为可靠的相似用户群组。使用成对的群组偏好范式学习用户群组偏好，挖掘出用户潜在喜欢的物品，在改进模型推荐效果的同时还具有高度的可解释性和算法通用性。还具有高度的可解释性和算法通用性。还具有高度的可解释性和算法通用性。

全部详细技术资料下载

【技术实现步骤摘要】
基于用户群组采样的推荐方法、装置、设备和存储介质

[0001]本专利技术涉及机器学习和推荐系统
，具体地，涉及一种基于用户群组采样的推荐方法、装置、设备和存储介质。

技术介绍

[0002]协同过滤已广泛应用于推荐系统，它利用历史行为数据来预测用户偏好。在现实场景中，收集的数据往往是隐式反馈的数据，也就是只能访问观察到的用户和物品之间的交互行为，例如社交媒体上的“点赞”或购物网站上的“购买”。隐式反馈数据不涉及数值评级，不能直接体现用户的偏好程度，大量的未被商业平台观察到的反馈信息不能简单被理解为用户对这些物品存在负反馈。其中，对级方法是处理隐式反馈的主流方法之一，其关注独立的用户
‑
物品对之间的相对顺序，并试图最大化成对偏好的可能性。贝叶斯个性化排名正是代表性方法之一，很多对级排序方法基于贝叶斯个性化排名进行了研究和改进并且在实践中证明了其有效性。
[0003]隐式反馈数据的特点为改进推荐算法准确学习用户偏好带来了很大困扰，尽管上述对级排序方法在解决隐式反馈问题上有效，但这些方法大多数受到用户彼此独立的假设的影响，这与现实中用户总是相互关联的事实相矛盾，使得推荐系统无法充分挖掘用户之间丰富的交互信息。基于群偏好的贝叶斯个性化排名引入相似用户群组放松了用户独立性假设，为对级排序方法学习群组偏好提供了一种范式。但是，它采样相似用户群组时，仅仅关注在局限的相似交互行为，考虑到隐式反馈数据通常是十分稀疏的，采样到的用户群组的可靠性很可能不高。有许多尝试建模用户之间相似性的研究为采样相似用户提供...

【技术保护点】

【技术特征摘要】
1.一种基于用户群组采样的推荐方法，其特征在于，所述方法包括：步骤1、数据收集，从互联网在线平台获取用户的隐式反馈数据；步骤2、数据预处理，根据步骤1中获取的隐式反馈数据划分训练数据和测试数据，用随机梯度下降算法并结合训练数据来优化用户和物品特征，基于随机初始化或引入群组偏好的对级排序目标学习，得到当前模型下用户的隐向量表示和物品的隐向量表示；步骤3、相似性矩阵计算，基于全部用户对物品的预测评分为每个物品计算评分熵，再基于两两用户之间共同交互过的物品的预测评分差建模用户之间相似性，结合物品的评分熵加权计算得到用户之间的相似性矩阵；步骤4、用户群组采样，在每一次的更新中，随机选定一位用户，依照预先计算的相似性矩阵选取与该用户最相似的指定数量的用户构成用户组；步骤5、结合不同目标采样对应数量的正负物品样本，形成基于群组偏好的排序对继续优化，根据模型最终学习的结果，按照预测的用户对物品的偏好程度，将排名靠前的若干物品作为用户可能喜欢的物品推荐给用户。2.根据权利要求1所述的基于用户群组采样的推荐方法，其特征在于，步骤1包括：采用爬虫技术从互联网在线平台获取隐式反馈数据，其中，对于不同的在线平台，收集相应不同的数据；对于在线社交平台爬取用户对其他用户的关注记录；对于在线媒体平台爬取用户对现在媒体的浏览记录；对于在线电商平台根据开源数据获取用户对商品的购买记录；根据收集到的数据，对其构建用户
‑
物品矩阵，假设用户为u，物品为i，用户
‑
物品矩阵中的元素(,i)记录了用户u对物品i的操作记录，如果对应元素为1时，则表示此用户曾经与此物品产生过交互，此用户对此物品产生了正反馈。3.根据权利要求1所述的基于用户群组采样的推荐方法，其特征在于，步骤2包括：使用表示用户集合，使用表示物品集合；其中，n和m分别表示用户的数量和物品的数量；对于每个用户u∈U，已经在物品集上表达了正反馈；为建模用户偏好，使用矩阵分解模型，其预测用户对于物品评分通过计算得到；其中，f
ui
表示用户u对物品i的预测评分，U
u
·
表示描述用户u特征的隐向量，V
i
·
表示描述物品i特征的隐向量；进行推荐的目标即是从未交互过的物品集合中为每位用户按照用户对物品预测评分降序排列得到一个个性化的物品列表。4.根据权利要求3所述的基于用户群组采样的推荐方法，其特征在于，在步骤2中引入贝叶斯个性化排名BPR，BPR假设用户u偏好交互过的物品i胜过未交互物品j，即优化一种相对顺序，使得用户u对物品i的排序相对物品j的排序更靠前；BPR的成对偏好范式为：f
BPR
＝f
ui
‑
f
uj
其中，针对真实世界中用户总是互相联系，个性化的偏好会受到群组效应的影响这一情况，引入基于群组偏好的贝叶斯个性化排名G
‑
BPR，以向成对排序目标中引入了群组偏好；用户
群组G对于物品i的群组偏好由G中用户的个体偏好估计得到：为更好学习个体偏好和群偏好，将二者线性组合得到融合偏好f
Gui
＝ρf
Gi
+(1
‑
\rho)f
ui
；其中，ρ是一个权衡参数；针对在物品i的融合偏好f
Gui
大概率大于用户u在未交互过的物品上的偏好f
uj
，引入群组偏好的成对偏好顺序优化目标：f
G
‑
VPR
＝...

【专利技术属性】
技术研发人员：陈恩红，刘淇，陈宇杰，黄振亚，于润龙，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人