一种考虑由物品口碑因素导致一致性偏差的推荐方法技术

技术编号：38017945 阅读：8 留言：0更新日期：2023-06-30 10:45

本发明专利技术提供一种考虑由物品口碑因素导致一致性偏差的推荐方法，将一致性偏差划分为与人气相关的一致性偏差和与口碑相关的一致性偏差，并通过负样本划分策略将训练数据集合按照交互行为潜藏的驱动因素划分为不同原因的四组训练子集合，然后通过四组训练数据子集合的不同组合来训练三个因果嵌入从而得到细化的因果特征，以实现三种因果嵌入的独立学习，从而解耦了用户兴趣、物品人气、物品口碑三种因果嵌入，最后通过将用户和物品之间的推荐得分细化为用户兴趣得分、物品口碑得分和物品人气得分，为用户产生推荐结果，使得模型很容易根据相应的得分来解释用户点击物品的具体因素，提升了一定可解释性的同时，也对推荐的准确率有所提高。确率有所提高。

全部详细技术资料下载

【技术实现步骤摘要】
一种考虑由物品口碑因素导致一致性偏差的推荐方法

[0001]本专利技术属于人工智能
，具体涉及一种考虑由物品口碑因素导致一致性偏差的推荐方法。

技术介绍

[0002]推荐系统能够在用户没有明确需求的情况下，从用户的历史交互数据中挖掘用户偏好，为每个用户提供个性、精准、快速的内容筛选和推送，被认为是缓解信息过载的最有效方法。当前大多数研究旨在专利技术一些机器学习模型来不断拟合用户行为历史数据，但是由于用户在与推荐系统的交互过程中，可能会受到某些因素的影响，从而做出不符合自己本意的行为，导致推荐系统收集的反馈数据就会存在各种偏差。如果直接利用存在偏差的数据来训练模型，可能会使得模型无法完全准确挖掘出用户的偏好，以至于无法推荐给用户合适的符合要求的物品，从而降低推荐效果，影响用户体验。
[0003]推荐系统中的一致性偏差是指，用户受到大众或者朋友的影响，会倾向于给出与他人类似的反馈行为，即使这并不符合自己的本意。例如，用户可能仅仅因为许多其它用户点击了某个物品而点击该物品，事实上，这些交互主要是由用户的一致性驱动的，而不是由用户真正的兴趣驱动。一致性描述了用户倾向于跟随他人做出相似交互行为的一种现象，是用户做出决策考虑的一个关键因素。同时，不同的用户对不同的物品的一致性也有所不同。也有研究表明，披露物品评分会影响个人的决策以及他们对物品的质量和价值的看法，评级系统并不是简单的汇总个人意见，而是创造一个以系统方式影响后续评级的环境。现实生活中，随着信息的爆炸式增长，我们的决策也越来越依赖于他人提供的综合意见。例...

【技术保护点】

【技术特征摘要】
1.一种考虑由物品口碑因素导致一致性偏差的推荐方法，其特征在于，包括：步骤1：计算MovieLens
‑
10M数据集中物品的人气值和口碑值；步骤2：考虑由物品口碑导致的一致性偏差，构建面向一致性偏差问题的因果嵌入推荐模型；步骤3：使用训练样本对构建的因果嵌入推荐模型进行训练；步骤4：利用测试集作为训练后的模型输入，输出预测结果。2.根据权利要求1所述的一种考虑由物品口碑因素导致一致性偏差的推荐方法，其特征在于，所述步骤1包括：步骤1.1：对MovieLens
‑
10M数据集中的数据进行预处理；步骤1.2：计算训练集Q1中每个物品的人气值，将计算得到的人气值形成一个一维数组；步骤1.3：计算训练集Q1中每个物品的口碑值，将计算得到的口碑值形成一个一维数组。3.根据权利要求2所述的一种考虑由物品口碑因素导致一致性偏差的推荐方法，其特征在于，所述步骤1.1包括：步骤1.1.1：随机抽取MovieLens
‑
10M数据集中的M个数据，形成新的数据集Q，并按照一定的格式进行存储；步骤1.1.2：将数据集Q分为训练集Q1和测试集Q2，并分别进行存储。4.根据权利要求1所述的一种考虑由物品口碑因素导致一致性偏差的推荐方法，其特征在于，所述步骤2包括：步骤2.1：生成训练样本；步骤2.2：构建考虑物品口碑导致的一致性偏差问题的因果嵌入推荐模型；步骤2.3：构建预测点击任务的损失函数步骤2.4：构建独立性监督任务的损失函数步骤2.5：构建总体损失函数L。5.根据权利要求4所述的一种考虑由物品口碑因素导致一致性偏差的推荐方法，其特征在于，所述步骤2.1包括：步骤2.1.1：对于步骤1.1.2中的训练集文件，文件中的每一行记录均可生成一个训练样本，从该训练集文件中取出记录的用户ID，物品ID分别作为训练样本中的用户和正样本；步骤2.1.2：为步骤2.1.1中的用户和正样本进行负样本采样，生成N个负样本；步骤2.1.3：将步骤2.1.1中的一个用户和一个正样本和步骤2.1.2中的N个负样本组合成训练样本；步骤2.1.4：将步骤2.1.3中生成的训练样本进行分类；步骤2.1.5：将步骤2.1.4生成的四类训练样本集合作为模型的输入进行模型训练。6.根据权利要求4所述的一种考虑由物品口碑因素导致一致性偏差的推荐方法，其特征在于，所述步骤2.2包括：步骤2.2.1.1：构建物品人气建模的损失函数：
其中，u代表用户，i代表正样本，j代表正样本，u
(pop)
、i
(pop)
、j
(pop)
分别代表用户、正样本、负样本的人气嵌入，表示物品人气建模在数据子集O1和数据子集O2上的损失函数，表示物品人气建模在数据子集O3和数据子集O4上的损失函数，BPR()表示Bayesian Personalized Ranking损失函数，可以使得正样本和负样本之间的差值尽可能大；步骤2.2.1.2：构建物品口碑建模的损失函数：步骤2.2.1.2：构建物品口碑建模的损失函数：其中，u代表用户，i代表正样本，j代表正样本，u
(rep)
、i...

【专利技术属性】
技术研发人员：郭楠，黄慧慧，高天寒，
申请(专利权)人：东北大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人