System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及推荐系统,尤其涉及一种基于反事实学习的去偏置认知推荐方法及系统。
技术介绍
1、现有的推荐方法主要包括基于深度学习和基于知识图谱的推荐方法,其中,对于基于深度学习的推荐方法,有关研究提出了协同深度过滤方法,此方法通过堆栈去噪自编码器处理用户评论文本信息来学习用户和物品的语义表示,联合协同过滤方法预测用户评分,以提高推荐准确率,同时也有研究提出了协同注意力多任务学习框架,该框架在传统的编码器-解码器框架基础上,引入了编码器-选择器-解码器的结构,通过设计层次化的协同注意力选择器,促进推荐预测和解释生成两个任务间交叉语义的知识迁移,提高了推荐准确率,此外,也有研究者在图协同过滤模型的基础上进行优化,提出了基于增强图学习的协同过滤模型,该模型根据用户和物品间的相似关系构建增强图,并利用图卷积网络来学习用户和物品的特征表示,设计局部-全局优化函数实现模型优化。
2、然而,深度学习模型通常包含深度嵌套的非线性结构,使得确定影响推荐决策的具体因素变得困难,导致其在动态变化的环境、对抗干扰与虚假信息情况下鲁棒性显著下降,而且基于深度学习的推荐方法大多依赖于数据驱动,因此,数据稀疏和数据偏置问题也严重影响推荐系统的效用性。
3、另一方面,对于基于知识图谱的推荐方法,有研究人员提出特征表示学习方法来处理外部知识库引入的结构化实体关联信息、非结构化文本和视觉内容信息,并通过设计协同过滤和知识嵌入表示的联合学习框架实现了物品推荐;与此同时,有其他的研究者提出了端到端的知识图谱感知推荐方法,这种方法从知识图谱的关联
4、然而,目前基于知识图谱的推荐方法易于引入冗余噪声数据,难以处理无关联的实体,影响推荐效率和结果,此外,目前基于知识图谱的推荐方法仍然是从感知层面利用知识增强学习用户行为偏好表示,忽略了细粒度的用户行为意图及其演化,无法实现用户行为的认知理解,这限制了推荐方法的深度和准确性。
5、综上所述,现有的推荐方法虽然在推荐效果上取得了提升,但由于用户行为数据稀疏和数据偏置问题,仍然难以准确地学习用户行为偏好表示,同时,目前的用户行为理解建模仍然停留在感知层面,难以挖掘用户行为潜在意图和意图演化模式,难以生成高质量、鲁棒的推荐结果。
技术实现思路
1、本专利技术的目的在于提供一种基于反事实学习的去偏置认知推荐方法及系统,通过基于反事实学习的多任务去偏置认知优化推荐模型对抗数据偏置的影响,并挖掘用户行为意图及其动态演化机理,提升推荐的准确性和鲁棒性。
2、为解决以上技术问题,本专利技术提供了一种基于反事实学习的去偏置认知推荐方法及系统。
3、第一方面,本专利技术提供了一种基于反事实学习的去偏置认知推荐方法,所述方法包括以下步骤:
4、构建用户行为表征序列,并将所述用户行为表征序列输入预先构建的用户行为意图演化模型中动态学习用户行为意图演化,得到用户行为意图演化状态表示;
5、根据所述用户行为意图演化状态表示和用户偏好表示,构建用户行为状态表征;
6、利用基于反事实学习的多任务去偏置认知优化推荐模型对用户行为状态表征和物品表征进行预测,得到用户-物品偏好优化评分;所述基于反事实学习的多任务去偏置认知优化推荐模型包括用户-物品交互推荐预测模型和基于反事实学习的双重鲁棒去偏置推荐预测损失估计器;
7、根据所述用户-物品偏好优化评分对物品进行排序,得到物品推荐列表。
8、在进一步的实施方案中,所述用户行为意图演化模型包括串联的循环神经网络和用户行为意图记忆网络模型;所述将所述用户行为表征序列输入预先构建的用户行为意图演化模型中动态学习用户行为意图演化,得到用户行为意图演化状态表示的步骤包括:
9、将所述用户行为表征序列输入所述循环神经网络中学习用户行为意图的语义依赖信息,生成用户行为语义意图状态表示;
10、将所述用户行为语义意图状态表示输入所述用户行为意图记忆网络模型中动态学习用户行为意图演化,得到用户行为意图记忆状态表示;
11、将所述用户行为语义意图状态表示和所述用户行为意图记忆状态合并,生成用户行为意图演化状态表示。
12、在进一步的实施方案中,用户行为意图记忆网络模型包括记忆矩阵和记忆控制器,所述记忆矩阵包括若干记忆槽;
13、所述记忆控制器用于根据用户行为语义意图状态表示进行内容寻址,采用读写操作从所述记忆矩阵的记忆槽中读取用户行为意图记忆状态表示,并更新记忆矩阵,所述记忆矩阵的更新表达式为:
14、
15、其中,
16、
17、式中,为记忆矩阵中第k个记忆槽所存储的用户行为意图状态表示;g为门向量,所述门向量用于确定用于更新所述记忆矩阵的用户行为意图状态表示的保留比例;为用户行为语义意图状态表示;σ(·)为激活函数。
18、在进一步的实施方案中,所述基于反事实学习的双重鲁棒去偏置推荐预测损失估计器包括倾向分数估计器和插补错误评估器;所述利用基于反事实学习的多任务去偏置认知优化推荐模型对用户行为状态表征和物品表征进行预测,得到用户-物品偏好优化评分的步骤包括:
19、采用基于反事实学习的双重鲁棒去偏置推荐预测损失估计器对用户行为状态表征和物品表征进行估计,得到倾向分数估计值和插补错误评估值;所述物品表征包括物品表示和用户-物品交互关系表示;
20、利用用户-物品交互推荐预测模型对用户行为状态表征和物品表征进行融合学习,得到预测推荐分数,并根据所述倾向分数估计值和所述插补错误评估值对所述预测推荐分数进行去偏置处理,预测得到用户-物品偏好优化评分。
21、在进一步的实施方案中,所述用户-物品交互推荐预测模型采用层次化神经协同过滤推荐预测模型,所述层次化神经协同过滤推荐预测模型包括两层神经网络层;
22、第一层神经网络层用于利用注意力机制聚合不同时刻的用户行为状态表征,得到全局用户状态表征;
23、第二层神经网络层用于采用多层感知器对所述全局用户状态表征和物品表征进行融合学习,并结合所述倾向分数估计值和所述插补错误评估值进行去偏置处理,预测得到用户-物品偏好优化评分。
24、在进一步的实施方案中,所述基于反事实学习的多任务去偏置认知优化推荐模型采用由推荐预测损失、倾向分数损失和数据插补损失构成的多任务损失函数进行训练和优化。
25、在进一步的实施方案中,所述多任务损失函数的数学表达式为:
26、
27、式中,l(·)为多任务损失函数;pu为用户行为状态表征;ev为物品表示;ruv为用户-物品交互关系表示;θ为用户-物品交互推荐预测模型中的所有参数;为倾向分数本文档来自技高网...
【技术保护点】
1.一种基于反事实学习的去偏置认知推荐方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于反事实学习的去偏置认知推荐方法,其特征在于,所述用户行为意图演化模型包括串联的循环神经网络和用户行为意图记忆网络模型;所述将所述用户行为表征序列输入预先构建的用户行为意图演化模型中动态学习用户行为意图演化,得到用户行为意图演化状态表示的步骤包括:
3.如权利要求2所述的一种基于反事实学习的去偏置认知推荐方法,其特征在于:用户行为意图记忆网络模型包括记忆矩阵和记忆控制器,所述记忆矩阵包括若干记忆槽;
4.如权利要求1所述的一种基于反事实学习的去偏置认知推荐方法,其特征在于,所述基于反事实学习的双重鲁棒去偏置推荐预测损失估计器包括倾向分数估计器和插补错误评估器;所述利用基于反事实学习的多任务去偏置认知优化推荐模型对用户行为状态表征和物品表征进行预测,得到用户-物品偏好优化评分的步骤包括:
5.如权利要求4所述的一种基于反事实学习的去偏置认知推荐方法,其特征在于:所述用户-物品交互推荐预测模型采用层次化神经协同过滤推荐预测模型,所述层次化
6.如权利要求4所述的一种基于反事实学习的去偏置认知推荐方法,其特征在于:所述基于反事实学习的多任务去偏置认知优化推荐模型采用由推荐预测损失、倾向分数损失和数据插补损失构成的多任务损失函数进行训练和优化。
7.如权利要求6所述的一种基于反事实学习的去偏置认知推荐方法,其特征在于,所述多任务损失函数的数学表达式为:
8.一种基于反事实学习的去偏置认知推荐系统,其特征在于,所述系统包括:
9.一种计算机设备,其特征在于:包括处理器和存储器,所述处理器与所述存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述计算机设备执行如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有计算机程序,当所述计算机程序被运行时,实现如权利要求1至7任一项所述的方法。
...【技术特征摘要】
1.一种基于反事实学习的去偏置认知推荐方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于反事实学习的去偏置认知推荐方法,其特征在于,所述用户行为意图演化模型包括串联的循环神经网络和用户行为意图记忆网络模型;所述将所述用户行为表征序列输入预先构建的用户行为意图演化模型中动态学习用户行为意图演化,得到用户行为意图演化状态表示的步骤包括:
3.如权利要求2所述的一种基于反事实学习的去偏置认知推荐方法,其特征在于:用户行为意图记忆网络模型包括记忆矩阵和记忆控制器,所述记忆矩阵包括若干记忆槽;
4.如权利要求1所述的一种基于反事实学习的去偏置认知推荐方法,其特征在于,所述基于反事实学习的双重鲁棒去偏置推荐预测损失估计器包括倾向分数估计器和插补错误评估器;所述利用基于反事实学习的多任务去偏置认知优化推荐模型对用户行为状态表征和物品表征进行预测,得到用户-物品偏好优化评分的步骤包括:
5.如权利要求4所述的一种基于反事实学习的去偏置认知推荐方法,其特征在于:所述用户-...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。