System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于知识图谱的序列化推荐方法技术_技高网
当前位置: 首页 > 专利查询>东南大学专利>正文

基于知识图谱的序列化推荐方法技术

技术编号:40110908 阅读:3 留言:0更新日期:2024-01-23 19:09
本发明专利技术提供了一种基于知识图谱的序列化推荐方法,包括:设计时间注意力机制训练序列化推荐模型,建模用户历史兴趣序列;设计多粒度聚合方法训练知识图谱表示学习模型,建模物品辅助信息;采用多任务学习框架将序列化推荐模型和知识图谱模型相结合,在用户兴趣和物品信息间搭建桥梁,推荐用户感兴趣的物品。与现有推荐方法相比,本发明专利技术一是能挖掘用户随时间推移的动态偏好;二是能挖掘物品高阶信息,避免物品信息损失;三是提出为用户动态兴趣序列与物品静态辅助信息通过多任务学习完成信息共享,提升推荐效果。

【技术实现步骤摘要】

本专利技术涉及一种基于知识图谱的序列化推荐方法,属于推荐算法。


技术介绍

1、推荐算法是用户在互联网海量信息中高效获取感兴趣信息的有效途径,已经是短视频、电商等面向用户的互联网产品研究的核心方法。

2、推荐算法的核心是在用户兴趣点与海量互联网信息间建立桥梁,构建出一个找寻感兴趣信息的方法。其具体过程如图1所示可被抽象表示为由用户塔和物品塔所组成的双塔架构:推荐算法在用户塔侧根据用户历史交互信息经过用户侧模型fu得到用户兴趣表示,并在物品塔侧根据物品辅助信息经过物品侧模型gv得到物品信息表示,最后根据两者相关性预测用户对物品的喜好程度以对用户进行推荐。

3、目前基于双塔架构的推荐算法已取得巨大成功,但仍存在以下三方面亟待解决的主要问题:(1)对于用户塔侧历史交互信息,模型难以建模历史序列中的时序特征。(2)对于物品塔侧辅助信息,模型难以避免多元辅助信息融合进物品表示时带来的信息损失。(3)双塔架构通常会对双塔信息交叉以进一步提升模型效果,对于信息交叉模型难以挖掘双塔间相关性,同时交叉参数过多易造成信息间负迁移。


技术实现思路

1、为解决上述问题,本专利技术提供一种基于知识图谱的序列化推荐方法,其一能挖掘用户随时间推移的动态偏好;二能挖掘物品高阶信息,避免信息损失;三能将用户物品信息完成交互,提升推荐效果。

2、为了达到上述目的,本专利技术提供如下方案:

3、一种基于知识图谱的序列化推荐方法,包括如下步骤:

4、步骤1:得到序列化推荐模型建模用户历史兴趣,先采集推荐数据集中用户兴趣序列输入模型;再设计时间注意力机制编码序列信息;最后在模型输出得到用户兴趣表示并与物品信息表示进行相关度计算得到推荐物品,并设计损失函数完成训练。

5、步骤2:得到知识图谱表示学习模型建模物品辅助信息,先采集推荐数据集中物品辅助信息输入模型;再设计多粒度聚合方法编码辅助信息得到物品信息表示,并设计损失函数完成训练。

6、步骤3:将步骤1中得到的序列化推荐模型和步骤2中得到的知识图谱模型采用多任务学习框架进行结合,先设计参数共享机制完成信息交互,再设计交替学习方法训练模型。

7、进一步的,所述步骤1中用户兴趣序列包括每个用户按时间排序的历史行为序列和行为对应的时间戳序列。

8、进一步的,所述步骤1中时间注意力机制模块编码序列信息,包括:对用户历史行为序列嵌入得到序列信息;对时间戳序列编码得到时间信息;最后将上述编码的序列信息和时间信息引入注意力机制。

9、进一步的,所述将时间戳序列编码得到时间信息,包括:

10、(1)将时间戳序列两两位置的时间差作为矩阵对应位置值生成时间相对矩阵。

11、(2)将时间相对矩阵中每个元素按正余弦编码、径向基核函数编码、指数编码得到相对时间编码向量、核函数编码向量和指数编码向量。

12、进一步的,所述将编码的序列信息和时间信息引入注意力机制,包括:对序列信息和时间编码信息采用多头注意力机制进行结合,得到输出即用户兴趣表示。

13、进一步的,所述步骤1将用户兴趣表示与物品信息表示进行相关度计算得到推荐物品,并设计损失函数完成训练包括:将用户兴趣和每个候选物品计算其是下个交互物品的概率分数,选择分数最大的作为推荐结果,并采用二元交叉熵损失函数优化训练集中样本概率分数。

14、进一步的,所述步骤2设计多粒度聚合方法编码辅助信息,得到物品信息表示并设计损失函数完成训练,包括:

15、(1)将(物品,关系,辅助信息)三元组嵌入得到三元组向量。

16、(2)借鉴gcn图卷积网络对辅助信息完成加权聚合,并提出ffm聚合,对辅助信息一阶特征两两交叉聚合,从细粒度建模辅助信息。

17、(3)将两种不同粒度聚合结果拼接得到物品信息并更新三元组向量,最后采用合页损失函数优化训练集中真实三元组的概率分数。

18、进一步的,所述步骤3设计参数共享机制完成信息交互,包括:以序列化推荐模型中的序列物品向量e(v)和知识图谱模型对应物品实体向量e(h)进行交互,过程为:

19、(1)知识图谱信息向序列化推荐模型传递时,为避免参数过多导致过拟合,将e(h)作为推荐任务中e(v)在注意力层组件的信息源,完成参数传递。

20、(2)序列信息向知识图谱传递时,设计交叉矩阵将e(v)信息融入e(h),完成参数传递。

21、进一步的,所述步骤3设计交替学习方法训练模型,包括:根据训练序列化推荐模型为主要任务,制定每轮训练中训练多次序列化推荐模型并训练一次知识图谱表示学习模型。

22、与现有方法相比,本专利技术具有如下优点和有益效果:

23、本专利技术方法能够训练出基于知识图谱的序列化推荐模型,其通过序列化推荐模型建模用户兴趣中的时序特征,挖掘用户兴趣的动态变化;通过知识图谱表示学习模型从多粒度聚合物品辅助信息,挖掘物品高阶信息;最后通过多任务学习框架建模序列化推荐和知识图谱模型,将用户物品信息进行结合,提升推荐效果。

本文档来自技高网...

【技术保护点】

1.一种基于知识图谱的序列化推荐方法,其特征在于,该方法包括如下步骤:

2.根据权利要求1所述的基于知识图谱的序列化推荐方法,其特征在于,步骤1所述序列化推荐模包括特征嵌入、时间注意力和预测模块,在特征嵌入模块采集推荐数据集中的用户物品历史交互信息四元组(用户,物品,评分,时间戳),并按每个用户的时间戳排序得到用户行为序列和对应时间序列;

3.根据权利要求1所述的基于知识图谱的序列化推荐方法,其特征在于,步骤2所述知识图谱表示学习模型包括知识图谱构建嵌入、多粒度聚合和预测模块,在知识图谱构建嵌入模块,先将数据集中物品h及其对应辅助信息τ提取后按两者关系r转换为对应三元组(h,r,τ),后对三元组做向量嵌入得到(Eh,Er,Eτ);

4.根据权利要求1所述的基于知识图谱的序列化推荐方法,其特征在于,步骤3所述多任务学习框架包括参数共享和交替学习模块,在参数共享模块完成模型间信息交互,具体以序列化推荐模型的序列物品向量E(v)和知识图谱模型对应物品实体向量E(h)进行交互,其过程为:

【技术特征摘要】

1.一种基于知识图谱的序列化推荐方法,其特征在于,该方法包括如下步骤:

2.根据权利要求1所述的基于知识图谱的序列化推荐方法,其特征在于,步骤1所述序列化推荐模包括特征嵌入、时间注意力和预测模块,在特征嵌入模块采集推荐数据集中的用户物品历史交互信息四元组(用户,物品,评分,时间戳),并按每个用户的时间戳排序得到用户行为序列和对应时间序列;

3.根据权利要求1所述的基于知识图谱的序列化推荐方法,其特征在于,步骤2所述知识图谱表示学习模型包...

【专利技术属性】
技术研发人员:宋爱波邱敬怡方效林孙季斌王清未张勇苏猛猛
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1