多级视图对比学习电影推荐方法技术

技术编号:39641386 阅读:11 留言:0更新日期:2023-12-09 11:08
本发明专利技术涉及人工智能以及自然语言处理领域,尤其涉及一种多级视图对比学习电影推荐方法

【技术实现步骤摘要】
多级视图对比学习电影推荐方法、系统、设备及存储介质


[0001]本专利技术涉及人工智能以及自然语言处理领域,具体为一种多级视图对比学习电影推荐方法

系统

设备及存储介质


技术介绍

[0002]随着信息技术及互联网环境的不断发展,发达的网络为人们带来了海量的数据,极大地丰富了人们的生活,但同时产生了大量的冗余信息,人们很难快速筛选出真正需要或者感兴趣的内容

这种爆炸式信息增长带来的效率变低的问题也被称为“信息过载”。
为了缓解这种问题,改善用户的体验,推荐系统的研究和应用得到越来越多关注

[0003]推荐系统作为解决“信息过载”问题的有效手段,已经得到了广泛应用,推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢

人们在满足生活需求的同时,也更加注重精神层面的追求,读书

看电影等都成了丰富业余生活的选择

因此,随着电影业的发展,对于电影推荐系统的研究越来越受重视

传统的电影推荐算法通常会面临缺少新项目信息时的冷启动问题,用户和项目之间的交互数据较少,出现的数据稀疏问题,更多的长尾项目不易被用户发现的问题,这些问题都会影响推荐的性能指标

[0004]考虑到用户与项目之间都存在大量的附属信息,可以引入不同的辅助信息来提高推荐的准确度,知识图谱作为一种蕴含丰富语义信息的异构网络,与推荐算法结合,有利于提升推荐系统的准确性

多样性与可解释性

但是,现有的基于知识图谱的电影推荐系统大多数是采用有监督学习范式,高度依赖于标注数据,导致推荐系统存在长尾效应

噪音干扰,影响推荐结果的精度


技术实现思路

[0005]针对现有技术中存在的基于知识图谱的电影推荐系统大多数是采用有监督学习范式,高度依赖于标注数据,导致推荐系统存在长尾效应

噪音干扰,影响推荐结果的精度的问题,本专利技术提供一种多级视图对比学习电影推荐方法

系统

设备及存储介质

[0006]为达到上述目的,本专利技术采用以下技术方案予以实现:
[0007]本专利技术提供一种多级视图对比学习电影推荐方法,包括以下步骤:
[0008]S1
:获取数据集,并根据数据集构建用户

项目交互图

知识图谱和协同知识图谱;其中,所述数据集源于
MovieLens

1 M
数据集,包括用户名

电影名

评分数据,电影元数据信息和用户属性信息;
[0009]S2
:分别将用户

项目交互图和知识图谱进行数据增强,得到用户

项目交互图数据增强视图和知识图谱数据增强视图;
[0010]S3
:分别将知识图谱数据增强视图

用户

项目交互图数据增强视图和协同知识图谱进行知识表示,得到两个局部视图的用户和项目的知识表示以及一个全局视图的用户和
项目知识表示;
[0011]S4
:分别将两个局部视图的用户和项目知识表示进行局部级对比学习,得到局部级对比损失和两个优化的局部视图的用户和项目知识表示;
[0012]S5
:将两个优化的局部视图的用户和项目知识表示与全局视图的用户和项目的知识表示进行全局级对比学习,得到全局级对比损失

二次优化的局部视图的用户和项目知识表示和优化的全局视图的用户和项目知识表示;
[0013]S6
:根据局部级对比损失

全局级对比损失

二次优化的局部视图的用户和项目的知识表示以及优化的全局视图的用户和项目的知识表示,进行多任务训练,建立推荐模型;
[0014]S7
:利用推荐模型,得到用户的电影推荐列表

[0015]进一步地,
S1
的具体方法为:
[0016]根据用户对电影的评分数据,定义用户

项目无交互和用户

项目有交互,构建用户

项目交互图;
[0017]根据电影和电影元数据信息,设置实体之间的关系属性,得到包含头实体

关系

尾实体结构化知识的三元组,构建知识图谱;
[0018]将用户

项目交互图和知识图谱通过实体对齐,并整合得到协同知识图谱

[0019]进一步地,
S2
的具体方法为:
[0020][0021]其中,
G
k
为整个知识图谱的集合,
(e,r,i)∈G
k
代表项目从属的三元组,
e
代表实体,
r
代表关系,
i
代表项目;定义掩码向量作为具有概率的二进制指示符,以表示在采样期间是否选择特定知识三元组,
KG1(G
k
)

KG2(G
k
)
为知识图谱数据增强视图;
[0022]计算知识图谱数据增强视图
KG1(G
k
)
和知识图谱数据增强视图
KG2(G
k
)
每个项目的一致性,得到知识图谱结构一致性;
[0023]C
i

s(f
k
(x
i
,KG1(G
k
)),f
k
(x
i
,KG2(G
k
)))
ꢀꢀꢀ
(2)
[0024]其中,
f
k
代表关系感知知识聚合方案,用来对项目
i
在不同增强视图
KG1(G
k
)

KG2(G
k
)
中分别生成嵌入向量和
s(f
k
(x
i
,KG1(G
k
)),f
k
(x
i
,KG2(G
k
)))
表示用于计算和之间的相似度余弦函数,
C
i
为知识图谱结构一致性;
[0025]根据知识图谱结构一致性,对用户

项目交互图进行数据增强,通过
C
i
得到两个掩码向量用于用户

项目交互图...

【技术保护点】

【技术特征摘要】
1.
一种多级视图对比学习电影推荐方法,其特征在于,包括以下步骤:
S1
:获取数据集,并根据数据集构建用户

项目交互图

知识图谱和协同知识图谱;其中,所述数据集源于
MovieLens

1 M
数据集,包括用户名

电影名

评分数据,电影元数据信息和用户属性信息;
S2
:分别将用户

项目交互图和知识图谱进行数据增强,得到用户

项目交互图数据增强视图和知识图谱数据增强视图;
S3
:分别将知识图谱数据增强视图

用户

项目交互图数据增强视图和协同知识图谱进行知识表示,得到两个局部视图的用户和项目的知识表示以及一个全局视图的用户和项目知识表示;
S4
:分别将两个局部视图的用户和项目知识表示进行局部级对比学习,得到局部级对比损失和两个优化的局部视图的用户和项目知识表示;
S5
:将两个优化的局部视图的用户和项目知识表示与全局视图的用户和项目的知识表示进行全局级对比学习,得到全局级对比损失

二次优化的局部视图的用户和项目知识表示和优化的全局视图的用户和项目知识表示;
S6
:根据局部级对比损失

全局级对比损失

二次优化的局部视图的用户和项目的知识表示以及优化的全局视图的用户和项目的知识表示,进行多任务训练,建立推荐模型;
S7
:利用推荐模型,得到用户的电影推荐列表
。2.
根据权利要求1所述的多级视图对比学习电影推荐方法,其特征在于,
S1
的具体方法为:根据用户对电影的评分数据,定义用户

项目无交互和用户

项目有交互,构建用户

项目交互图;根据电影和电影元数据信息,设置实体之间的关系属性,得到包含头实体

关系

尾实体结构化知识的三元组,构建知识图谱;将用户

项目交互图和知识图谱通过实体对齐,并整合得到协同知识图谱
。3.
根据权利要求1所述的多级视图对比学习电影推荐方法,其特征在于,
S2
的具体方法为:其中,
G
k
为整个知识图谱的集合,
(e

r

i)∈G
k
代表项目从属的三元组,
e
代表实体,
r
代表关系,
i
代表项目;定义掩码向量代表项目;定义掩码向量作为具有概率的二进制指示符,以表示在采样期间是否选择特定知识三元组,
KG1(G
k
)

KG2(G
k
)
为知识图谱数据增强视图;计算知识图谱数据增强视图
KG1(G
k
)
和知识图谱数据增强视图
KG2(G
k
)
每个项目的一致性,得到知识图谱结构一致性;
C
i

s(f
k
(x
i

KG1(G
k
))

f
k
(x
i

KG2(G
k
)))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
其中,
f
k
代表关系感知知识聚合方案,用来对项目
i
在不同增强视图
KG1(G
k
)

KG2(G
k
)
中分别生成嵌入向量和
s(f
k
(x
i

KG1(G
k
))

f
k
(x
i

KG2(G
k
)))
表示用于计算和之间的相似度余弦函数,
C
i
为知识图谱结构一致性;根据知识图谱结构一致性,对用户

项目交互图进行数据增强,通过
C
i
得到两个掩码向
量用于用户

项目交互图
G
u

{
ν

ε
}
,用户

项目交互图数据增强方式如下:根据知识图谱结构一致性
C
i
推断的概率来丢弃用户

项目交互图
G
u
中的边集合
ε
中的用户

项目交互记录,得到用户

项目交互图数据增强视图
UI1(G
u
)

UI2(G
u
)。4.
根据权利要求1所述的多级视图对比学习电影推荐方法,其特征在于,
S3
的具体方法为:将知识图谱数据增强视图
KG1(G
k
)

KG2(G
k
)
同用户

项目交互图数据增强视图
UI1(G
u
)

UI2(G
u
)
进行重新组合,得到两个局部视图
(KG1(G
k
)

UI1(G
u
))

(KG2(G
k
)

UI2(G
u
))
;并对两个局部视图
(KG1(G
k
)

UI1(G
u
))

(KG2(G
k
)

UI2(G
u
))
进行知识表示,分别得到两个局部视图的用户和项目的知识表示同时,对协同知识图谱进行知识表示,得到全局视图的用户和项目知识表示;利用图神经网络分别将用户

项目交互图

知识图谱和协同知识图谱中的用户

项目和实体嵌入低维向量;利用关系感知的知识嵌入将知识图谱嵌入低维向量,具体为:在整个知识图谱
...

【专利技术属性】
技术研发人员:曹菡张蒙蒙孙鹏飞郭晓旭
申请(专利权)人:陕西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1