当前位置: 首页 > 专利查询>暨南大学专利>正文

一种面向冷启动推荐的对抗自编码迁移学习方法技术

技术编号:35819175 阅读:19 留言:0更新日期:2022-12-03 13:44
本发明专利技术公开一种面向冷启动推荐的对抗自编码迁移学习方法,通过五个步骤处理物品冷启动问题,首先构建正负超图。然后利用多层感知机获取暖用户、冷用户的常规特征。构建超图自编码器,分别获取暖用户和物品的正、负特征,并重构正、负超图。开发一个匹配判别器,用以最小化暖用户正、负特征的分类损失以及暖用户的正特征和常规特征之间的分布差距。由此,暖用户的正特征和常规特征被连接起来,而暖用户的正特征与物品的正特征通过正超图相关联,使冷启动用户的常规特征与物品的正特征的关系被发现,计算冷用户的常规特征和物品的正特征的欧式距离并排序,向用户推荐Top

【技术实现步骤摘要】
一种面向冷启动推荐的对抗自编码迁移学习方法


[0001]本专利技术涉及信息推荐
,具体涉及一种面向冷启动推荐的对抗自编码迁移学习方法。

技术介绍

[0002]随着互联网不断的发展,人们在享受计算机技术带来便利的同时,也产生和制造了海量的数据。这些大规模且复杂的数据带来的信息过载问题,增加了用户在使用信息检索和电子商务等任务中抓取有用信息的难度。推荐系统作为一种信息过滤工具,在为用户提供精确和个性化的推荐方面发挥着至关重要的作用,在过去十几年中受到了广泛的关注。
[0003]传统的基于协同过滤的推荐方法极大的依赖于用户和物品的历史交互数据,对于新用户或者新物品无法提供有效的推荐建议,即存在冷启动问题。研究者提出了一些深度学习的方法,旨在发现用户和物品之间的潜在关系而解决冷启动问题。近来,超图学习由于在复杂数据上优秀的建模能力而受到广泛的关注,因此研究人员将超图学习引入推荐系统。在超图中,一条超边可以连接多个节点;而在推荐系统的用户交互信息中,一个物品可以与多个用户有交互。因此,超图很自然地可以表达用户与物品之间的高阶复杂关系,即超图中值为1表示交互,值为0表示无交互,从而可以利用超图卷积网络学习用户和物品的高层特征表示。
[0004]域适应旨在利用来自其他源领域的知识来辅助目标领域的学习任务,域适应的主要挑战是减少源域和目标域之间的域差距。现有工作倾向于采用最大平均差异、最优传输和对抗损失等方法来估计两个域之间的分布差异。但是在处理用户冷启动和物品冷启动推荐问题上不能精确且个性化的推荐。
[0005]因此,专利技术一种面向冷启动推荐的对抗自编码迁移学习方法来解决上述问题很有必要。

技术实现思路

[0006]本专利技术的目的是提供一种面向冷启动推荐的对抗自编码迁移学习方法,旨在为用户提供更精确且个性化推荐建议,用来处理用户冷启动和物品冷启动推荐问题。
[0007]为了实现上述目的,本专利技术提供如下技术方案:一种面向冷启动推荐的对抗自编码迁移学习方法,包括以下步骤:
[0008]S1、构建出一个超图,对用户与物品的交互信息进行建模,并根据原始超图设计正超图、负超图;
[0009]S2、设计一个多层感知机网络获得暖用户、冷启动用户的常规特征表示;
[0010]S3、构建一个超图自编码器分别用于正超图、负超图,获取暖用户、物品的正、负特征表示,将正特征视为源数据,常规特征视为目标数据。此外重构正、负超图,用于保存用户和物品之间的关联信息;
[0011]S4、构建一个匹配判别器,为暖用户的正、负特征分配伪标签,最小化暖用户的正、负特征的分类损失以及正特征和常规特征的之间的分布差距;
[0012]S5、计算冷启动用户的常规特征与物品特征之间的欧几里得距离并排序,向用户推荐Top

K个物品,并计算精度、召回率、NDCG以及击中率;
[0013]上述步骤S1包括有:
[0014]S1.1、对用户评分矩阵进行预处理,删除评分为0的物品,保留剩余的物品作为交互项目;
[0015]S1.2、将用户按照9:1的比例划分为暖用户和冷启动用户,并根据暖用户与物品的交互信息构建出超图,具体为
[0016][0017]且上述超图的形式如下:
[0018][0019]其中n
w
表示暖用户数目,m代表物品总数,R(i,j)的值为1代表暖用户i与物品j有交互,否则R(i,j)的值为0;
[0020]S1.3、正超图R
+
等于原始超图R,正超图代表用户的偏好项目,从原始超图R中随机选取R(i,j)值为0项目构建负超图R


[0021]则负超图的形式如下所示:
[0022][0023]上述步骤S2包括有:
[0024]S2.1、构造一个多层感知机神经网络,来获取暖用户和冷启动用户的常规特征,其具体公式如下所示:
[0025][0026]其中h(
·
)表示全连接神经网络,表示用户特征,在原始数据存在用户的信任关系,这些信任关系被用作信任关系,n表示用户总数,d表示特征的维度,Φ表示可训练的网络权重,且有
[0027]U=[U
w
,U
c
][0028][0029]U
w
和U
c
分别代表暖用户和冷启动用户的原始特征,和分别代表暖用户和冷启动用户的常规特征表示。
[0030]上述步骤S3包括有:
[0031]S3.1、用户和物品之间的关系用超图来表示,在正超图上使用超图自编码器学习
暖用户和物品的高层特征表示,具体公式如下所示:
[0032][0033]其中f
+
为超图自编码器,T为物品的特征,为重构的超图,为暖用户的正特征,为物品的正特征;
[0034]S3.2、利用步骤S3.1获取的暖用户的正特征以及物品的特征重构正超图,重构正超图的损失表示为:
[0035][0036]其中为二元交叉熵函数。
[0037]S3.3、在负超图上使用超图自编码器学习暖用户和物品的高层特征表示,具体公式如下所示:
[0038][0039]其中f

为超图自编码器。为重构的超图,为暖用户的负特征,为物品的负特征;
[0040]S3.4、利用步骤S3.3获取的暖用户的负特征以及物品的特征重构负超图,重构负超图的损失可以表示为:
[0041][0042]上述步骤S4包括有:
[0043]S4.1、分别给暖用户的正特征以及负特征分配伪标签,即设定
[0044][0045]分配伪标签为
[0046][0047]其中n
w
为暖用户数量,d为特征维度;
[0048]且正特征包含着用户的偏好信息,负特征包含着用户不感兴趣的信息;
[0049]S4.2、为了桥接暖用户的正特征以及常规特征,即设定
[0050][0051]分配伪标签为
[0052][0053]S4.3、设计匹配鉴别器,最小化暖用户的正、负特征的分类损失以及正特征和常规特征的之间的分布差距,依据以下公式:
[0054][0055]其中α是可训练参数,和分别代表和的第j行向量,和分别代表和的
第j行的值,G
y
(
·
)是分类器,G
c
(
·
)特征匹配器,是分类器的损失函数,表示域间的对抗损失函数;
[0056]S4.4、通过步骤S4.2,暖用户的正、负特征被分开,正特征与常规特征被连接,从而桥接冷启动用户的常规特征以及物品特征形象推荐,引入梯度反向传播层,遵循如下公式:
[0057][0058]S4.5、综合上述步骤,设计模型的总体损失函数用以训练,公式如下:
[0059][0060]其中β和η为可调整参数用以平衡三个损失函数之间的权重;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向冷启动推荐的对抗自编码迁移学习方法,其特征在于:包括以下步骤:S1、构建出一个超图,对用户与物品的交互信息进行建模,并根据原始超图设计正超图、负超图;S2、设计一个多层感知机网络获得暖用户、冷启动用户的常规特征表示;S3、构建一个超图自编码器分别用于正超图、负超图,获取暖用户、物品的正、负特征表示,将正特征视为源数据,常规特征视为目标数据。此外重构正、负超图,用于保存用户和物品之间的关联信息;S4、构建一个匹配判别器,为暖用户的正、负特征分配伪标签,最小化暖用户的正、负特征的分类损失以及正特征和常规特征的之间的分布差距;S5、计算冷启动用户的常规特征与物品特征之间的欧几里得距离并排序,向用户推荐Top

K个物品,并计算精度、召回率、NDCG以及击中率。2.根据权利要求1所述的一种面向冷启动推荐的对抗自编码迁移学习方法,其特征在于:上述步骤S1包括有:S1.1、对用户评分矩阵进行预处理,删除评分为0的物品,保留剩余的物品作为交互项目;S1.2、将用户按照9:1的比例划分为暖用户和冷启动用户,并根据暖用户与物品的交互信息构建出超图,具体为且上述超图的形式如下:其中n
w
表示暖用户数目,m代表物品总数,R(i,j)的值为1代表暖用户i与物品j有交互,否则R(i,j)的值为0;S1.3、正超图R
+
等于原始超图R,正超图代表用户的偏好项目,从原始超图R中随机选取R(i,j)值为0项目构建负超图R

;则负超图的形式如下所示:。3.根据权利要求1所述的一种面向冷启动推荐的对抗自编码迁移学习方法,其特征在于:上述步骤S2包括有:S2.1、构造一个多层感知机神经网络,来获取暖用户和冷启动用户的常规特征,其具体公式如下所示:其中h(
·
)表示全连接神经网络,表示用户特征,在原始数据存在用户的信
任关系,这些信任关系被用作信任关系,n表示用户总数,d表示特征的维度,Φ表示可训练的网络权重,且有U=[U
w
,U
c
]U
w
和U
c
分别代表暖用户和冷启动用户的原始特征,和分别代表暖用户和冷启动用户的常规特征表示。4.根据权利要求1所述的一种面向冷启动推荐的对抗自编码迁移学习方法,其特征在于:上述步骤S3包括有:S3.1、用户和物品之间的关系用超图来表示,在正超图上使用超图自编码器学习暖用户和物品的高层特征表示,具体公式如下所示:其中f
+
为超图自编码器,T为物品的特征,为重构的超图,为暖用户的正特征,为物品的正特征;S3.2、利用步骤S3.1获取的暖用户的正特征以及物品的特征重构正超图,重构正超图的损失表示为:其中为二元交叉熵函数。S3.3、在负超图上使用超图自编码器学习暖用户和物品的高层特征表示,具体公式如下所示...

【专利技术属性】
技术研发人员:吴汉瑞龙锦益李诺思
申请(专利权)人:暨南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1