基于评论共性信息嵌入和迁移的跨域推荐方法及系统技术方案

技术编号:32859077 阅读:13 留言:0更新日期:2022-03-30 19:35
本发明专利技术属于跨域推荐技术领域,公开了基于评论共性信息嵌入和迁移的跨域推荐方法及系统,该方法包括源数据的预处理、抽离评论信息的共性表征、学习用户和物品的嵌入表征、用户嵌入表征的跨域迁移和冷启动跨域推荐的步骤,本发明专利技术充分利用评论信息在辅助域和目标域的共性表征开展嵌入表征的迁移,提高嵌入表征的泛化性;在多域表征融合时,应用堆叠变分自编码机作为融合架构,提升了多视角信息融合的合理性。理性。理性。

【技术实现步骤摘要】
基于评论共性信息嵌入和迁移的跨域推荐方法及系统


[0001]本专利技术属于跨域推荐
,特别涉及基于评论共性信息嵌入和迁移的跨域推荐方法及系统。

技术介绍

[0002]跨域推荐是利用迁移机制,借助辅助域用户或物品表征预测目标域用户物品的交互信息,以达到解决数据稀疏和冷启动的目的。跨域推荐包括两个关键过程,其一,在单一域中开展特征工程,获得高质量的用户和物品嵌入;其二,利用迁移机制,将辅助域的用户和物品嵌入至目标域,缓解目标域的交互稀疏和冷启动问题。针对过程一,目前主要采用深度神经网络表征模型,例如:堆叠自编码器等。针对过程二,目前主要采用多层感知机(MLP),通过公共子空间映射机制,进行辅助域到目标域的迁移。
[0003]传统方法主要面临的问题是用户和物品嵌入表征的质量不高,这是由于用户和物品嵌入表征学习仅依赖于交互历史,特征抽取非常局限。Fu等人提出了一种融合交互历史和评论信息(辅助语义)的基于堆叠降噪自编码器的方法,该方法主要针对显式推荐场景,引入辅助信息提升用户和物品表征能力,该方法的优势在于添加和利用了用户和物品的评论信息,将其融入用户嵌入的学习过程中,获得的表征相较于未考虑评论信息的方法而言,提升用户和物品表征在跨域应用时的泛化性。但是,该方法存在以下缺陷问题:第一,辅助信息不全面,未充分利用评论信息在辅助域和目标域的共性特征开展用户嵌入表征的学习。例如,当前方法在AU_SDAE中仅嵌入用户在辅助域的评论信息,忽略了辅助域和目标域的用户评论信息之间的相关性,不仅导致辅助信息的视角单一,也容易引入单一域的噪声,降低表征的泛化性。第二,多域表征融合不合理。例如,当前方法在多域表征融合时,应用堆叠降噪自编码器作为融合架构,不仅空间映射机制缺乏合理性,还会降低用户和物品嵌入表征的泛化性。第三,辅助信息的利用率低,仅在单域表征过程中使用,在迁移过程中并没有发挥有效作用。
[0004]针对以上问题,本专利技术提出了基于评论共性信息嵌入和迁移的跨域推荐方法。

技术实现思路

[0005]针对现有技术存在的不足,本专利技术提供一种基于评论共性信息嵌入和迁移的跨域推荐方法及系统,充分利用评论信息在辅助域和目标域的共性表征开展用户嵌入表征的学习;在多域表征融合时,应用堆叠变分自编码机作为融合架构,充分利用了变分自编码器这种深度生成模型在构建表征隐空间的有效性,提升了多视角信息融合的合理性。
[0006]为了解决上述技术问题,本专利技术采用的技术方案是:
[0007]首先,本专利技术提供一种基于评论共性信息嵌入和迁移的跨域推荐方法,包括以下步骤:
[0008]步骤一、源数据的预处理
[0009]源数据由评分数据和评论数据两部分组成,其中评论数据需要预先处理成结构化
的N维向量,在输入模型时,评分数据分别从用户和物品的视角对每一个项都随机初始化成一个N维的评分向量;
[0010]步骤二、抽离评论信息的共性表征
[0011]在整个模型训练过程中,利用变分自编码器抽离出用户在辅助域和目标域上评论信息的共性表征,同时也抽离出物品在辅助域和目标域上的评论信息的共性表征;
[0012]步骤三、学习用户和物品的嵌入表征
[0013]在抽离了评论信息的共性表征之后,利用多个堆叠变分自编码器分别从用户和物品的视角同时在辅助域和目标域深度融合评论信息的共性表征和相应的评分向量,最终同时得到用户和物品在辅助域和目标域上的嵌入表征;
[0014]步骤四、用户嵌入表征的跨域迁移
[0015]最后利用多层感知机建立用户嵌入表征从辅助域到目标域的映射关系,该过程的真实值是目标域的用户嵌入表征,即将辅助域的用户嵌入表征向该用户在目标域的嵌入表征对齐;
[0016]步骤五、冷启动跨域推荐
[0017]完成模型的训练以后,对于任一一个冷启动用户,利用多层感知机构建的映射关系将其在辅助域的嵌入表征向目标域进行映射,根据其目标域的嵌入表征,可以为其完成目标域上的推荐。
[0018]进一步的,步骤三中,在学习嵌入表征的步骤当中,堆叠了多个隐藏层以抽离更多语义信息,实现用户和物品表征的学习,并在此基础上,将步骤二中得到的评论信息的共性表征融合到用户和物品的表征学习过程中,将评论信息的共性表征和评分向量同时输入堆叠变分自编码器。
[0019]进一步的,步骤四的详细步骤是:将用户在辅助域的嵌入表征作为多层感知机的输入,将用户在目标域上的嵌入表征作为该步的真值;并且,在多层感知机的每一个网络层都嵌入步骤二所提取的用户评论信息的共性表征,使得映射关系包含更多共性信息。
[0020]更进一步的,模型在训练时采用辅助域和目标域同时训练的联合训练方式,一个训练样本具体为:共同用户u、该用户在辅助域和目标域相应的物品ID及相应的评分五个数据,表示如下:
[0021][0022]A表示辅助域,T表示目标域,i
(A)
表示用户u在辅助域有交互的一个物品,i
(T)
表示用户u在目标域有交互的一个物品,表示用户u在对辅助域物品i(A)的评分值,表示用户u在对目标域物品i
(T)
的评分值;按批量训练整个模型,每次向模型输入多个样本作为一批训练数据,每批数据经过模型训练都会得到相应的预测评分,通过计算预测评分和真实评分数值的平均平方误差并回传误差,整个模型会不断地更新参数模型以降低误差,最后训练误差会逐渐收敛到一个最低值便不再降低,此时用测试数据测试训练好的模型,得出的预测准确度即为本模型的最终准确度。
[0023]更进一步的,总损失函数包括七个部分的损失函数,如下式:
[0024]L

=L
GU
+L
GI
+L
AU
+L
AI
+L
TU
+L
TI
+L
MLP
ꢀꢀ
(1)
[0025]其中,L
GU
是提取用户评论信息的共性表征的损失函数,L
GI
是提取物品评论信息的
共性表征的损失函数,L
AU
是学习用户在辅助域上的嵌入表征的损失函数,L
AI
是学习物品在辅助域上的嵌入表征的损失函数,L
TU
学习用户在目标域上的嵌入表征的损失函数,L
TI
是学习物品在目标域上的嵌入表征的损失函数,L
MLP
是实现用户的嵌入表征从辅助域到目标域跨域迁移的损失函数。
[0026]更进一步的,损失L
GU
和L
GI
,具体如下:
[0027][0028][0029]在式(2)中,L
GU
分为四部分:

为辅助域用户评论向量的重构损失,为辅助域用户的评论向量,为重构的向量;

为目标域用户评论向量的重构损失,为目标域用户的评论向量,为重构的向量;<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于评论共性信息嵌入和迁移的跨域推荐方法,其特征在于,包括以下步骤:步骤一、源数据的预处理源数据由评分数据和评论数据两部分组成,其中评论数据需要预先处理成结构化的N维向量,在输入模型时,评分数据分别从用户和物品的视角对每一个项都随机初始化成一个N维的评分向量;步骤二、抽离评论信息的共性表征在整个模型训练过程中,利用变分自编码器抽离出用户在辅助域和目标域上评论信息的共性表征,同时也抽离出物品在辅助域和目标域上的评论信息的共性表征;步骤三、学习用户和物品的嵌入表征在抽离了评论信息的共性表征之后,利用多个堆叠变分自编码器分别从用户和物品的视角同时在辅助域和目标域深度融合评论信息的共性表征和相应的评分向量,最终同时得到用户和物品在辅助域和目标域上的嵌入表征;步骤四、用户嵌入表征的跨域迁移最后利用多层感知机建立用户嵌入表征从辅助域到目标域的映射关系,该过程的真实值是目标域的用户嵌入表征,即将辅助域的用户嵌入表征向该用户在目标域的嵌入表征对齐;步骤五、冷启动跨域推荐完成模型的训练以后,对于任一一个冷启动用户,利用多层感知机构建的映射关系将其在辅助域的嵌入表征向目标域进行映射,根据其目标域的嵌入表征,可以为其完成目标域上的推荐。2.根据权利要求1所述的基于评论共性信息嵌入和迁移的跨域推荐方法,其特征在于,步骤三中,在学习嵌入表征的步骤当中,堆叠了多个隐藏层以抽离更多语义信息,实现用户和物品表征的学习,并在此基础上,将步骤二中得到的评论信息的共性表征融合到用户和物品的表征学习过程中,将评论信息的共性表征和评分向量同时输入堆叠变分自编码器。3.根据权利要求1所述的基于评论共性信息嵌入和迁移的跨域推荐方法,其特征在于,步骤四的详细步骤是:将用户在辅助域的嵌入表征作为多层感知机的输入,将用户在目标域上的嵌入表征作为该步的真值;并且,在多层感知机的每一个网络层都嵌入步骤二所提取的用户评论信息的共性表征,使得映射关系包含更多共性信息。4.根据权利要求1所述的基于变分自编码器的共性辅助信息嵌入跨域推荐方法,其特征在于,模型在训练时采用辅助域和目标域同时训练的联合训练方式,一个训练样本具体为:共同用户u、该用户在辅助域和目标域相应的物品ID及相应的评分五个数据,表示如下:A表示辅助域,T表示目标域,i
(A)
表示用户u在辅助域有交互的一个物品,i
(T)
表示用户u在目标域有交互的一个物品,表示用户u在对辅助域物品i
(A)
的评分值,表示用户u在对目标域物品i
(T)
的评分值;按批量训练整个模型,每次向模型输入多个样本作为一批训练数据,每批数据经过模型训练都会得到相应的预测评分,通过计算预测评分和真实评分数值的平均平方误差并回传误差,整个模型会不断地更新参数模型以降低误差,最后训练误差会逐渐收敛到一个最低值便不再降低,此时用测试数据测试训练好的模型,得
出的预测准确度即为本模型的最终准确度。5.根据权利要求4所述的基于评论共性信息嵌入和迁移的跨域推荐方法,其特征在于,总损失函数包括七个部分的损失函数,如下式:L

=L
GU
+L
GI
+L
AU
+L
AI
+L
TU
+L
TI
+L
MLP
ꢀꢀꢀ
(1)其中,L
GU
是提取用户评论信息的共性表征的损失函数,L
...

【专利技术属性】
技术研发人员:聂婕左子杰宋宁王京禹谢华鑫时津津
申请(专利权)人:中国海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1