基于双流slicedwasserstein自编码器的跨域推荐方法技术

技术编号:30431596 阅读:35 留言:0更新日期:2021-10-24 17:25
本发明专利技术属于跨域推荐技术领域,公开了基于双流sliced wasserstein自编码器的跨域推荐方法,将数据输入到跨域推荐模型的编码器中,经过编码器可以得到用户隐空间上的特征向量,将上述的特征向量输入到跨域推荐模型的解码器中,得到重构的用户交互向量,对两个域用户特征向量加以高斯分布的限制,同时使用Sliced Wasserstein距离来缓解分布不平衡的问题,达到高精度的推荐效果,解决现有跨域推荐存在的数据稀疏性问题以及变分自编码器带来的分布不对齐问题。不对齐问题。不对齐问题。

【技术实现步骤摘要】
基于双流sliced wasserstein自编码器的跨域推荐方法


[0001]本专利技术属于跨域推荐
,特别涉及基于双流sliced wasserstein自编码器的跨域推荐方法。

技术介绍

[0002]跨域推荐通过构建统一的隐空间实现多域表征的对齐和跨域重建,目前最前沿的跨域表征是基于多域变分自编码器架构的跨域表征模型。该模型的优势是能够基于变分推理实现跨域分布的对齐,但是,该模型在隐变量分布对齐的过程中采用KL散度,无法准确刻画分布差异,导致模型收敛缓慢;其次,该模型采用确定性解码函数,无法对重构表征的分布进行准确刻画,导致重构的多样性缺失;第三,在跨域重建的过程中聚焦于共性特征的建模,忽略了多域的差异性。同时针对跨域上的因变量的迁移,我们提出使用SWAE来提高正交变换的性能,刻画不同域上用户的特征。因此针对以上三个问题,本项目提出了一种基于典型相关和域差异刻画的跨域推荐架构。
[0003]在跨域推荐问题上大多模型是在构建一个高质量的用户特征向量,其次在该特征向量入手,通过某种算法或网络架构将学习到的特征映射到另一个域上。多数找寻该特征向量的方法包括但不限于使用线性网络层、变分自编码器以及其他自编码器。在跨域问题上则有应用迁移学习的思想,将网络权重或者特征向量进行迁移,同时有模型在特征向量训练过程中就使用共享权重,以及堆对不同域上的特征向量应用正交变换等方法。
[0004]目前多数构建特征向量的模型采用ae自编码器的架构。其中包括去噪自编码器(denoising autoencoder),该类模型只能重构输入和输出,缺少一定的生成能力,并且只能将数据映射到一个固定的空间,这导致模型的泛化能力很弱。除此之外变分自编码器(variational autoencoder)采用了变分推理,构成了上述模型的生成能力。但是该方法根据K

L散度衡量特征空间和先验空间的差异,从而导致一对多的重构误差和空间之间的不对齐问题。
[0005]因此,我们提出使用Sliced Wasserstein autoencoder来解决上述问题,该方法同时具备应有的生成能力,而且该方法基于最佳传输原理,避免了kl散度的弱点。本专利技术的目的在于针对现有技术中纯跨域推荐存在的数据稀疏性问题以及变分自编码器带来的分布不对齐问题,提供可提高推荐精准度的基于双流Sliced Wasserstein的跨域推荐方法。

技术实现思路

[0006]针对现有技术存在的不足,本专利技术提供一种基于双流sliced wasserstein自编码器的跨域推荐方法,将双流Sliced Wasserstein自编码器用于跨域推荐场景中,使用可训练的参数矩阵进行特征的迁移,使用Sliced Wasserstein对迁移后的特征进行对齐,有效地提高了迁移的能力,以增强最终的推荐效果。
[0007]为了解决上述技术问题,本专利技术采用的技术方案是:
[0008]基于双流sliced wasserstein自编码器的跨域推荐方法,包括以下步骤:
[0009]S1、获取输入数据
[0010]获取A数据域的用户

项目

评分数据和B域的用户

项目

评分数据,得到用户i在a域的交互数据x
i
,用户i在b域的交互数据y
i

[0011]S2、将上述数据输入到跨域推荐模型的编码器中,经过编码器可以得到用户隐空间上的特征向量:
[0012]z
x
=σ(W
x
x
i
+c
u
+b
x
)
[0013]z
y
=σ(W
y
y
i
+c
u
+b
y
)
[0014]W
x
、W
y
、c
u
分别是编码器中可训练的参数矩阵,b
x
、b
y
为偏置,σ为激活函数;
[0015]S3、将上述的特征向量输入到跨域推荐模型的解码器中,得到重构的用户交互向量:
[0016][0017][0018]得到4个重构的用户交互向量,代表从A域恢复得来的用户在A域交互向量,代表从B域恢复来的用户在A域的交互向量,代表从B域恢复得来的用户在B域交互向量,代表从A域恢复来的用户在B域的交互向量,σ为激活函数,W
x

、W
y

分别是解码器中可训练的参数矩阵,b
x

、by

为偏置;
[0019]S4、对两个域S2中所述用户隐空间上的特征向量和S3中所述重构的用户交互向量加以高斯分布的限制,同时计算其与高斯分布之间的Sliced Wasserstein距离,通过损失函数来训练跨域推荐模型中的所有参数,使用Adam优化器进行参数的迭代更新。
[0020]进一步的,步骤S1中,两个域上具有共同的用户,则一个用户在不同域上有如下的数据对(x
i
,y
i
),其中,在将数据输入跨域推荐模型进行后续步骤时,使用用户的隐反馈数据,x
i
、y
i
是代表对所有用户是否有交互的向量,有则为1,否则为0。
[0021]进一步的,步骤S4中,损失函数包括两部分:一是高斯对齐;二是特征学习,包括重构损失以及跨域特征对齐损失,
[0022]高斯对齐部分的损失如下:
[0023][0024]代表两个均值为0、方差为1的高斯分布;
[0025]特征学习部分的损失如下:
[0026][0027]其中,ce代表交叉熵损失,
[0028]上述SW1为模为1的sliced wasersstein距离,计算方法如下:
[0029][0030]η
l
为随机采样的向量,[m]为对数据切片的索引,L为投影的个数。
[0031]与现有技术相比,本专利技术优点在于:
[0032](1)本专利技术采用双流Sliced Wasserstein自编码器代替多域变分自编码器,利用sliced Wasserstein距离代替KL散度,提升跨域推荐模型生成能力,具有更好的提取特征的能力,可以在不同数据域上得到一个更高质量的用户特征向量。本专利技术首次将双流SWAE模型应用于跨域推荐场景中,可以有效地提高用户特征空间的表征能力。当两个分布之间没有交集时,传统的变分自编码器无法准确衡量分布的差异,而本专利技术通过计算Wasserstein距离,可以在分布没有交集时也能判断他们之间的差异。
[0033](2)本专利技术使用可训练的参数矩阵进行特征的迁移,同时使用Sliced Wasserstein对迁移后的特征进行对齐,有效地提高了迁移的能力,以增强最终的推荐效果。...

【技术保护点】

【技术特征摘要】
1.基于双流sliced wasserstein自编码器的跨域推荐方法,其特征在于,包括以下步骤:S1、获取输入数据获取A数据域的用户

项目

评分数据和B域的用户

项目

评分数据,得到用户i在a域的交互数据x
i
,用户i在b域的交互数据y
i
,S2、将上述数据输入到跨域推荐模型的编码器中,经过编码器可以得到用户隐空间上的特征向量:z
x
=σ(W
x
x
i
+c
u
+b
x
)z
y
=σ(W
y
y
i
+c
u
+b
y
)W
x
、W
y
、c
u
分别是编码器中可训练的参数矩阵,b
x
、b
y
为偏置,σ为激活函数;S3、将上述的特征向量输入到跨域推荐模型的解码器中,得到重构的用户交互向量:S3、将上述的特征向量输入到跨域推荐模型的解码器中,得到重构的用户交互向量:得到4个重构的用户交互向量,代表从A域恢复得来的用户在A域交互向量,代表从B域恢复来的用户在A域的交互向量,代表从B域恢复得来的用户在B域交互向量,代表从A域恢复来的用户在B域的交互向量,σ为激活函数,W

【专利技术属性】
技术研发人员:聂婕赵紫安魏志强叶敏左子杰谢华鑫
申请(专利权)人:中国海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1