一种融合双生成器双判别器的生成对抗网络和自编码器的跨域推荐方法技术

技术编号:28296838 阅读:96 留言:0更新日期:2021-04-30 16:21
本发明专利技术提供了一种融合双生成器双判别器的生成对抗网络和自编码器的跨域推荐方法。该方法获取两个具有相同项目或相同用户的同类型数据域,将两数据域中相同的用户信息或项目信息作为辅助信息;将单个数据域中的评分数据和作为辅助信息的用户信息或项目信息相级联;对级联后得到的数据进行特征提取;再通过生成对抗网络的对抗过程对不同数据域间的特征进行对齐与融合,得到融合后的数据特征;最后对融合后的数据特征进行解码得到两个数据域的评分预测矩阵,通过评分预测矩阵为用户推荐预测分数较高的项目。

【技术实现步骤摘要】
一种融合双生成器双判别器的生成对抗网络和自编码器的跨域推荐方法
本专利技术涉及人工智能推荐
,具体涉及一种融合双生成器双判别器的生成对抗网络和自编码器的跨域推荐方法。
技术介绍
随着网络技术的不断发展,人们可以获取到的数据越来越多。但海量的数据会导致用户很难找到自己需要的信息。因此为了解决这个问题,推荐系统应运而生。然而推荐系统通常面临着数据稀疏和冷启动的问题,跨域推荐系统为解决数据稀疏和冷启动问题提供了一个新的方法。而在现实中,通常诸如购物网站之间或视频网站之间有着相同的项目或用户。通常情况下,由于目标域的稀疏度高于源域,导致源域和目标域之间具有较高的数据异构性,进行双向迁移会导致负迁移的发生。因此单目标跨域推荐系统难以同时提升目标域和源域的推荐效果,并且没有充分利用目标域和源域的数据。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种可以同时提升目标域和源域的推荐效果,且能够充分利用目标域和源域的数据的双目标跨域推荐方法。本专利技术是通过以下技术方案实现的:一种融合双生成器双判别器的生成对抗网络和自编码器的跨域推荐方法,包括步骤:步骤一:获取两个具有相同项目或相同用户的同类型数据域,数据域中包含有用户信息、项目信息和用户历史评分数据;将两数据域中相同的用户信息或项目信息作为辅助信息,即,若两个数据域中的用户相同,则选取用户信息作为辅助信息,项目信息相同则选取项目信息作为辅助信息;步骤二:将单个数据域中的评分数据和作为辅助信息的用户信息或项目信息相级联;步骤三:对级联后得到的数据进行特征提取;步骤四:通过生成对抗网络的对抗过程对不同数据域间的特征进行对齐与融合,得到融合后的数据特征;步骤五:对融合后的数据特征进行解码得到两个数据域的评分预测矩阵。在上述技术方案中,需要进行数据读取的两个数据域分别代表目标域和源域,用户历史评分数据包括用户评分过的项目ID和对应的分数,用户的详细属性信息为用户的用户ID、年龄、性别、职业等信息,项目的详细信息为项目ID、项目名称、类型等信息。在上述技术方案中,数据域1和数据域2中的评分数据处理成为评分矩阵,分别记为R1和R2;对辅助信息进行one-hot编码,在数据域1和数据域2中的辅助信息的one-hot编码分别记为y1和y2;将数据域1的评分矩阵R1和辅助信息one-hot编码y1进行级联,得到矩阵Ca1,数据域2的评分矩阵R2和辅助信息one-hot编码y2进行级联,得到矩阵Ca2。在上述技术方案中,步骤三中,包括生成器G1和生成器G2,生成器G1对Ca1进行特征提取,得到的特征记为g1,生成器G2对Ca2进行特征提取,得到的特征记为g2,生成器的工作方式如式(1)、(2)所示:其中和θG2是可学习权重,和是偏置,h(·)是非线性激活函数,通过使用非线性激活函数,提取代表级联矩阵数据特性的非线性特征。在上述技术方案中,生成器G1和生成器G2使用自编码器中的编码器,利用编码器对级联数据进行特征提取。在上述技术方案中,步骤四中,生成对抗网络中包括判别器D和分类器C,将特征g1和辅助信息one-hot编码y1进行级联得到Ca′1,特征g2和辅助信息one-hot编码y2进行级联得到Ca′2,Ca′1和Ca′2作为判别器D的输入,通过判别器D对Ca′1和Ca′2进行二分类,用以判别特征g1和g2所属数据域;数据特征g1和g2作为分类器C的输入,分类器C在整个网络中作为一个判别器使用,通过分类器C尽可能的生成g1和g2对应的辅助信息的one-hot编码。在上述技术方案中,步骤五中,由融合后的数据域1的数据特征g′1,通过解码器解码得到数据域2的评分预测矩阵R'2;由融合后的数据域2的数据特征g'2进行解码得到数据域1的评分预测矩阵R′1。在上述技术方案中,评分预测矩阵的行对应各个用户,列对应各个项目,对于某一用户进行推荐时,根据评分预测矩阵中对应的行中的数据,为用户推荐预测分数较高的项目。本专利技术与现有技术相比,具有以下显著优势:(1)提出一种双目标跨域推荐算法,可以同时提高源域和目标域的预测精度,且可以提高源域和目标域推荐的多样性。(2)结合了生成对抗网络可以捕捉数据分布的优势和自编码器强大的特征捕捉能力,因为需要捕捉两个域的数据分布因此使用了双生成器和双判别器,进行源域和目标域特征的对齐与融合。(3)模型在预测时除了使用评分数据,还使用了项目属性信息或用户属性信息。这些辅助信息与对抗网络中的判别器和生成器相结合来引导模型提取数据的特征。附图说明图1为一个实施例中可运行本申请的跨域推荐方法的设备的部分结构框图;图2为一个实施例中的双目标跨域推荐方法流程示意图;图3为一个实施例中的双目标推荐算法流程示意图。对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,可以根据以上附图获得其他的相关附图。具体实施方式下面结合附图进一步叙述本专利技术。应当理解,此处所描述的具体实施例仅用于解释本专利技术,并不用于限定本专利技术。下面以对两个拥有相同项目或相同用户的数据源中的用户进行项目推荐为例,对本专利技术进行说明。图1是一个实施例中可运行本申请的跨域推荐方法的设备的结构框图。如图1所示,在一个实施例中,该服务器包括通过系统总线连接的处理器、存储介质、内存和网络接口。其中,网络接口用于网络通信;存储介质中存储有操作系统、数据库以及本申请所述的跨域推荐方法的软件指令;数据库用于存储算法所需数据及算法实施过程中产生的数据;内存用于缓存数据;处理器协调各个部件之间的工作并执行上述的跨域推荐方法。图1所示的结构,仅是与本推荐方法相关的部分结构框图,并不构成对本申请方案所应用于其上的设备限定,具体的设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或具有不同的部件布置,诸如手机、平板电脑、笔记本电脑、台式电脑等可以安装应用软件的终端设备。图2为一个实施例中的双目标跨域推荐方法流程示意图,主要步骤包括:步骤S201,准备模型训练所需数据。分别从数据库中读取各数据源的用户信息、项目信息和用户对项目的历史评分数据,目标域记为域1,源域记为域2,域1中的用户、项目和评分数据分别记为U1、I1和r1,域2中的用户、项目和评分数据分别记为U2、I2和r2。在一个实施例中,域1的数据信息和域2的数据信息存储在不同的数据库中,这两个不同的数据库分别记为数据库1和数据库2。在一个实施例中,用户信息主要包括用户的性别、年龄和职业,项目信息主要包括项目所属的类型。评分数据、用户信息和项目信息是预先存储在数据库内的数据。模型训练时只选取项目信息和用户信息其中一种作为辅助信息。当域1和域2中用户相同时选取用户信息作为辅助信息,而域1和域2中项目相同时选取项目信息作为辅助信息。步骤S202,将域1和域2中的评分数据处理成为评分矩阵,分别本文档来自技高网...

【技术保护点】
1.一种融合双生成器双判别器的生成对抗网络和自编码器的跨域推荐方法,其特征在于,包括步骤:/n步骤一:获取两个具有相同项目或相同用户的同类型数据域,数据域中包含有用户信息、项目信息和用户历史评分数据;/n将两数据域中相同的用户信息或项目信息作为辅助信息,即,若两个数据域中的用户相同,则选取用户信息作为辅助信息,项目信息相同则选取项目信息作为辅助信息;/n步骤二:将单个数据域中的评分数据和作为辅助信息的用户信息或项目信息相级联;/n步骤三:对级联后得到的数据进行特征提取;/n步骤四:通过生成对抗网络的对抗过程对不同数据域间的特征进行对齐与融合,得到融合后的数据特征;/n步骤五:对融合后的数据特征进行解码得到两个数据域的评分预测矩阵。/n

【技术特征摘要】
1.一种融合双生成器双判别器的生成对抗网络和自编码器的跨域推荐方法,其特征在于,包括步骤:
步骤一:获取两个具有相同项目或相同用户的同类型数据域,数据域中包含有用户信息、项目信息和用户历史评分数据;
将两数据域中相同的用户信息或项目信息作为辅助信息,即,若两个数据域中的用户相同,则选取用户信息作为辅助信息,项目信息相同则选取项目信息作为辅助信息;
步骤二:将单个数据域中的评分数据和作为辅助信息的用户信息或项目信息相级联;
步骤三:对级联后得到的数据进行特征提取;
步骤四:通过生成对抗网络的对抗过程对不同数据域间的特征进行对齐与融合,得到融合后的数据特征;
步骤五:对融合后的数据特征进行解码得到两个数据域的评分预测矩阵。


2.如权利要求1所述的一种融合双生成器双判别器的生成对抗网络和自编码器的跨域推荐方法,其特征在于:需要进行数据读取的两个数据域分别代表目标域和源域,用户历史评分数据包括用户评分过的项目ID和对应的分数,用户的详细属性信息为用户的用户ID、年龄、性别、职业等信息,项目的详细信息为项目ID、项目名称、类型等信息。


3.如权利要求1所述的一种融合双生成器双判别器的生成对抗网络和自编码器的跨域推荐方法,其特征在于:数据域1和数据域2中的评分数据处理成为评分矩阵,分别记为R1和R2;对辅助信息进行one-hot编码,在数据域1和数据域2中的辅助信息的one-hot编码分别记为y1和y2;将数据域1的评分矩阵R1和辅助信息one-hot编码y1进行级联,得到矩阵Ca1,数据域2的评分矩阵R2和辅助信息one-hot编码y2进行级联,得到矩阵Ca2。


4.根据权利要求3所述的一种融合双生成器双判别器的生成对抗网络和自编码器的跨域推荐方法,其特征在于:步骤三中,包括生成器G1和生成器G2,生成器G1对C...

【专利技术属性】
技术研发人员:闫文杰赵子萱
申请(专利权)人:河北工业大学
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1