当前位置: 首页 > 专利查询>新疆大学专利>正文

基于改进的生成对抗网络的评分预测方法技术

技术编号:37358490 阅读:13 留言:0更新日期:2023-04-27 07:07
本发明专利技术公开了基于改进的生成对抗网络的评分预测方法,主要涉及计算机应用技术领域;包括步骤:S1、利用编码器学习用户交互数据的特征并进行表示,然后将编码器的输入与输出看作联合分布,并输入到判别器;S2、将用户隐式交互矩阵输入到生成器中,由生成器学习用户的兴趣分布,并将生成器的输出与输入看作联合分布,输入到判别器;S3、将训练得到两个联合分布分别输入到判别器中,判别器判断输入数据的来源;S4、当训练到最优时,两个联合分布基本相同,此时将用户的每个项目输入到生成器中,为用户提供他们可能更感兴趣的项目;本发明专利技术可以利用学习到的交互特征,进一步提升模型学习用户兴趣分布的能力,以提高评级预测的准确性。以提高评级预测的准确性。以提高评级预测的准确性。

【技术实现步骤摘要】
基于改进的生成对抗网络的评分预测方法


[0001]本专利技术涉及计算机应用
,具体是基于改进的生成对抗网络的评分预测方法。

技术介绍

[0002]目前,基于协同过滤的推荐算法一直是推荐领域使用最广泛、最主流的方法之一,协同过滤是根据已有用户与项目交互的历史数据推测未知数据,启发式的协同过滤推荐算法主要分为三种:一种是基于用户的协同过滤算法,通过计算用户之间的相似度为用户推荐可能喜欢的项目;一种是基于项目的协同过滤算法,通过计算项目之间的相似度,从而向用户推荐;一种是基于模型的协同过滤算法,利用已有的部分稀疏数据来预测那些空白的物品和数据之间的评分关系,从而找到用户可能感兴趣的项目。随着深度学习的不断发展,生成对抗网络(Generative Adversarial Networks)已经被成功应用到推荐领域。生成对抗网络拥有生成模型和判别模型,但在训练过程中,生成器试图欺骗鉴别器,并让其认为生成模型中的数据是真实数据,鉴别器试图正确判断真实数据,在GAN训练期间,生成模型试图通过输入假数据生成真实数据,而区别模型则估计数据为真或假的可能性(来自生成模型),最终,鉴别器无法区分生成器中的数据,而生成器可以生成我们需要的数据,由于GAN缺乏有效的推理机制,无法对用户的交互特征进行表示,这限制了它学习数据的分布,影响了预测结果的准确性。

技术实现思路

[0003]本专利技术的目的在于解决现有技术中存在的问题,提供基于改进的生成对抗网络的评分预测方法,可以利用学习到的交互特征,进一步提升模型学习用户兴趣分布的能力,以提高评级预测的准确性。
[0004]本专利技术为实现上述目的,通过以下技术方案实现:
[0005]基于改进的生成对抗网络的评分预测方法,包括步骤:
[0006]S1、首先将用户交互历史输入到编码器中,利用编码器学习用户交互数据的特征并进行表示,然后将编码器的输入与输出看作联合分布,并输入到判别器;
[0007]S2、将用户隐式交互矩阵输入到生成器中,由生成器学习用户的兴趣分布,并将生成器的输出与输入看作联合分布,输入到判别器;
[0008]S3、将训练得到两个联合分布分别输入到判别器中,判别器判断输入数据的来源,如果来自于编码器,则输出的值越接近于1越好,如果来源于生成器,则输出的值越接近于0越好,编码器与生成器两者做对抗训练,以使两个联合分布尽可能的接近;
[0009]S4、当训练到最优时,两个联合分布基本相同,此时将用户的每个项目输入到生成器中,对每个项目生成一个评分,并做一个排序,为用户提供他们可能更感兴趣的项目。
[0010]优选的,步骤S1中,以用户的交互历史作为输入,在进入编码器后,对数据进行特征提取,以获取用户的兴趣偏好,最终得到所有用户兴趣偏好矩阵,然后将编码器的输入与
输出看作一个联合分布,作为判别器的输入。
[0011]优选的,步骤S2中,将隐式交互矩阵输入到生成器中,生成器根据用户的兴趣分布,不断地学习,最终生成尽可能接近用户真实兴趣的分布,然后将生成器的输出与输入看作一个联合分布,作为判别器的输入。
[0012]优选的,步骤S3中,将编码器与判别器的联合分布输入到判别器中,判别器判断输入数据的来源,假设来源于编码器,则输出值为1,来源于生成器,则输出值为0,编码器、生成器与判别器做对抗训练,使两个联合分布尽可能的接近,在训练完成后,完成用户对每个项目的评分预测,来为用户推荐他们更感兴趣的项目。
[0013]对比现有技术,本专利技术的有益效果在于:
[0014]本专利技术将独立的编码器和生成器进行对抗训练测试评分预测,以便更好地为用户推荐喜欢的项目,提高用户满意度;利用独立的编码器与生成器,学习交互特征的表示,能够更好地拟合用户项目交互数据的分布,提高推荐的准确性。
附图说明
[0015]图1是本专利技术的系统评分预测总体架构图;
[0016]图2是本专利技术的编码器结构图;
[0017]图3是本专利技术的生成器结构图;
[0018]图4是本专利技术的判别器结构图。
具体实施方式
[0019]下面结合具体实施例,进一步阐述本专利技术。应理解,这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围。此外应理解,在阅读了本专利技术讲授的内容之后,本领域技术人员可以对本专利技术作各种改动或修改,这些等价形式同样落于本申请所限定的范围。
[0020]CFGAN是基于GAN和CF的非常成功的深度推荐框架。在数据预处理方面,采用矢量方式对抗训练,提出基于矢量方式对抗训练的GAN框架。由于数据更易于收集,因此它计划将重点放在具有隐式反馈的CF上。CFGAN的生成模型试图生成真实的购买向量。同样,D试图区分生成的用户购买向量和从地面真实情况获得的真实购买向量。生成器通过生成与购买向量类似的向量来与判别器进行博弈,但是最终生成器将训练得到一个全1向量,为此,将负采样技术引入CFGAN,并通过损失函数进行优化,保证生成器G学习到用户购买过的物品为1、未购买过的为0从而生成非全1的购买向量。
[0021]实施例1:如附图1

4所示,本专利技术所述是基于改进的生成对抗网络的评分预测方法,包括步骤:
[0022]S1、首先将用户交互历史输入到编码器中,利用编码器学习用户交互数据的特征并进行表示,然后将编码器的输入与输出看作联合分布,并输入到判别器;
[0023]S2、将用户隐式交互矩阵输入到生成器中,由生成器学习用户的兴趣分布,并将生成器的输出与输入看作联合分布,输入到判别器;
[0024]S3、将训练得到两个联合分布分别输入到判别器中,判别器判断输入数据的来源,如果来自于编码器,则输出的值越接近于1越好,如果来源于生成器,则输出的值越接近于0越好,编码器与生成器两者做对抗训练,以使两个联合分布尽可能的接近;
[0025]S4、当训练到最优时,两个联合分布基本相同,此时将用户的每个项目输入到生成器中,对每个项目生成一个评分,并做一个排序,为用户提供他们可能更感兴趣的项目。
[0026]实施例2:本专利技术所述是基于改进的生成对抗网络的评分预测方法,具体的:
[0027]1、编码器
[0028]编码器的模型图如附图2所示,以用户的交互历史作为输入,在进入编码器后,对数据进行特征提取,以获取用户的兴趣偏好,最终得到所有用户兴趣偏好矩阵。然后将编码器的输入与输出看作一个联合分布,作为判别器的输入。
[0029]2、生成器
[0030]生成器的模型图如附图3所示,我们将隐式交互矩阵输入到生成器中,生成器根据用户的兴趣分布,不断地学习,最终生成尽可能接近用户真实兴趣的分布。然后将生成器的输出与输入看作一个联合分布,作为判别器的输入。
[0031]3、判别器
[0032]判别器的模型图如附图4所示,最终将编码器与判别器的联合分布输入到判别器中,判别器判断输入数据的来源,假设来源于编码器,则输出值为1,来源于生成器,则输出值为0,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于改进的生成对抗网络的评分预测方法,其特征在于,包括步骤:S1、首先将用户交互历史输入到编码器中,利用编码器学习用户交互数据的特征并进行表示,然后将编码器的输入与输出看作联合分布,并输入到判别器;S2、将用户隐式交互矩阵输入到生成器中,由生成器学习用户的兴趣分布,并将生成器的输出与输入看作联合分布,输入到判别器;S3、将训练得到两个联合分布分别输入到判别器中,判别器判断输入数据的来源,如果来自于编码器,则输出的值越接近于1越好,如果来源于生成器,则输出的值越接近于0越好,编码器与生成器两者做对抗训练,以使两个联合分布尽可能的接近;S4、当训练到最优时,两个联合分布基本相同,此时将用户的每个项目输入到生成器中,对每个项目生成一个评分,并做一个排序,为用户提供他们可能更感兴趣的项目。2.根据权利要求1所述的基于改进的生成对抗网络的评分预测方法,其特征在于,步骤S1中,以用户...

【专利技术属性】
技术研发人员:秦继伟宋晓远郑炅
申请(专利权)人:新疆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1