一种基于图卷积网络的推荐方法技术

技术编号:24121953 阅读:30 留言:0更新日期:2020-05-13 03:21
本发明专利技术涉及一种基于图卷积网络的推荐方法,用于解决现有方法中对用户‑项目关系特征挖掘不充分以及稀疏数据计算资源消耗巨大的问题。具体内容包括一种基于图卷积网络的推荐算法框架,在召回率和归一化折扣累积率这两项指标上较现有传统方法有较大提升。

【技术实现步骤摘要】
一种基于图卷积网络的推荐方法
本方法涉及推荐算法、图卷积网络以及深度学习。
技术介绍
随着大数据、云计算、物联网等技术的飞速发展,互联网空间中的应用种类层出不穷,导致了互联网空间中数据的爆炸式增长。根据国际数据集团(IDC)2012年的一份报告显示:到2020年,预计全球数据总量是2011年的22倍,将达到35.2ZB。大数据为信息技术的发展带来了巨大的潜力和契机,但同时也带来了严重的信息过载问题。如何从纷繁复杂的数据中筛选出有价值的信息成为阻碍大数据发展的关键难题。推荐算法作为解决信息过载问题的一项关键技术,已经得到了学术界和工业界的广泛关注并应用到各个领域当中,如音乐、视频、新闻、广告、商品等。推荐算法通过对用户和项目进行特征提取和模型构建,计算后为用户推荐其感兴趣的内容或商品,提升用户满意度。近些年来,数据量的飞速增长使得传统方法在挖掘数据价值上的局限性越来越明显,限制了算法性能的发挥。随着计算机的计算能力不断提高,之前一些因为计算量巨大而无法良好使用的算法得到了人们的重视和发展,深度学习就是其中之一。深度学习作为大数据时代的一项重要技术已经被广泛应用到各个行业当中,如图像识别、自然语言处理等。卷积神经网络作为深度学习方法中的一种重要方法已经在图像等领域取得巨大成就,但随着人们研究的不断深入,人们发现卷积神经网络研究的对象只局限于欧几里得空间的数据,即具有规则空间结构的数据。对于一些非欧几里得空间的数据,如不规则三维模型、社交网络的抽象图谱等,卷积神经网络的卓越效果无法良好的发挥,于是图卷积网络应运而生。近些年来,图卷积网络已经在图像处理领域取得了丰硕的成果,它对非欧几里得空间数据的良好处理能力也吸引了推荐算法相关研究人员的关注,如何在推荐算法中良好地应用图卷积网络以提升用户体验已经成为现阶段推荐算法的一个研究热点。现有方法近些年来,深度学习在图像、自然语言处理、语音识别等领域都取得了突破性进展,为信息化时代带来了人工智能的热潮,同时也助力了推荐算法的发展。一方面,深度学习可以通过学习一种深层次非线性网络结构,用以表示用户与项目的特征,能够从样本中获取用户和项目的深层特征表示;另一方面,深度学习通过从多源异构数据中进行自动特征学习,从而将不同数据映射到一个相同的隐空间,能够获得数据的统一表征,结合传统推荐算法得到更好的推荐效果。现阶段基于深度学习技术的推荐系统主要分为以下五种:(1)基于内容的推荐算法,利用用户的显示或隐式反馈数据、用户画像、项目内容数据,以及各类的用户生成内容,采用深度学习方法来学习用户与项目的隐向量,并将与用户交互过的类似项目推荐给用户。(2)基于协同过滤的推荐算法,利用用户的显示或者隐式反馈数据,采用深度学习的方法学习用户或者项目的隐向量,从而基于隐向量预测用户的偏好。(3)混合推荐算法,模型层面主要是对基于内容的推荐和基于协同过滤的推荐相融合,包括后融合、中融合、前融合三种。后融合即指在决策层面上将两种算法相融合,中融合即指在模型层面将两种算法相融合,前融合即指在特征提取层面将两种算法相融合。(4)基于社交网络的推荐算法,利用用户的显示或隐式反馈数据、用户的社会化关系等数据,采用深度学习模型重点建模用户之间的社会关系影响,更好地发现用户偏好。(5)基于情景感知的推荐系统,利用用户的显示或隐式反馈数据以及用户的情景信息等各类数据,采用深度学习模型对用户的情景进行建模,发现用户在特定情景下的偏好。方法缺陷上述基于深度学习方法存在以下问题:(1)数据价值挖掘不完全。在挖掘用户和项目数据信息时,上述方法只考虑了用户与项目之间的浅层联系,即一次交互关联,而没有考虑用户与用户之间、用户于项目之间的深层次关联,如两用户之间可能因另一个用户而存在潜在关联。(2)推荐算法的数据通常为巨大稀疏数据,需要大规模的硬件和时间计算。
技术实现思路
本专利技术通过用户与项目数据集,建立基于图卷积网络的深度学习推荐模型,预测用户可能感兴趣的项目列表并给出排名。本方法通过将高阶稀疏特征向量转化为低阶稠密向量,并对其进行图卷积操作以挖掘用户之间更深层次的信息(这里用户与项目的联系可以看作是一种图结构),从而解决数据价值挖掘不完全的问题,此外此方法将稀疏高维数据转化为稠密低维数据,大大减少了运算时间,节省了运算资源。具体技术方案如下:(1)选择数据作为训练集,根据训练集数据生成用户-项目交互矩阵和反映用户与项目之间联系的领接矩阵(即用户-项目联系拓扑图的矩阵表示,见图三)。本方法所使用的图卷积网络模型由嵌入层、嵌入传播层、隐藏层和预测层组成。训练集数据在进入模型时会通过嵌入层进行嵌入操作,之后通过嵌入传播层来挖掘数据的深层次关联信息,再将嵌入传播层得到的特征向量作为输入进入到隐藏层中进一步挖掘用户与项目直接的联系,最后通过预测层预测得到预测分数并与实际分数进行比较从而优化模型参数;(2)将用户-项目交互矩阵输入嵌入层,得到一个统一的特征向量(eu,ei),具体为:根据用户-项目交互矩阵通过one-hot编码将用户和项目映射到同一个潜在空间中,将稀疏的用户-项目交互矩阵抽象成稠密的用户的特征向量eu和项目的特征向量ei;(3)将(2)中的特征向量和之前通过处理训练集得到的邻接矩阵作为输入输入到嵌入传播层中。通过图卷积网络对数据进行更深层次的特征挖掘。具体来说,对于存在交互的用户-项目对(u,i),对它们进行如下计算这里W1、W2代表信息的可训练矩阵(即图卷积网络的参数矩阵),N1、Ni分别代表u、i邻居(即与u或i直接连接的节点数量)的数量,运算⊙表示元素乘积运算,得到代表用户u与项目i联系的信息(反映u-i联系的特征向量)m1←i;(4)接下来把用户u的每一条信息进行聚合,得到用户u的最终表示这里函数f为激活函数;(5)对项目i进行相同的操作得到项目i的最终表示(6)将经过嵌入传播操作后的特征向量和输入到隐藏层中,通过多层感知积挖掘数据的非线性特征,通过内积运算挖掘用户的线性特征,并将两种特征连接后传入预测层中;(7)最后,通过预测层计算用户u对项目i的偏好并通过不断优化损失函数得到最佳模型参数;(8)参数训练完毕后即可该算法模型并用测试集加以测试与应用。有益效果本方法将图卷积网络应用到基于深度学习的推荐算法当中,解决了传统方法对数据挖掘不充分和计算资源消耗过大的问题,达到了更好的推荐效果。附图说明图一、方法流程图图二、模型结构图图三、用户-项目拓扑图及其邻接矩阵图具体实施方式(1)使用Gowalla数据集,该数据集为一款名为Gowalla的签到应用提供,其中用户与项目(地点)交互意为用户在此地点进行了签到。该数据集包含29858个用户、40981个项目(地点),其中存在的交互数量为1027370,数据稀疏度为0.00084。我们将其中百分之八十的交互数据作为训练集,其余的作为测试集。将训练集的交互数据生成用户-项目交互矩阵和能表示用户-项目拓扑图的本文档来自技高网
...

【技术保护点】
1.一种基于图卷积网络的推荐方法,其特征在于包括以下步骤:/n(1)选择数据作为训练集,根据训练集数据生成用户-项目交互矩阵(e

【技术特征摘要】
1.一种基于图卷积网络的推荐方法,其特征在于包括以下步骤:
(1)选择数据作为训练集,根据训练集数据生成用户-项目交互矩阵(eui)U×I和反映用户与项目之间联系的领接矩阵,即用户-项目联系拓扑图的矩阵表示;其中,本方法所使用的图卷积网络模型由嵌入层、嵌入传播层、隐藏层和预测层组成;
(2)将用户-项目交互矩阵作为输入输入到嵌入层,所述嵌入层用于将用户和项目映射到同一个潜在空间,具体为:将用户-项目交互矩阵输入嵌入层,得到用户的特征向量eu和项目的特征向量ei,并将二者连接得到一个统一的特征向量(eu,ei);
(3)将(2)中的特征向量(eu,ei)和之前通过处理训练集得到的邻接矩阵输入到嵌入传播层,具体来说,对于存在交互的用户-项目对(u,i),对它们进行如下计算这里W1、W2代表信息的可训练矩阵,即图卷积网络的待训练参数矩阵,N1代表用户u的邻居个数,即与节点u直接连接的节点的个数,Ni代表项目i的邻居个数,即与节点i直接连接的节点的个数,运算⊙表示元素乘积运算,得到表示用户u与项目i之间联系的特征向量mu←i;
(4)接下来把用户u的每一条信息进行聚合,得到用户u...

【专利技术属性】
技术研发人员:韩笑徐晓斌赵辉
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1