一种基于社交关系的图神经网络链路预测推荐方法技术

技术编号:26791399 阅读:65 留言:0更新日期:2020-12-22 17:06
本发明专利技术公开了一种基于社交关系的图神经网络链路预测推荐方法,建立用户——物品二部图,根据用户之间的社交关系构建含有用户社交关系的物品互动拓扑图。将评论文本和购买关系作为节点信息的来源,使用Bert进行文本数据和网络结构的特征提取工作,以得到每个节点的初始特征向量。通过在该GNN上使用残差连接的方式,使得图中的节点信息尽可能地保留原始图谱的的结构信息,并得到更新后的节点信息。最后,通过链路预测算法得到用户对物品的偏好程度,并且针对得到的预测评分,采用Top‑n推荐,生成推荐物品列表。本发明专利技术通过评论对节点特征进行个性化描述,并且能将用户——物品构成拓扑图的结构信息充分运用,从而进行更有效的推荐。

【技术实现步骤摘要】
一种基于社交关系的图神经网络链路预测推荐方法
本专利技术涉及推荐系统、文本分类及GNN研究
,尤其涉及一种基于社交关系的图神经网络链路预测推荐方法。
技术介绍
随着互联网技术的不断发展,网上信息量的急剧增加,用户往往难以选择真正适合自己的商品,所以个性化推荐服务的需求越来越广泛。如何充分运用用户已有的评论及行为数据,挖掘出用户偏好及商品特征,为用户推荐合适的商品,对提升用户体验、增加商品销售变得非常重要。因此,推荐系统已成为当前互联网发展过程中的一大热门领域。传统的协同过滤推荐技术,一般利用评分数据来获取用户偏好,除了评分,不需要获取其他内容信息,虽然避免了提取数据的复杂性,但是输入的数据单一,遗漏了其它数据信息。所以仅通过传统协同过滤技术不能直观和全面地获取用户偏好信息,也就导致推荐性能不够理想。图数据能够蕴含着大量的信息,不仅仅包含节点信息,还包含了节点与邻居节点之间的信息,通过GNN进行聚合更新,可以充分运用图中节点信息与结构信息。将图数据应用在深度学习的推荐算法中,通过深度学习的方法精准获取用户对物品的偏好程度,从而提高推本文档来自技高网...

【技术保护点】
1.一种基于社交关系的图神经网络链路预测推荐方法,其特征在于:具体包括以下步骤:/n步骤1、构建图结构:根据用户对物品的购买记录进行图构建;/n步骤1.1、构建用户——物品二部图;/n将每个拥有行为记录的物品和用户生成对应的节点,如果用户购买了该物品,则对应的该用户和物品的节点之间有一条连边,每条记录构成一条边,构成一个完整的拓扑结构图,其中用户和物品表示为节点,用户与物品的购买关系表示为无向边;/n步骤1.2、引入社交关系;/n根据用户在社交媒体之间的好友关系,对步骤1.1构建的用户——物品二部图添加社交信息,若用户之间为好友关系,则图中对应该用户的节点新增一条边,若为单向好友关系,则添加一...

【技术特征摘要】
1.一种基于社交关系的图神经网络链路预测推荐方法,其特征在于:具体包括以下步骤:
步骤1、构建图结构:根据用户对物品的购买记录进行图构建;
步骤1.1、构建用户——物品二部图;
将每个拥有行为记录的物品和用户生成对应的节点,如果用户购买了该物品,则对应的该用户和物品的节点之间有一条连边,每条记录构成一条边,构成一个完整的拓扑结构图,其中用户和物品表示为节点,用户与物品的购买关系表示为无向边;
步骤1.2、引入社交关系;
根据用户在社交媒体之间的好友关系,对步骤1.1构建的用户——物品二部图添加社交信息,若用户之间为好友关系,则图中对应该用户的节点新增一条边,若为单向好友关系,则添加一条单向边;
步骤2、生成节点信息;
步骤2.1、生成节点内容信息:根据用户或物品的评论记录生成表示该用户或物品的特征向量;
步骤2.2、生成节点结构信息:使用Bert对随机游走的序列进行预训练,获取结构信息表示;
步骤3、构建用户图神经网络,更新用户节点信息;
步骤4、预测用户u对物品i的喜好程度:
步骤5、Top-n推荐:基于Top-n算法,根据用户对每个物品的偏好程度进项排序,选择偏好程度高的前s个生成推荐列表。


2.根据权利要求1所述的一种基于社交关系的图神经网络链路预测推荐方法,其特征在于:步骤2.1所述的根据用户或物品的评论记录生成表示该用户或物品的特征向量,具体如下:将图中节点对应的每个用户或物品的评论进行预处理之后,分别筛选出总长度为m的有效评论,输入Bert中进行遮盖预测词的预训练;具体操作是随机遮盖或替换一句话里面任意字或词,然后让模型通过上下文的理解预测被遮盖或替换的部分,之后计算Loss函数的时候只计算被遮盖部分的Loss函数;再让模型预测和还原被遮盖掉或替换掉的词,模型最终输出的隐藏层的计算结果的维度是:Xhidden:[batch_size,seq_len,embedding_dim],初始化一个映射层的权重Wvocab:[embedding_dim,vocab_size],用映射层的权重Wvocab完成隐藏维度到字数的映射,只要求Xhidden和Wvocab的点积XhiddenWvocab=[batch_size,seq_size,vocab_size],把上面的计算结果在vocab_size维度使用softmax归一化,使每个字对应的vocab_size的和为1,通过vocab_size里概率最大的字来得...

【专利技术属性】
技术研发人员:吴国栋查志康李方涂立静李景霞王伟娜
申请(专利权)人:安徽农业大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1