System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及推荐系统、图神经网络、链路预测、图同质异质性,是一种基于子图链路预测的异质性优化推荐方法和装置。
技术介绍
1、基于图神经网络(gnn)的链路预测方法在各种图数据挖掘场景中的技术应用越来越多,例如在电子商务、社交网络、生物化学等领域。一个普遍的现象是,许多图神经网络模型都满足同质性原则,即模型假设两个相连节点的特定属性(例如,标签、节点特征)往往是相同或相似的。例如在引文网络中,一项研究通常引用同一研究领域的参考论文,搜寻论文的用户的需求也往往是在同领域内。而近年的研究指出,由于同质性gnn原理上更适用于高同质性的图数据,因此其在异质图数据上的性能会受到限制。
2、这是一个值得关注的问题,因为现实世界中的图数据大都具有不同程度的异质性,即明显不同甚至属性相反的东西也可以产生连接。在线上交易网络中,诈骗者更有可能与客户建立联系;在社交领域的很多场景中,多数人更喜欢与异性接触或约会;在电商领域的推荐任务中,异质图由用户与商品、店铺与朋友等实体基于大量的交互建模而成。现实世界中广泛存在着具有异质性的图数据,异质图的应用前景相当广阔。
3、基于gnn的属性网络链路预测算法可应用于推荐任务。针对属性网络提出的方法可以将图结构信息和属性信息结合起来加以利用,但图数据的异质性同样会对模型性能有一定影响。结合实践中所见的现象可知,同质性gnn的性能在同质性高的数据上表现良好,在异质性高的数据上表现不佳。甚至对于同一份数据,模型在异质性的部分上的表现也会低于同质性的部分。这意味着在实际应用中,推荐系统的算法会
4、为了能更好地处理和利用异质性较高的数据,近年来也有许多异质性gnn方法被提出。但大都是考虑语义层面的异质性方法,即采用元路径的方式对原始图进行采样,需要的信息和元路径的种类也会比较复杂,或某些情况下数据中很难获取到含有足够信息的元路径。因此,需要一种能更简单有效地优化模型对于异质性数据的预测性能的方法。
技术实现思路
1、本专利技术要克服现有技术的上述缺点,提供一种基于子图链路预测的异质性优化推荐方法和装置。本专利技术结合了图拓扑结构特征和异质性特征,通过提取并利用图的异质性特征,实现gnn模型的性能优化,提高链路预测算法总体的准确率,提升了推荐系统在异质图上的有效性。
2、本专利技术采用的技术方案:一种基于子图链路预测的异质性优化推荐方法,包括如下步骤:
3、s1:基于用户、商品、店铺3类实体之间的各种行为或关系抽象构建出模型所需带节点标签的无权无向图。
4、s2:对步骤s1构建的无权无向图实施目标节点对的封闭子图采样提取,得到提取后的子图对象集合。
5、s3:对步骤s2得到的子图样本集合,简单控制其子图的大小上限,并进行合理的样本过滤。
6、s4:根据步骤s3得到的子图样本集合,计算每个封闭子图的节点异质性指标。
7、s5:根据计算得到的指标数据,生成新的异质特征向量。
8、s6:将得到的异质特征向量与原节点特征进行替换,成为新的节点特征。
9、s7:使用dcgnn模型(deep graph convolutional neural network),对子图特征进行提取,获得图的重要表征,并进行模型训练,最后实现对目标节点对之间连边是否存在的预测。
10、s8:根据步骤s7可以得到一批存在连边的预测结果,即可以得到每位用户的推荐候选名单。
11、s9:对步骤s8中每位用户得到的推荐候选名单,根据预测分数完成进一步的排序,得到最终展示给用户的推荐结果。
12、所述步骤s1中,基于用户、商品、店铺三大实体之间的各种行为或关系抽象构建出模型所需带节点标签的无权无向图。具体如下:根据系统日志中用户的历史行为记录,可以构建出以用户为中心的用户-商品/店铺、用户-用户的无权无向图。同时,根据店铺售卖的商品目录、各个店铺名称中的关键词、商品的相同种类可以进一步补充图中的连接关系。最后,根据实体的不同种类给每个节点打上标签,用于表示节点属于哪一类实体。由此可以构建出一个完整的由3类实体组成的带节点标签的无权无向图。
13、所述步骤s2中,对构建的无权无向图实施目标节点对的子图提取,获得采样后的子图对象集合。具体如下:首先模型需要的是目标节点对的h阶封闭子图,考虑到信息的完善性和模型设备的运行效率问题,令子图的hop数为2是最合适的,即h=2。确定子图阶数后,则根据用户-商品/店铺的格式确定目标节点对,即节点对的一方为用户,另一方是商品也可以是店铺。采样方法则是分别获取两节点的2阶邻居集合,再将二者的邻居集合进行合并,组成完整的2阶子图。
14、所述步骤s4中,根据步骤s3得到的子图集合,对每一个子图计算相应的异质特征。具体如下:
15、对于异质性指标,由以下两个计算公式说明:
16、nhi(k)=|{j|j∈neibor(k)(i),yi≠yj}| (1)
17、其中neibor(k)(i)表示目标节点i的k阶邻居集合,y代表节点的类标签,则nhi(k)的意义为目标节点的k阶异质性邻居数量。
18、
19、其中rhi(k)表示目标节点i的k阶异质性邻居的占比。
20、所述步骤s5中,根据步骤s4计算得到的异质性指标,将这4个指标以一维向量的形式拼接保存,即节点i的异质特征向量为:
21、xi=[nhi(1),rhi(1),nhi(2),rhi(2)]
22、所述步骤s6中,将步骤s5得到的新异质特征与原图中的节点特征进行替换,完成所有子图的新特征向量工程。
23、所述步骤s7中,使用dcgnn模型,对全部子图进行特征提取,获得子图的表示,并进行模型训练,最后实现对目标节点对之间连边是否存在的预测,具体过程如下:
24、给定子图的邻接矩阵a和其节点信息矩阵x,图卷积层为:
25、
26、其中是对角度值矩阵,即w即可训练的图卷积参数矩阵,f是非线性激活函数;
27、为提取多尺度的子结构特征,将多个图形卷积层堆叠可得到如下表示:
28、
29、其中z0=x,zt则是第t层图卷积网络的输出,wt则是t通道向t+1通道的映射。
30、在进行多个图形卷积层之后,多层的输出会被横向串联起来,即成为[z1,…,zh]的形式。而后特征信息将被传入池化层,该层的主要功能是以一致的顺序对特征描述符进行排序,而每个特征描述符分别对应原网络中的一个节点。这里采用sortpooling层,根据卷积网络最后一层输出的值的本文档来自技高网...
【技术保护点】
1.一种基于子图链路预测的异质性优化推荐方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于子图链路预测的异质性优化推荐方法,其特征在于:所述步骤S1中,基于用户、商品、店铺三大实体之间的各种行为或关系抽象构建出模型所需带节点标签的无权无向图,具体包括:根据系统日志中用户的历史行为记录,构建出以用户为中心的用户-商品/店铺、用户-用户的无权无向图;同时,根据店铺售卖的商品目录、各个店铺名称中的关键词、商品的相同种类进一步补充图中的连接关系;最后,根据实体的不同种类给每个节点打上标签,用于表示节点属于哪一类实体;由此构建出一个完整的由3类实体组成的带节点标签的无权无向图。
3.根据权利要求1所述的基于子图链路预测的异质性优化推荐方法,其特征在于:所述步骤S2中,对构建的无权无向图实施目标节点对的子图提取,获得采样后的子图对象集合,具体包括:首先模型需要的是目标节点对的h阶封闭子图,考虑到信息的完善性和模型设备的运行效率问题,令子图的hop数为2是最合适的,即h=2;确定子图阶数后,则根据用户-商品/店铺的格式确定目标节点对,即节点对的一方为用户,另
4.根据权利要求1所述的基于子图链路预测的异质性优化推荐方法,其特征在于:所述步骤S4中,对步骤S3得到的子图集合,对每一个子图计算相应的异质特征,具体包括:
5.根据权利要求1所述的基于子图链路预测的异质性优化推荐方法,其特征在于:所述步骤S5中,根据步骤S4计算得到的异质性指标,将这4个指标以一维向量的形式拼接保存,即节点i的异质特征向量为:
6.根据权利要求1所述的基于子图链路预测的异质性优化推荐方法,其特征在于:所述步骤S6中,将步骤S5得到的新异质特征与原图中的节点特征进行替换,完成所有子图的新特征向量工程。
7.根据权利要求1所述的基于子图链路预测的异质性优化推荐方法,其特征在于:所述步骤S7中,使用DCGNN模型,对全部子图进行特征提取,获得子图的表示,并进行模型训练,最后实现对目标节点对之间连边是否存在的预测,具体包括:
8.根据权利要求1所述的基于子图链路预测的异质性优化推荐方法,其特征在于:所述步骤S8中,根据步骤S7可以得到一批存在连边的预测结果,即可以得到每位用户的推荐候选名单,具体包括:以用户为中心,按用户对预测结果进行划分,由此得到每位用户的推荐候选名单。
9.根据权利要求1所述的基于子图链路预测的异质性优化推荐方法,其特征在于:所述步骤S9中,对步骤S8中每位用户的推荐候选名单,完成进一步的排序,做出最终展示给用户的推荐结果,具体包括:根据模型给出预测时的具体分数,对候选名单中的实体进行从大到小的排序,为每个用户生成合理的推荐结果。
10.基于子图链路预测的异质性优化推荐装置,其特征在于,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现权利要求1-9中任一项所述的基于子图链路预测的异质性优化推荐方法。
...【技术特征摘要】
1.一种基于子图链路预测的异质性优化推荐方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于子图链路预测的异质性优化推荐方法,其特征在于:所述步骤s1中,基于用户、商品、店铺三大实体之间的各种行为或关系抽象构建出模型所需带节点标签的无权无向图,具体包括:根据系统日志中用户的历史行为记录,构建出以用户为中心的用户-商品/店铺、用户-用户的无权无向图;同时,根据店铺售卖的商品目录、各个店铺名称中的关键词、商品的相同种类进一步补充图中的连接关系;最后,根据实体的不同种类给每个节点打上标签,用于表示节点属于哪一类实体;由此构建出一个完整的由3类实体组成的带节点标签的无权无向图。
3.根据权利要求1所述的基于子图链路预测的异质性优化推荐方法,其特征在于:所述步骤s2中,对构建的无权无向图实施目标节点对的子图提取,获得采样后的子图对象集合,具体包括:首先模型需要的是目标节点对的h阶封闭子图,考虑到信息的完善性和模型设备的运行效率问题,令子图的hop数为2是最合适的,即h=2;确定子图阶数后,则根据用户-商品/店铺的格式确定目标节点对,即节点对的一方为用户,另一方是商品也可以是店铺;采样方法则是分别获取两节点的2阶邻居集合,再将二者的邻居集合进行合并,组成完整的2阶子图。
4.根据权利要求1所述的基于子图链路预测的异质性优化推荐方法,其特征在于:所述步骤s4中,对步骤s3得到的子图集合,对每一个子图计算相应的异质特征,具体包括:
5.根据权利要求1所述的基于子图链路预测的异质性优化推荐方法,...
【专利技术属性】
技术研发人员:宣琦,朱烨辉,王新淇,王金焕,俞山青,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。