一种对三角形结构敏感的图中的社区发现方法和装置制造方法及图纸

技术编号：28420306 阅读：21 留言：0更新日期：2021-05-11 18:27

本发明专利技术涉及一种对三角形结构敏感的图中的社区发现方法和装置。该方法的步骤包括：利用图自编码器中的图编码器，通过图神经网络模型融合图中的结构信息和节点内容信息，从而学习到图中节点的隐层向量表示；利用图自编码器中的图解码器，根据图中节点的隐层向量表示对图中两点之间的连边关系和图中的三角形结构进行重构；利用重构后的图中的结构信息和节点内容信息进行图聚类，从而发现社区。本发明专利技术是一种无监督的基于图自编码器的对三角形结构敏感的社区发现方案，可以在图中高效、自适应地实现社区发现任务，并应用于不同平台中，具有高可扩展性，高灵活性。

全部详细技术资料下载

【技术实现步骤摘要】
一种对三角形结构敏感的图中的社区发现方法和装置
本专利技术属于通用信息
，现实生活中很多场景和应用都可以用图来描述，如社交网络图，论文引用图，电商平台中的用户商品图等，图中的社区反映了节点之间的相似性和关联程度，包含丰富的信息，如何快速有效地对图进行聚类，从而挖掘出图中的社区信息已经成为重要的研究问题。其中，图中的三角形结构对社区的组成与发现有着重要的意义。本方法基于先进的图神经网络技术，结合图中的三角形结构，以自监督的形式从数据中学习节点表示并聚类从而发现出图中的社区结构，可以被广泛应用在社交、电子商务等不同在线网络平台的图中。
技术介绍
图结构被广泛应用于现实世界中各种复杂场景的描述，如社会关系网络，万维网，城市交通网络，电商中的用户商品关系网等。社区结构是所有类型图中的一个普遍特征，整个图由许多社区组成，而社区反映节点之间的联系紧密性。图中的社区发现算法可以帮助我们了解图中的节点群集、独立组和网络结构，这些有助于我们推断对等的各组的相似行为和偏好、弹性估算和查找嵌套关系，也可以数据挖掘任务提供依据。例如在在电子商务系统中，查询与给定目标作弊用户有协同关系的作弊团伙；在社交网络中，查询单个或多个目标用户共同的兴趣社区等。图上的社区发现任务通常是根据图中的节点聚类得到社区。社区内部的节点联系紧密，社区之间联系稀疏，因此社区内部通常为稠密子图，而三角形组成稠密子图的基本元素，因此图中三角形结构的利用对社区的发现十分重要。传统的聚类算法，如K-L二分法、图二分法、谱聚类等，主要通过利用图中的连边信息来寻找...

【技术保护点】
1.一种对三角形结构敏感的图中的社区发现方法，其特征在于，包括以下步骤：/n利用图自编码器中的图编码器，通过图神经网络模型融合图中的结构信息和节点内容信息，从而学习到图中节点的隐层向量表示；/n利用图自编码器中的图解码器，根据图中节点的隐层向量表示对图中两点之间的连边关系和图中的三角形结构进行重构；/n利用重构后的图中的结构信息和节点内容信息进行图聚类，从而发现社区。/n

【技术特征摘要】
1.一种对三角形结构敏感的图中的社区发现方法，其特征在于，包括以下步骤：
利用图自编码器中的图编码器，通过图神经网络模型融合图中的结构信息和节点内容信息，从而学习到图中节点的隐层向量表示；
利用图自编码器中的图解码器，根据图中节点的隐层向量表示对图中两点之间的连边关系和图中的三角形结构进行重构；
利用重构后的图中的结构信息和节点内容信息进行图聚类，从而发现社区。

2.根据权利要求1所述的方法，其特征在于，利用子图采样来减小训练数据规模，然后在采样的子图上学习图自编码器。

3.根据权利要求2所述的方法，其特征在于，所述子图采样包括：
对于节点u和节点v，如果它们之间有连边，那该连边被采样的概率为pu，v∝1/du+1/dv；
给定采样子图规模，根据上述概率对全图中的边进行采样，根据采样得到的边进行子图抽取从而确定采样子图。

4.根据权利要求1所述的方法，其特征在于，采用以下步骤对图中两点之间的连边关系进行重构：给定图中原有连边的两点A和B，通过一层内积网络来计算A与B两点的连边可能性，从而重构图中已有的连边信息。

5.根据权利要求4所述的方法，其特征在于，采用以下步骤计算对图中两点之间的连边关系进行重构的损失函数：
根据学习到的隐层节点向量表示Zt进行内积运算，对子图中所有的连边进行重构，得到重构的子图邻接矩阵
对于图中存在的边(u，v)，根据和真实子图邻接矩阵At的差别来定义损失函数Lu，v：其中zu表示点u的隐层节点向量，zv表示点v的隐层节点向量。

6.根据权利要求1所述的方法，其特征在于，采用以下步骤对图中的三角形结构进行重构：给定A和B之间的连边，寻找A和B的邻居集合，假设C是A或者B的邻居，根据C是否同A与B都相连来进行三角形信息的学习，同时进行负采样，采样节点D，D与A和B都不相连，通过A，B，C，D之间的关系来进行三角形信息的重构和学习。

7.根据权利要求6所述的方法，其特...

【专利技术属性】
技术研发人员：张吉，王佳麟，高军，
申请(专利权)人：之江实验室，北京大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人