基于图双重自编码器的社区发现方法、系统、设备及介质技术方案

技术编号：38529272 阅读：11 留言：0更新日期：2023-08-19 17:03

本发明专利技术公开一种基于图双重自编码器的社区发现方法、系统、设备及介质，涉及社区发现技术领域，该方法包括将给定的引文网络输入图双重自编码器，得到图结构表示信息和图属性表示信息；将图结构表示信息和图属性表示信息进行融合，得到融合后的图表示信息；采用聚类方法对融合后的图表示信息进行社区划分，得到社区发现结果。本发明专利技术提高了对引文网络中社区划分的准确性。的准确性。的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于图双重自编码器的社区发现方法、系统、设备及介质

[0001]本专利技术涉及社区发现
，特别是涉及一种基于图双重自编码器的社区发现方法、系统、设备及介质。

技术介绍

[0002]引文分析是指对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析以揭示其数量特征和内在规律。引文分析对于研究选题、研究热点、领域内研究趋势、高影响力科学家的寻找、文献回溯等十分有用。最为常见的引文分析工具就是web of science，Scopus和Google Scholar，然而这三种工具通常只对于计算期刊影响因子，某一文章的引用次数，某一作者的引用等统计比较有用。对于普通科研人员来说，特别是对于辅助了解课题内容来说就不是那么实用，一个优秀的引文分析方法可以从文献引用角度发现重要文献，探究科学知识流向。图是现实世界中探索和建模复杂系统的通用数据结构，作为实体关系交互的重要媒介，也成为当前研究的热点之一。复杂网络通常由一组节点(顶点)之间有连接(边)的图来表示，引文网络就是一种复杂网络，在其结构中，每个节点表示一篇引文，两点之间若有边存在则表示两篇引文之间存在引用或被引用的关系，若无边存在，则表示两篇引文无引用或被引用的关系。社区发现是指在网络图中寻找具有相似特征的社区结构，以了解它们的拓扑结构和属性信息，从而应用于分类、预测等任务，服务于现实社会。社区发现具有重要的现实意义，现已在许多现实网络问题中得到了广泛的研究与应用。通过对引文网络的社区结构进行探索将有利于引文分析过程，对其发现重要文献、探究科学知识流向具有重大意义，

【技术保护点】

【技术特征摘要】
1.一种基于图双重自编码器的社区发现方法，其特征在于，包括：将给定的引文网络输入图双重自编码器，得到图结构表示信息和图属性表示信息；将图结构表示信息和图属性表示信息进行融合，得到融合后的图表示信息；采用聚类方法对融合后的图表示信息进行社区划分，得到社区发现结果。2.根据权利要求1所述的基于图双重自编码器的社区发现方法，其特征在于，所述图双重自编码器包括第一编码器和第二编码器；所述第一编码器用于根据每个节点与邻居节点的注意力系数以及邻居节点的节点特征，输出每个节点融合邻域信息后的特征，得到图结构表示信息；节点为引文网络中节点；所述第二编码器用于采用随机抽样策略对引文网络中节点进行采样，得到采样集合，采用第一掩码令牌屏蔽采样集合中节点的特征，将采用第一掩码令牌屏蔽处理过后的节点和未采用第一掩码令牌屏蔽处理过后的节点进行图信息学习，得到图属性表示信息。3.根据权利要求2所述的基于图双重自编码器的社区发现方法，其特征在于，所述重构结构的图自动编码器采用图形注意力网络；所述重构特征的图自动编码器采用图神经网络。4.根据权利要求2所述的基于图双重自编码器的社区发现方法，其特征在于，所述基于图双重自编码器的社区发现方法还包括对所述图双重自编码器进行训练；对所述图双重自编码器进行训练采用的损失函数中损失包括结构重构损失、特征重构损失和聚类损失。5.根据权利要求4所述的基于图双重自编码器的社区发现方法，其特征在于，所述图双重自编码器还包括第一解码器和第二解码器，所述第一解码器为重构结构的图自动编码器的解码器，所述第二解码器为重构特征的图自动编码器的解码器；所述第一解码器用于对图结构表示信息进行内积操作，得到重构的邻接矩阵；所述第二解码器用于：采用第二掩码令牌对第一掩码令牌屏蔽处理过的节点进行重掩码；对于重掩码处理后的节点，基于重掩码处理后的节点的邻居节点，采用图神经网络为重掩码处理后的节点重建特征，得到重构的特征矩阵；所述结构重构损失表示为：其中，A
ij
表示所...

【专利技术属性】
技术研发人员：李明娇，储星，
申请(专利权)人：云南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人