【技术实现步骤摘要】
基于图双重自编码器的社区发现方法、系统、设备及介质
[0001]本专利技术涉及社区发现
,特别是涉及一种基于图双重自编码器的社区发现方法、系统、设备及介质。
技术介绍
[0002]引文分析是指对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析以揭示其数量特征和内在规律。引文分析对于研究选题、研究热点、领域内研究趋势、高影响力科学家的寻找、文献回溯等十分有用。最为常见的引文分析工具就是web of science,Scopus和Google Scholar,然而这三种工具通常只对于计算期刊影响因子,某一文章的引用次数,某一作者的引用等统计比较有用。对于普通科研人员来说,特别是对于辅助了解课题内容来说就不是那么实用,一个优秀的引文分析方法可以从文献引用角度发现重要文献,探究科学知识流向。图是现实世界中探索和建模复杂系统的通用数据结构,作为实体关系交互的重要媒介,也成为当前研究的热点之一。复杂网络通常由一组节点(顶点)之间有连接(边)的图来表示,引文网络就是一种复杂网络,在其结构中,每个节点表示一篇引文,两点之间若有 ...
【技术保护点】
【技术特征摘要】
1.一种基于图双重自编码器的社区发现方法,其特征在于,包括:将给定的引文网络输入图双重自编码器,得到图结构表示信息和图属性表示信息;将图结构表示信息和图属性表示信息进行融合,得到融合后的图表示信息;采用聚类方法对融合后的图表示信息进行社区划分,得到社区发现结果。2.根据权利要求1所述的基于图双重自编码器的社区发现方法,其特征在于,所述图双重自编码器包括第一编码器和第二编码器;所述第一编码器用于根据每个节点与邻居节点的注意力系数以及邻居节点的节点特征,输出每个节点融合邻域信息后的特征,得到图结构表示信息;节点为引文网络中节点;所述第二编码器用于采用随机抽样策略对引文网络中节点进行采样,得到采样集合,采用第一掩码令牌屏蔽采样集合中节点的特征,将采用第一掩码令牌屏蔽处理过后的节点和未采用第一掩码令牌屏蔽处理过后的节点进行图信息学习,得到图属性表示信息。3.根据权利要求2所述的基于图双重自编码器的社区发现方法,其特征在于,所述重构结构的图自动编码器采用图形注意力网络;所述重构特征的图自动编码器采用图神经网络。4.根据权利要求2所述的基于图双重自编码器的社区发现方法,其特征在于,所述基于图双重自编码器的社区发现方法还包括对所述图双重自编码器进行训练;对所述图双重自编码器进行训练采用的损失函数中损失包括结构重构损失、特征重构损失和聚类损失。5.根据权利要求4所述的基于图双重自编码器的社区发现方法,其特征在于,所述图双重自编码器还包括第一解码器和第二解码器,所述第一解码器为重构结构的图自动编码器的解码器,所述第二解码器为重构特征的图自动编码器的解码器;所述第一解码器用于对图结构表示信息进行内积操作,得到重构的邻接矩阵;所述第二解码器用于:采用第二掩码令牌对第一掩码令牌屏蔽处理过的节点进行重掩码;对于重掩码处理后的节点,基于重掩码处理后的节点的邻居节点,采用图神经网络为重掩码处理后的节点重建特征,得到重构的特征矩阵;所述结构重构损失表示为:其中,A
ij
表示所...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。