一种基于生成对抗网络模型的多层学术网络社区发现方法、系统技术方案

技术编号：24331897 阅读：43 留言：0更新日期：2020-05-29 20:01

本发明专利技术实现了一套基于生成对抗网络模型的多层学术网络社区发现方法及其系统，基于GAN模型学习多层网络的嵌入表示，通过构建多层学术网络；使用生成对抗模型学习节点嵌入表示：生成器生成层内节点对和层间节点对作为伪样本，判别器判别数据是否为真实数据分布；生成器和判别器迭代更新进行对抗学习；使用基于K‑means聚类的方法发现社团的步骤，实现对于网络来源的学者信息的处理，发现其中多层网络结构所能提供的关系网络的深层信息，并使其算法和系统更具有鲁棒性。

A multi-layer academic network community discovery method and system based on generative adversary network model

全部详细技术资料下载

【技术实现步骤摘要】
一种基于生成对抗网络模型的多层学术网络社区发现方法、系统
本专利技术涉及人工智能领域，尤其涉及一种基于生成对抗网络模型的多层学术网络社区发现方法和系统。
技术介绍
随着科学研究多样化的发展，学术合作逐渐向跨地区、跨学校、跨研究领域的方向发展，科研合作的广泛性和复杂性也使得学术团队的数量和规模日益增大。对学术团队的研究能够发现各学科人才之间的合作趋势，也可以为具体课堂或项目的实施提供人才支持。学者之间通过各种关系(例如合著关系、引用关系、同事关系等)构成一个庞大且复杂的网络，因此可通过对多层网络的社区发现来发掘不同关系和不同规模的学术团队。学术团队的研究可以抽象为社团，而社团是网络的基本结构性质之一，社团之间的连接稠密，社团外的连接相对稀疏。社团发现算法就是研究网络具有的社团结构。目前主流的社团划分算法包括基于模块度的、基于标签传播的、基于聚类思想等方法。随着多层网络的研究发展，出现了很多多层网络社团发现算法，如基于多层粒子群的社团发现算法、多层网络局部社团发现算法、基于比较节点度之间的关系发现局部社团结构等。其中，基于聚类的算法通过数据点之间的相似度来发掘社团，通过控制聚类算法的参数，可以获得不同规模的社团，因此在本专利技术中，采用基于聚类的方法，以发现不同规模的学术团队。近年来，多层网络嵌入方法(MultilayerNetworkEmbedding，MNE)因其相比传统的编码表示更简洁的表示形式和综合性能，已经吸引了大量的关注。它已被应用于图结构数据挖掘的下游任务，比如节点分类、连接预测、社...

【技术保护点】
1.一种基于生成对抗网络模型的多层学术网络社区发现方法，其特征在于：所述方法包括三个步骤：/n步骤一：构建多层学术网络，通过外部数据库输入获取学者信息数据，建立新的数据库，并根据所述学者信息数据构建关系数据库，形成多层网络，其中所述多层网络包括：论文引用关系网络、论文合作关系网络、专利合作关系网络、项目合作关系网络、自然基金关系合作网络、同事关系网络、校友关系网络；/n步骤二：使用生成对抗模型学习节点嵌入表示：生成器生成层内节点对和层间节点对作为伪样本，对于给定节点和关系，生成器的目标是生成一个伪节点，使得在关系下节点和伪结点相连，使用多层感知机来增强伪节点的表达；/n判别器判别数据是否为真实数据分布，判别器需要判断给定关系下的节点对是否为真实节点对，输出在特定所述关系下对节点对连接的概率，所述判别器的损失函数通过：节点通过层内关系、层间关系相连、给定节点和层内、层间关系生成伪节点、节点通过错误的层内、层间关系相连六种函数关系构成；/n生成器和判别器迭代更新进行对抗学习，模型使用预训练的嵌入表示模型对生成器和判别器的节点嵌入表示进行初始化，层内关系矩阵和层间依赖矩阵采用的初始化方式是随...

【技术特征摘要】
1.一种基于生成对抗网络模型的多层学术网络社区发现方法，其特征在于：所述方法包括三个步骤：
步骤一：构建多层学术网络，通过外部数据库输入获取学者信息数据，建立新的数据库，并根据所述学者信息数据构建关系数据库，形成多层网络，其中所述多层网络包括：论文引用关系网络、论文合作关系网络、专利合作关系网络、项目合作关系网络、自然基金关系合作网络、同事关系网络、校友关系网络；
步骤二：使用生成对抗模型学习节点嵌入表示：生成器生成层内节点对和层间节点对作为伪样本，对于给定节点和关系，生成器的目标是生成一个伪节点，使得在关系下节点和伪结点相连，使用多层感知机来增强伪节点的表达；
判别器判别数据是否为真实数据分布，判别器需要判断给定关系下的节点对是否为真实节点对，输出在特定所述关系下对节点对连接的概率，所述判别器的损失函数通过：节点通过层内关系、层间关系相连、给定节点和层内、层间关系生成伪节点、节点通过错误的层内、层间关系相连六种函数关系构成；
生成器和判别器迭代更新进行对抗学习，模型使用预训练的嵌入表示模型对生成器和判别器的节点嵌入表示进行初始化，层内关系矩阵和层间依赖矩阵采用的初始化方式是随机初始化，使用迭代优化策略来训练对抗网络，在每次迭代中，交替训练生成器和判别器，首先，固定生成器参数，生成伪节点来优化判别器参数，提高判别器的性能，接下来，固定判别器参数，优化生成器参数来生成更难被判别器分辨的伪节点，重复上述过程，直到模型收敛。
步骤三：使用基于K-means聚类的方法发现社团为：随机选择多个不同的节点作为同样数目的社团的初始聚类中心，重复下列过程：使用余弦相似度计算其他节点与社团中心的节点之间的相似性，将节点归于相似度最大的聚类中心所属的社团，对于每个社团，重新计算聚类中心；重复上...

【专利技术属性】
技术研发人员：李建欣，孙庆赟，傅星珵，朱时杰，季诚，董翔宇，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人