一种基于图卷积网络的图可视化方法技术

技术编号：21115863 阅读：35 留言：0更新日期：2019-05-16 09:01

本发明专利技术公开了一种基于图卷积网络的图可视化方法，其步骤包括：1)对于目标领域的网络G＝(V，E)，将网络G中的节点嵌入到一个低维欧式空间中，得到网络G的低维嵌入向量；所述低维嵌入向量包含网络G中节点的特征信息和网络G的拓扑结构信息；其中，V是节点集合，E是边集合；2)将所述低维嵌入向量构造成一张K近邻图，即KNN图；3)基于概率模型将所述KNN图在二维空间中绘制出来。本发明专利技术学习到的嵌入向量同时保留了节点的结构信息和特征信息，可以对可视化结果进行粒度化调整。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图卷积网络的图可视化方法
本专利技术属于网络嵌入-网络可视化
，涉及一种基于图卷积网络的图可视化方法。
技术介绍
随着大数据时代的到来，全球信息数据量呈爆炸式增长。网络成为表达数据之间复杂关系的重要形式，在信息世界中无处不在。Facebook、微信等社交媒体构成了社交网络；生物中的蛋白质构成了高分子网络；各类通讯媒介构成了通信网络；智能硬件之间构成了物联网等等。很多网络的节点除了互相连接以外，还附加有丰富的文本、图像、音视频等多媒体信息，形成了典型的复杂信息网络。通过对复杂网络进行表示并进行可视化绘制，可以宏观分析网络的数据分布情况，包括聚类、分类等，为后续网络分析任务提供技术支撑。如果要可视化网络首先需要对网络进行表示，包括节点的拓扑结构信息和特征信息。传统的网络表示方案是通过建立邻接矩阵表示网络结构，假设网络G＝(V,E)，其中V是节点集合，E是边集合，网络的邻接矩阵定义为A∈|V|×|V|,其中Aij＝1如果(vi,vj)∈E,否则Aij＝0的。随着网路规模不断扩大，邻接矩阵占用大量的存储空间，而且其中的大部分元素都是0，面临严重的稀疏性问题。近些年来，随着以深度学习为代表的特征学习技术在自然语言处理领域的广泛应用，研究者开始探索面向网络的特征表示方案，即类似于自然语言处理中的词向量嵌入技术(word2vec,参考MikolovT,ChenK,CorradoG,etal.Efficientestimationofwordrepresentationsinvectorspace[J].arXivpreprintarXiv:1301.378...

【技术保护点】
1.一种基于图卷积网络的图可视化方法，其步骤包括：1)对于目标领域的网络G＝(V,E)，将网络G中的节点嵌入到一个低维欧式空间中，得到网络G的低维嵌入向量；所述低维嵌入向量包含网络G中节点的特征信息和网络G的拓扑结构信息；其中，V是节点集合，E是边集合；2)将所述低维嵌入向量构造成一张K近邻图，即KNN图；3)基于概率模型将所述KNN图在二维空间中绘制出来。

【技术特征摘要】
1.一种基于图卷积网络的图可视化方法，其步骤包括：1)对于目标领域的网络G＝(V,E)，将网络G中的节点嵌入到一个低维欧式空间中，得到网络G的低维嵌入向量；所述低维嵌入向量包含网络G中节点的特征信息和网络G的拓扑结构信息；其中，V是节点集合，E是边集合；2)将所述低维嵌入向量构造成一张K近邻图，即KNN图；3)基于概率模型将所述KNN图在二维空间中绘制出来。2.如权利要求1所述的方法，其特征在于，设置一粒度参数，基于PageRank算法计算每个所述节点的重要性评分，所述粒度参数的不同取值分别对应不同的节点重要性评分；当调整粒度参数大小时展示对应不同重要程度的节点。3.如权利要求2所述的方法，其特征在于，根据PageRank网页排序算法计算每个节点的重要性评分。4.如权利要求1所述的方法，其特征在于，节点vi的重要性评分其中，是所有对vi有出链的节点集合，L(vj)是节点vj的出链数目，N是节点总数，α为一设定系数，0<α<1。5.如权利要求1所述的方法，其特征在于，将网络G中的节点嵌入到一个低维欧式空间中，得到网络G的低维嵌入向量的方法为：1)设置一参数k代表神经网络的卷积层数或者搜索深度、代表在神经网络第k层时节点v的向量表示,v∈V；在k＝0，将网络G中节点v的特征向量赋值给2)在神经网络的后续每一层卷积层都重复如下步骤：首先对于每个节点v∈V，将v的邻接节点的上一层向量的表示汇聚成一个单独的向量其中，N(v)表示对节点v的邻接节点的采样，然后将节点v的上一层的向量表示与邻域节点聚合成的向量拼接在一起，得到向量3)将向量传递给一个全连接层进行计算其中，Wk为...

【专利技术属性】
技术研发人员：朱梓豪，周川，曹亚男，张鹏，刘萍，郭莉，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人