一种基于Memetic算法的网络表示学习方法技术

技术编号:21091148 阅读:25 留言:0更新日期:2019-05-11 10:32
本发明专利技术公开一种基于Memetic算法的网络表示学习方法,包括:根据网络节点个数n和向量维度d随机产生实数编码个体组成初始种群P0;评价初始种群P0实数编码个体的适应度函数值;采用Memetic算法、以实数编码个体的适应度函数值为依据对初始种群P0每个实数编码个体进行迭代优化;将迭代优化后种群中适应度函数值最高的实数编码个体输出作为网络节点的表示向量集合;所述的迭代优化包括依次对初始种群P0中的实数编码个体进行交叉概率迭代优化、种群随机数的变异概率迭代优化和局部搜索迭代优化;实验结果表明,本发明专利技术能够有效的将网络结构信息,特别是社区结构信息编码到表示向量中,可用于节点分类、社区检测和可视化等任务。

【技术实现步骤摘要】
一种基于Memetic算法的网络表示学习方法
本专利技术属于社会网络计算及表示学习
,特别涉及一种基于Memetic算法的网络表示学习方法,可用于节点分类、社区检测和可视化等任务。
技术介绍
网络表示学习是将网络中每个节点嵌入到低维稠密的向量空间,从而得到网络的向量表示的一种技术。由于传统的网络表示方法,比如邻接矩阵,具有稀疏性和难以反映节点间潜在关系的缺点,所以网络表示学习技术日益受到相关专家学者们的关注。与传统的网络表示相比,通过保存网络的拓扑结构信息,将网络嵌入到低维稠密的向量空间得到的网络表示更加有意义,并且能广泛应用于基于向量输入的各种复杂网络分析模型,比如节点可视化、节点分类和社区检测等任务。现有的网络表示学习技术的一般思想是保持网络结构的拓扑性,BryanPerozzi等人提出了一种基于SkipGram模型和随机游走的网络表示学习方法DeepWalk,参见PerozziB,Al-RfouR,SkienaS,“DeepWalk:onlinelearningofsocialrepresentations,”AcmSigkddInternationalConferenceonKnowledgeDiscovery&DataMining.ACM,2014。DeepWalk利用随机游走来获得节点序列,以此当作词序列,然后利用SkipGram模型来学得网络的表示向量。AdityaGrover等人进一步扩展了DeepWalk采集节点序列的方式,通过引入两个参数使得随机游走方式具有宽度优先搜索和深度优先搜索的特性,具体参见GroverA,LeskovecJ,“node2vec:ScalableFeatureLearningforNetworks,”AcmSigkddInternationalConferenceonKnowledgeDiscovery&DataMining.ACM,2016。这些技术只关注学得的网络表示向量保持网络中节点的一阶、二阶等低阶相似度;然后利用现有的常见的机器学习方法进行网络分析任务,如支持向量机进行节点分类。但是这种方法得到网络表示没有明显的区分性,即类间距离小,这会增加后续模型分析网络的难度,并且随机游走这种线性的序列采集方式使得这些方法难以保持网络节点的非线性特征,比如网络的社区性。由于上述网络表示学习方法只考虑了低阶相似度,学得的表示向量没有明显的区分性,致使在网络分析任务上表现具有局限性。因此,研究一种使得网络表示更加具有区分性的无监督的网络表示学习方法是本
科技人员的当务之急。
技术实现思路
本专利技术的目的在于针对上述已有技术的不足,提出一种基于Memetic算法的网络表示学习方法,以增强网络表示向量的区分性,保存网络的社区结构特征,扩展网络表示学习算法的应用范围。为实现上述目的,本专利技术的技术方案包括如下:一种基于Memetic算法的网络表示学习方法,包括:步骤一:输入描述网络节点之间连接信息的邻接矩阵A,网络节点个数为n,向量维度为d;根据网络节点个数n和向量维度d随机产生实数编码个体组成初始种群P0;步骤二,评价初始种群P0实数编码个体的适应度函数值;采用Memetic算法、以实数编码个体的适应度函数值为依据对初始种群P0每个实数编码个体进行迭代优化;将迭代优化后种群中适应度函数值最高的实数编码个体输出作为网络节点的表示向量集合;所述的迭代优化包括依次对初始种群P0中的实数编码个体进行交叉概率迭代优化、种群随机数的变异概率迭代优化和局部搜索迭代优化;所述的局部搜索迭代优化包括根据邻接矩阵A获得经过交叉概率迭代优化和变异概率迭代优化后的实数编码个体对应的网络节点的中心节点,每个网络节点向中心节点靠近。可选的,所述的中心节点包括邻居中心节点和同类别中心节点;当种群迭代代数大于种群最大迭代代数的0.8倍时,既进行邻居中心节点的迭代优化又进行同类别中心节点的迭代优化;当种群迭代代数小于等于种群最大迭代代数的0.8倍时,仅进行邻居中心节点的迭代优化。可选的,所述的邻居中心节点包括获得每个网络节点的表示向量集合N和每个网络节点的邻居节点的度集合D,并对D进行归一化处理得到Dnorm;对表示向量集合N以权值Dnorm进行加权求和得到每个网络节点的邻居中心节点C;同类别中心节点:获得当前实数编码个体的聚类结果,对于一个实数编码个体的基因来说,同类别的基因用节点表示向量表示,计算同类别节点的表示向量平均值得到该类节点的中心节点向量即为同类别中心节点。可选的,所述的邻居中心节点的迭代优化为:C邻居中心节点,pbest=[pbesti](i=1,2...,n)为当前迭代过程种群中适应度值最大的个体所代表的节点表示向量集合,为经过邻居中心节点迭代优化后的节点表示向量集合;所述的同类别中心节点的迭代优化为:CΩ表示同类别中心节点,为经过同类别中心节点迭代优化后的节点表示向量;局部搜索优化参数η1和η2,η1=0.1~0.7,η2=0.03~0.1。可选的,所述的局部搜索迭代优化包括:(a)设定局部搜索优化参数η1和η2,η1=0.1~0.7,η2=0.03~0.1;初始种群P0的实数编码个体依次进行种群随机数的交叉概率迭代优化和种群随机数的变异概率迭代优化得到适应度函数值最大的实数编码个体pbest,pbest=[pbesti](i=1,2...,n);pbest中的每个基因代表的是网络中每个节点的表示向量;(b)根据邻接矩阵A从pbest中得到当前节点的所有邻居节点的表示向量集合N和当前节点的所有邻居节点的度集合D,并对D进行归一化处理得到Dnorm;对表示向量集合N以权值Dnorm进行加权求和得到当前节点的邻居中心节点C;当g>0.8·mg,g为当前种群迭代代数,mg表示最大种群迭代代数,执行步骤(c);否则,执行步骤(d);(c)对于pbestnew1中每一类节点,根据PΩbest对该类节点的表示向量取平均值得到该类节点的中心节点向量CΩ,PΩbest为pbest的聚类结果,如果节点i属于该类别,则pbest′=pbestnew2;得到更新后的最佳个体,即pbest';(d)pbest′=pbestnew1,得到更新后的最佳个体,即pbest'。可选的,包括:(1)输入描述网络节点之间连接信息的邻接矩阵A,网络节点个数为n,向量维度为d;根据网络节点个数n和向量维度d随机产生实数编码个体组成初始种群P0;第g代父代种群为Pg;g为当前种群迭代代数,mg表示最大种群迭代代数;(2)K均值聚类算法对第g代父代种群Pg中每个实数编码个体进行聚类,得到聚类结果集合PΩ;利用PΩ计算第g代父代种群Pg中每个实数编码个体的适应度函数值D,利用适应度函数值D和锦标赛选择操作对第g代父代种群更新,得到更新后的第g代父代种群Pg';根据父代种群P'g产生随机数rand1,如果rand1<pc,执行第(3)步;否则,第g代子代种群Pchildg=P'g,执行第(4)步;(3)对更新后的第g代父代种群P'g进行模拟二进制交叉操作,得到第g代子代种群Pchildg;(4)产生随机数rand2,如果rand2<pm,则对第g代子代种群Pchildg中每个实数编本文档来自技高网
...

【技术保护点】
1.一种基于Memetic算法的网络表示学习方法,其特征在于,包括:步骤一:输入描述网络节点之间连接信息的邻接矩阵A,网络节点个数为n,向量维度为d;根据网络节点个数n和向量维度d随机产生实数编码个体组成初始种群P0;步骤二,评价初始种群P0实数编码个体的适应度函数值;采用Memetic算法、以实数编码个体的适应度函数值为依据对初始种群P0每个实数编码个体进行迭代优化;将迭代优化后种群中适应度函数值最高的实数编码个体输出作为网络节点的表示向量集合;所述的迭代优化包括依次对初始种群P0中的实数编码个体进行交叉概率迭代优化、种群随机数的变异概率迭代优化和局部搜索迭代优化;所述的局部搜索迭代优化包括根据邻接矩阵A获得经过交叉概率迭代优化和变异概率迭代优化后的实数编码个体对应的网络节点的中心节点,每个网络节点向中心节点靠近。

【技术特征摘要】
1.一种基于Memetic算法的网络表示学习方法,其特征在于,包括:步骤一:输入描述网络节点之间连接信息的邻接矩阵A,网络节点个数为n,向量维度为d;根据网络节点个数n和向量维度d随机产生实数编码个体组成初始种群P0;步骤二,评价初始种群P0实数编码个体的适应度函数值;采用Memetic算法、以实数编码个体的适应度函数值为依据对初始种群P0每个实数编码个体进行迭代优化;将迭代优化后种群中适应度函数值最高的实数编码个体输出作为网络节点的表示向量集合;所述的迭代优化包括依次对初始种群P0中的实数编码个体进行交叉概率迭代优化、种群随机数的变异概率迭代优化和局部搜索迭代优化;所述的局部搜索迭代优化包括根据邻接矩阵A获得经过交叉概率迭代优化和变异概率迭代优化后的实数编码个体对应的网络节点的中心节点,每个网络节点向中心节点靠近。2.根据权利要求1所述的基于Memetic算法的网络表示学习方法,其特征在于,所述的中心节点包括邻居中心节点和同类别中心节点;当种群迭代代数大于种群最大迭代代数的0.8倍时,既进行邻居中心节点的迭代优化又进行同类别中心节点的迭代优化;当种群迭代代数小于等于种群最大迭代代数的0.8倍时,仅进行邻居中心节点的迭代优化。3.根据权利要求1所述的基于Memetic算法的网络表示学习方法,其特征在于,所述的邻居中心节点包括获得每个网络节点的表示向量集合N和每个网络节点的邻居节点的度集合D,并对D进行归一化处理得到Dnorm;对表示向量集合N以权值Dnorm进行加权求和得到每个网络节点的邻居中心节点C;同类别中心节点:获得当前实数编码个体的聚类结果,对于一个实数编码个体的基因来说,同类别的基因用节点表示向量表示,计算同类别节点的表示向量平均值得到该类节点的中心节点向量即为同类别中心节点。4.根据权利要求1所述的基于Memetic算法的网络表示学习方法,其特征在于,所述的邻居中心节点的迭代优化为:C邻居中心节点,pbest=[pbesti](i=1,2...,n)为当前迭代过程种群中适应度值最大的个体所代表的节点表示向量集合,为经过邻居中心节点迭代优化后的节点表示向量集合;所述的同类别中心节点的迭代优化为:CΩ表示同类别中心节点,为经过同类别中心节点迭代优化后的节点表示向量;局部搜索优化参数η1和η2,η1=0.1~0.7,η2=0.03~0.1。5.根据权利要求1所述的基于Memetic算法的网络表示学习方法,其特征在于,所述的局部搜索迭代优化包括:(a)设定局部搜索优化参数η1和η2,η1=0.1~0.7,η2=0.03~0.1;初始种群P0的实数编码个体依次进行种群随机数的交叉概率迭代优化和种群随机数的变异概率迭代优化得到适应度函数值最大的实数编码个体pbest,pbest=[pbesti](i=1,2...,n);pbest中的每个基因代表的是网络中每个节点的表示向量;(b)根据邻接矩阵A从pbest中得到当前节点的所有邻居节点的表示向量集合N和当前节点的所有邻居节点的度集合D,并对D进行归一化处理得到Dnorm;对表示向量集合N以权值Dnorm进行加权求和得到当前节点的邻居中心节点C;当g>0.8·mg,g为当前种群迭代代数,mg表示最大种群迭代代数,执行步骤(c);否则,执行步骤(d);(c)对于pbestnew1中每一类节点,根据PΩbest对该类节点的表示向量取平均值得到该类节点的中心节点向量CΩ,PΩbest为pbest的聚类结果,如果节点...

【专利技术属性】
技术研发人员:公茂果陈程王善峰解宇武越张明阳
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1