一种适用于网络节点分类方法评估的仿真网络生成方法技术

技术编号:14835348 阅读:50 留言:0更新日期:2017-03-17 03:23
本发明专利技术公开了一种适用于网络节点分类方法评估的仿真网络生成方法,该方法包括:首先,根据指定的拓扑结构参数,如节点数量、边的数量、最大度、平均度分布、小世界以及社区结构等,生成接近于真实网络的初步仿真网络结构;其次,根据指定的标签特征生成网络中每个节点的标签,进而得到一个适合评估网络节点分类器的带有标签的仿真网络。本发明专利技术不仅能够生成接近真实网络的拓扑结构,并且考虑了节点的标签信息,使得生成的仿真网络更利于全面地评估节点分类方法,本发明专利技术在生成网络的过程中将拓扑结构和标签生成过程分开,可以有效地保证参数影响的独立化,能够更加准确的评估分类方法对于不同属性的依赖程度。

【技术实现步骤摘要】

本专利技术涉及一种仿真网络生成方法。
技术介绍
作为网络科学的重要研究领域之一,网络节点分类技术已经得到了广泛关注,并且在身份识别、反恐、信息推荐等领域有着重要的应用价值。网络节点分类技术是指:利用网络中一部分已知节点的类别去预测其余未知节点的类别。传统分类技术通常假设数据之间是独立同分布的,然而网络数据之间往往存在较强的关联,这使得节点的类别不仅与自身的属性相关,还与邻居节点、拓扑结构等网络属性有着密切的联系。节点分类方法可以利用上述特征来提高分类性能。例如,当认为网络中同质性较强的时候(即节点倾向于和自身类别相似的节点连接),利用邻居节点加权投票的方法就能够获得更为满意的结果。不同的分类方法依赖的网络属性有所不同,因此,为了评价一种分类方法的适用领域,往往需要在具有不同特征的网络上进行对比分析。然而,在当前阶段,适用于网络分类评估的真实网络还相对较少,其网络特征也较为单一,无法充分评估分类方法的性能,这也使得生成具有不同网络特征的仿真网络成为评价分类方法性能的重要手段。传统的网络生成方法关注拓扑结构的生成,其核心思想是生成与真实网络拓扑结构(小世界、无标度)更为相近的仿真网络。然而,由于生成的网络并没有标签信息,往往无法直接使用这些网络对节点分类方法进行评估。此外,也有学者尝试根据同质性等指标,生成带有标签的仿真网络。然而,这些带有标签的生成方法对于拓扑结构的约束较少,使得其生成的网络拓扑结构与真实的网络差距较大(例如,并不带有典型的社区结构等),导致这类方法生成的网络也不适合对分类方法进行评估。
技术实现思路
针对上述现有技术中存在的技术问题,本专利技术提供一种新颖的仿真网络生成方法,用来准确地评估节点分类方法对不同网络属性(同质性、节点分布比例、网络的社区结构、网络的密度等)的敏感程度。近些年来,网络科学的研究进展很快,已经发现复杂网络有着一些不同以往的特征(例如小世界、幂律分布、同质性等)。因此,现有的节点分类方法不只关注于节点自身的属性,也在利用不同的网络特征来辅助分类过程。然而,分类方法的建模角度有所差别,使得其受到网络特征的影响程度也有所不同。总体来看,对于节点分类有影响的网络特征主要有以下两类:(1)拓扑特征:我们关注的问题是复杂网络中的节点分类问题,而不同的网络有着不同的拓扑特征,例如密度(density)、直径、度分布、聚类系数等,这些特征都是网络生成过程中表现出的一些特有规律,其对于分类方法的影响程度也有所不同,例如,已经知道网络的密度对于协同分类有着较大的影响;(2)标签特征:网络中节点之间并不是互相独立的,而是彼此相连,这使得节点的类别不仅与自身的属性相关,在很大程度上还依赖于邻居节点的标签,因此,网络中节点的标签表现出来的分布规律,我们称之为网络的标签特征,也在很大程度上影响着分类方法的表现。为了更好地分析不同网络特征对分类方法的影响,本专利技术提出一种仿真网络生成方法,来生成具有不同网络特征的仿真网络。该方法包括:首先,根据指定的拓扑结构参数,如节点数量、边的数量、最大度、平均度分布、小世界以及社区结构等,生成接近于真实网络的初步仿真网络结构;其次,根据指定的标签特征,如标签分布比例和同质性等,生成网络中每个节点的标签,进而得到一个适合评估网络节点分类器的带有标签的仿真网络。进一步地,在评估分类方法性能的时候,根据已知标签的节点所占的比例的设定,随机设定相应数量的节点标签为已知,得到一个待预测的仿真网络,此时,得到的待预测的仿真网络就可以用来评估一种分类方法在指定特征下的表现,分类方法根据当前网络的拓扑结构和已知节点来预测未知节点的标签。本专利技术的有益效果在于:1.相对于传统的网络生成方法,本专利技术不仅能够生成接近真实网络的拓扑结构,并且考虑了节点的标签信息,使得生成的仿真网络更利于全面地评估节点分类方法。2.本专利技术在生成网络的过程中将拓扑结构和标签生成过程分开,可以有效地保证参数影响的独立化,能够更加准确的评估分类方法对于不同属性的依赖程度。附图说明图1是本专利技术方法的预测框架图。图2是本专利技术仿真网络的生成过程示例。具体实施方式如图1所示,本专利技术的一种适用于网络节点分类方法评估的仿真网络生成方法中,首先要保证生成的网络拓扑结构更加接近真实网络,这样才能更好地评估分类方法在真实世界中的表现。因此,本方法中,对于给定网络拓扑结构参数集合T={n,d,c,…本文档来自技高网...
一种适用于网络节点分类方法评估的仿真网络生成方法

【技术保护点】
一种适用于网络节点分类方法评估的仿真网络生成方法,其特征在于:首先,根据指定的拓扑结构参数,如节点数量、边的数量、最大度、平均度分布、小世界以及社区结构等,生成接近于真实网络的初步仿真网络的拓扑结构;其次,根据指定的标签特征生成网络中每个节点的标签,进而得到一个适合评估网络节点分类器的带有标签的仿真网络。

【技术特征摘要】
1.一种适用于网络节点分类方法评估的仿真网络生成方法,其特征在于:首先,根据指定的拓扑结构参数,如节点数量、边的数量、最大度、平均度分布、小世界以及社区结构等,生成接近于真实网络的初步仿真网络的拓扑结构;其次,根据指定的标签特征生成网络中每个节点的标签,进而得到一个适合评估网络节点分类器的带有标签的仿真网络。2.如权利要求1所述的一种适用于网络节点分类方法评估的仿真网络生成方法,其特征在...

【专利技术属性】
技术研发人员:李乐许珺怡赵翔葛斌胡升泽肖卫东童海明
申请(专利权)人:中国人民解放军国防科学技术大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1