一种大规模网络的层级化布局方法技术

技术编号:34821383 阅读:19 留言:0更新日期:2022-09-03 20:32
本发明专利技术公开了一种大规模网络的层级化布局方法,该方法使用双曲空间的庞加莱圆盘模型展现网络中的层级信息和聚类结构,分三步实现:通过预处理增强网络的层级性质;通过节点中心性计算径坐标;通过连边关系迭代计算角坐标。本发明专利技术相对于以往的层级结构可视化方法具有更强的通用性,并且更好的展示了网络中的层级信息和聚类性质。级信息和聚类性质。级信息和聚类性质。

【技术实现步骤摘要】
一种大规模网络的层级化布局方法


[0001]本专利技术属于信息可视化领域的网络布局/嵌入技术,主要涉及对大规模网络进行合理布局,使其既能体现网络全局结构中包含的层级信息,又能保持网络的局部结构。

技术介绍

[0002]图(网络)布局算法是针对图(网络)结构的一类可视化方法,通常是按照一些特定的模型和算法,将抽象网络数据进行具象展示,它被广泛应用于社交网络、知识图谱等领域。
[0003]当前的图布局算法有很多,应用最为广泛的是力导向布局算法,如Fruchterman

Reingold方法以及Yifan Hu布局算法等。力导向布局算法借自然规则模型(弹簧或电荷力)进行节点布局,能以易理解的形式展现图的整体结构。但是对于大规模的网络,力导向布局不能很好的体现网络中的层级结构。
[0004]针对层级结构的布局也有很多算法,如双曲树算法,圆形树算法等。CN103049580B提出了用放射环对大规模层次数据进行可视化的方法。但是这些方法只适用于层次数据,实际应用中大部分网络结构有层级性,但不是树结构,因此不能直接应用这类方法。
[0005]近年来的研究表明,复杂网络背后具有双曲空间的几何结构。因此可以网络嵌入到双曲空间中。这些方法需要在双曲空间中计算梯度,具有较高的时间复杂度。同时这类算法关注解决下游任务的能力,不能很好的满足可视化布局的需要。

技术实现思路

[0006]本专利技术给出了一种针对大规模网络数据的布局方法,使得能够在保留网络局部信息时,凸显全局层级结构,从而实现大规模网络的可视化。本方法的特征是将网络嵌入到双曲空间的庞加莱圆盘中,分三步实现:网络预处理、计算节点的径坐标和计算节点的角坐标。最终用圆盘上的径坐标刻画节点在网络中的层级,角坐标体现节点的局部连边关系。
[0007]本专利技术适用于大型网络,其中表示网络的节点集合,表示网络的连边集合,表示连边的权重矩阵。
[0008]庞加莱圆盘是二维双曲空间的一种形式,它具有如下特性:(1)整个空间位于半径为1的单位圆盘上,当圆盘半径从0到1线性变化时,对应的双曲距离和双曲面积呈指数级增长;(2)共形性,欧式空间中任意两条直线映射到庞家莱圆盘上,其夹角保持不变。由于性质(1),任意大规模的网络可以嵌入到单位圆盘上,并且越处于网络中心的节点也越靠近圆盘中心;由于性质(2),网络的局部结构可以连续的映射到圆盘上。因此,庞加莱圆盘非常适宜处理大规模网络的的可视化。
[0009]本专利技术的结果将网络嵌入到庞加莱圆盘中,即每一个网络节点,将计算出其在圆盘上对应的极坐标。
[0010]本专利技术的技术方案如下:一种大规模网络的层级化布局方法,其特征是分三步将网络嵌入到双曲空间的庞加莱圆盘中:网络预处理、计算节点的径坐标和计算节点的角坐标。最终用圆盘上的径坐标刻画节点在网络中的层级,角坐标体现节点的局部连边关系。
[0011]1.网络预处理。网络预处理是为了去除网络中的冗余或次要连边,凸显层级结构,提高后续步骤的计算效率。
[0012]对于大规模网络来说,网络密度是影响嵌入效果的重要因素,网络密度越大,意味着网络中的成团结构越多,而层级结构较不显著。层级结构显著的网络往往是少量的中心节点(高层级节点)和大量的枝叶节点(低层级节点),体现为无标度特征。事实上大部分实际网络都在一定程度具有无标度特征,对于少数稠密网络,可以检查网络中的连边,保留那些对连通的两个节点都比较重要的连边,而忽略权重很小的连边。
[0013]具体的处理步骤是:(1)将无向网络转为有向带权网络, 如果是有向网络则不用处理;(2)对网络中的每个节点,获取其一阶邻居,并按连边权重降序排列;(3)对于节点和阈值,如果满足条件,则从网络中去除连边。
[0014]2. 利用节点中心性计算径坐标。节点在圆盘上的径坐标体现了节点在网络中的层级,这种层级可以由节点的中心性指标刻画。在庞加莱圆盘中,当节点离圆盘中心的距离成线性增长时,实际的双曲距离呈指数级增大,而大规模网络的度分布也通常呈现幂指数分布,因此节点的度与层级性有很好的对应关系。令度最大的节点在圆盘中心,度最小的节点在圆盘周围,根据指数变化规律,就可以推导出其他节点的径坐标。
[0015]如果直接按度计算径坐标,会使得绝大多数节点在圆盘周围,极少数节点在圆盘中间,从可视化的角度看,信息密度很不均衡。为了布局平衡,这里再引入kcore中心性计算径坐标,并与由度中心性计算的径坐标做加权,得到最终的径坐标。
[0016]使用度中心性,突出了网络中的hub节点,由于kcore的分布比度分布更加平缓,因此使用kcore中心性加强了网络中的次级hub节点,与此同时大部分普通节点在圆盘周围。因此,度和kcore加权很好的刻画了网络层级,并兼顾了布局平衡。
[0017]具体的处理步骤为:(1)计算网络各节点的度和kcore中心性,用和表示;(2)规定中度最小的节点径坐标为,度最大的节点径坐标为0,对其他节点,其由度中心性决定的径坐标,由下式解出:;(3)规定中kcore最小的节点径坐标为,kcore最大的节点径坐标为0,对其他节点,其由度中心性决定的径坐标由下式解出:;
(4)令,节点的径坐标由下式计算:。
[0018] 3.利用网络连边关系确定角坐标。节点在圆盘上的角坐标主要由网络的局部结构确定,即有连边或网络距离较小的节点在圆盘上互相靠近,没有连边或网络距离较大的节点在圆盘上互相远离。因此可以通过连边关系,将在双曲空间中坐标的计算替代为欧式空间上的角坐标计算,对于每个节点,采样其邻居节点(正样本)和非邻居节点(负样本),并调整正负样本的角坐标使正样本靠近当前节点而负样本远离当前节点,经过多轮迭代当角坐标趋于稳定时,即可认为得到了相应的角坐标。
[0019]具体处理步骤为:(1)对每个节点赋值角坐标;(2)计算节点距离矩阵,每个节点的正样本为,负样本为;(3)令学习率为,对于样本,令它与当前节点的角度差为,若为正样本,将的角坐标更新为,若为负样本,将的角坐标更新为,最后将调整为区间;(4)设是上一轮计算的角坐标值,为角度阈值。当时,迭代结束。有益效果本专利技术给出了一种大规模网络的层级化布局方法,这一方法的优点在于:一、采用了分步确定径坐标和角坐标的方法,使得径坐标和角坐标具有明确的含义:径坐标体现了节点在网络中的层级,角坐标体现了网络的局部关系;二、使用度中心性和kcore中心性共同决定节点的径坐标,既体现了网络的层级结构,又平衡了布局效果;三、利用连边关系和权重迭代计算节点的角坐标,即能反映了网络的聚类结构,也具有较高的计算效率。
附图说明
[0020]图1 是本专利技术所述方法的流程图。
[0021]图2 是网络预处理流程图。
[0022]图3 是计算节点径坐标流程图。
[0023]图4 是计算节点角坐标流程图。
[0024]图5 是概念网络示例图。
[0025]图6 是概念网络预处理后的结果。
[0026本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大规模网络的层级化布局方法,其特征在于,该布局方法利用双曲空间的庞加莱圆盘模型展示层级信息,分三个模块运行:模块一,通过预处理优化网络结构,凸显层级信息模块二,按网络节点的中心性计算节点在圆盘上的径坐标;模块三,按网络的连边关系计算节点在圆盘上的角坐标;将节点按计算的径坐标和角坐标排布在圆盘上,完成布局。2.如权利要求1所述大规模网络的层级化布局方法,其特征在于,所述模块一具体步骤如下:将无向网络转为有向带权网络;对网络中的每个节点,获取其邻居,并按权重降序排列;对于节点和阈值,如果满足条件,则从网络中去除连边。3.如权利要求1所述大规模网络的层级化布局方法,其特征在于,所述模块二具体方法和步骤如下:2
‑<...

【专利技术属性】
技术研发人员:胡乔张江
申请(专利权)人:集智学园北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1