一种阶梯接近中心度确定方法及系统技术方案

技术编号:17994775 阅读:53 留言:0更新日期:2018-05-19 11:57
本发明专利技术公开了一种阶梯接近中心度确定方法及系统,其中,方法的实现包括:构建目标数据库的数据图;将数据图中的所有节点作为剩余节点集合;计算出剩余节点集合中所有节点对间的距离,通过距离及赋权函数计算出所有节点的接近中心度;从剩余节点集合中选出接近中心度最大的节点,被选出节点的阶梯接近中心度为在当前子图中计算所得的接近中心度,然后从剩余节点集合中删除选出节点,并从数据图中删除选出节点关联的边,生成新子图;判断删除之后的剩余节点集合是否为空,若不为空,则重复以上步骤继续计算直到剩余节点集合为空,此时所有节点均计算得出自身的阶梯接近中心度。本发明专利技术所提出的阶梯接近中心度指标具有更好的局部性和抗干扰能力。

A method and system for determining the degree of step proximity centrality

The invention discloses a method and system for determining the degree of step proximity centrality, in which the realization of the method includes: constructing the data graph of the target database; taking all the nodes in the data graph as the remaining nodes; calculating the distance between all nodes in the set of the remaining nodes, and calculating all the points through the distance and the empowerment function. The node is close to centrality; the node which is closest to the center degree is selected from the set of remaining nodes. The nearest center degree of the selected node's step proximity center is the nearest center degree calculated in the current subgraph, then the nodes are deleted from the set of the remaining nodes, and the edges associated with the nodes are deleted from the data graph, and the new son is generated. Diagram; determine whether the set of remaining nodes after deletion is empty, if not empty, the above steps are repeated until the remaining node sets are empty, and all nodes calculate their own step closer to the center degree. The ladder proximity index proposed by the invention has better locality and anti-interference ability.

【技术实现步骤摘要】
一种阶梯接近中心度确定方法及系统
本专利技术属于计算机领域的图数据分析领域,更具体地,涉及一种针对于大规模数据图分析的阶梯接近中心度确定方法及系统。
技术介绍
目前,各种各样的图数据和图结构大量出现在我们的生活中,如社交网络、交通网络图、生物网络、金融网络、科研数据网络图等等。而随着社会的不断发展,这些数据图规模飞速扩展,数据规模与日俱增,因此直接对整个图结构进行分析的难度很大。近来,研究人员提出了许多在大规模图中检测评估社团与中心性度量方法。通过检测图中关键元素以及依据节点的重要性对图中节点进行排序,有利于跟踪到有重要意义的候选节点。这些方法为各领域的研究人员理解真实系统的构成、功能及动态演化进程提供了强有力的工具。然而,大规模数据图结构的千差万别决定了中心性度量本身是一个非常困难的问题,因此如何评估与检测图中节点的中心性,提出更加准确的度量指标和计算算法并对检测出的模块与中心性节点进行功能解释仍是当前极具挑战性的工作。目前已经设计出了多种经典节点中心度指标和计算方法,并且在大规模图数据分析中展示了它们的应用。但由于大多数数据图具有小世界特性,全局地去计算得出的中心性指标往往会受到本文档来自技高网...
一种阶梯接近中心度确定方法及系统

【技术保护点】
一种阶梯接近中心度确定方法,其特征在于,包括:(1)以目标数据库中所有的数据单元为节点、以所述数据单元之间的关联关系为边、以所述数据单元之间关联的强度为权重建立数据图G(V,E)或G(V,E,W),其中,边集E表示所述数据图中所有边的集合,点集V表示所述数据图中所有节点的集合,权重集W表示边集E中每条边的权重;(2)初始化当前子图级数l=0,当前剩余节点集V′l=V,当前剩余边集E′l=E,通过V′l和E′l构建生成子图Gl(V′l,E′l)或Gl(V′l,E′l,W′l),其中,W′l表示E′l中边的权重集;(3)在所述生成子图Gl中计算得到所述当前剩余节点集V′l中各节点对之间的距离dl(...

【技术特征摘要】
1.一种阶梯接近中心度确定方法,其特征在于,包括:(1)以目标数据库中所有的数据单元为节点、以所述数据单元之间的关联关系为边、以所述数据单元之间关联的强度为权重建立数据图G(V,E)或G(V,E,W),其中,边集E表示所述数据图中所有边的集合,点集V表示所述数据图中所有节点的集合,权重集W表示边集E中每条边的权重;(2)初始化当前子图级数l=0,当前剩余节点集V′l=V,当前剩余边集E′l=E,通过V′l和E′l构建生成子图Gl(V′l,E′l)或Gl(V′l,E′l,W′l),其中,W′l表示E′l中边的权重集;(3)在所述生成子图Gl中计算得到所述当前剩余节点集V′l中各节点对之间的距离dl(u,v);(4)根据赋权函数和计算得到的各节点对之间的距离dl(u,v),在所述生成子图Gl中计算得到所述当前剩余节点集V′l中各节点的接近中心度;(5)找出所述当前剩余节点集V′l中接近中心度最大的节点集Vl*;(6)从所述当前剩余节点集V′l中将包含在所述节点集Vl*中的节点删除,得到下一级的剩余节点集V′l+1;(7)判断所述下一级的剩余节点集V′l+1是否为空,如不为空,则执行步骤(8),否则,执行步骤(9);(8)从所述当前剩余边集E′l中将包含在边集El*中的边删除,得到下一级的剩余边集E′l+1,然后通过所述下一级的剩余节点集V′l+1和所述下一级的剩余边集E′l+1构建新的生成子图Gl+1,在所述新的生成子图Gl+1中,计算得到所述下一级的剩余节点集V′l+1中各节点对之间的距离dl+1(u,v),此时子图级数l=l+1,并返回执行步骤(4),其中,表示所述生成子图Gl中Vl*的邻边;(9)得到数据图G中所有节点的阶梯接近中心度。2.根据权利要求1所述的方法,其特征在于,在步骤(3)中,若所述生成子图Gl为有权图Gl(V′l,E′l,W′l),则采用迪杰斯特拉算法计算出所述当前剩余节点集V′l中各节点对之间的距离dl(u,v),若所述生成子图Gl为无权图Gl(V′l,E′l),则采用宽度优先搜索算法BFS分别构建出以所述生成子图Gl中各节点为根节点的BFS生成树,用于计算和维护各节点对之间的距离dl(u,v)。3.根据权利要求1所述的方法,其特征在于,在步骤(4)中,根据赋权函数和计算得到的各节点对之间的距离dl(u,v),在所述生成子图Gl中计算得到所述当前剩余节点集V′l中各节点v的接近中心度为:其中,α(dl(u,v))表示赋权函数,Cc(v)表示节点v的接近中心度,u表示所述当前剩余节点集V′l中除去节点v后剩余的节点。4.根据权利要求1至3任意一项所述的方法,其特征在于,步骤(8)具体包括:(8.1)从所述当前剩余边集E′l中将包含在边集中的边删除,得到下一级的剩余边集E′l+1;然后通过所述下一级的剩余节点集V′l+1和所述下一级的剩余边集E′l+1构建新的生成子图Gl+1;(8.2)若所述新的生成子图Gl+1为有权图,则采用迪杰斯特拉算法重新计算所述下一级的剩余节点集V′l+1中各节点对之间的距离;(8.3)若所述新的生成子图Gl+1为无权图,则采用通过对步骤(3)中计算得到的BFS生成树结构的增量更新的方式来维护所述下一级的剩余节点集V′l+1中各节点对之间的距离。5.根据权利要求4所述的方法,其特征在于,步骤(8.3)具体包括:(8.3.1)找出以所述下一级的剩余节点集V′l+1中的任一节点v0为根节点的目标BFS生成树,设所述目标BFS生成树的根节点为节点r,将节点r加入待修改队列,创建指针a指向于所述待修改队列的头节点;(8.3.2)将指针a所指向节点的子节点x插入所述待修改队列的对尾,若所插入的子节点x属于Vl*,则将子节点x在所述目标BFS生成树结构中的所有兄弟节点加入到锚点队列中,创建指针b指向于所述锚点队列的头节点s,同时将子节点x的子节点都加入到崩落链表中,并删除指针a所指向节点与子节点x的连接;(8.3.3)查找在所述生成子图Gl上,指针b所指向节点s与所述崩落链表中任一节点t之间是否存在一条边连接节点s与节点t,若存在,则执行步骤(8.3.4),若不存在,则执行步骤(8.3.6);(8.3.4)在节点s创建一个指向于节点t的指针,然后从所述崩落链表中删除节点t;(8.3.5)判断进行删除操作之后的崩落链表是否为空,若不为空,则执行步骤(8.3.6),若为空,则执行步骤(8.3.9);(8.3.6)判断指针b所指向节点是否存在子节点,若存在,则将指针b所指向节点的子节点插入所述锚点队列的队尾;(8.3.7)判断指针b所指向节点是否还存在后继节点,若存在,则执行步骤(8.3.8),若不存在,则执行步骤(8.3.9);(8.3.8)将指针b指向当前所指向节点的后继节点,返回执行步骤(8.3.3);(8.3.9)判断指针a所指向节点是否存在子节点,若存在,则将指针a所指向节点的子节点插入所述待修改队列的队尾;(8.3.10)判断指针a所指向节点是否还存在后继节点,若存在,则执行步骤(8.3.11),若不存在,则执行步骤(8.3.12);(8.3.11)将指针a指向当前所指向节点的后继节点,返回执行步骤(8.3.2);(8.3.12)完成对所述目标BFS生成树的增量更新,并完成对于以所述下一级的剩余节点集V′l+1中除v0外的其它节点为根节点的BFS生成树的增量更新,以完成对于所述新的生成子图Gl+1中的各节点对间距离的更新。6.一种阶梯接近中心度确定系统,其特征在于,包括:数据图构建模块,用于以目标数据库中所有的数据单元为节点、以所述数据单元之间的关联关系为边、以所述数据单元之间关联的强度为权重建立数据图G(V,E...

【专利技术属性】
技术研发人员:金海钱辰于东晓谢夏王娜
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1