面向图的顶点数据规则存储结构和连接拓扑压缩方法技术

技术编号:26791246 阅读:32 留言:0更新日期:2020-12-22 17:06
本发明专利技术公开了一种面向图的顶点数据规则存储结构和连接拓扑压缩方法,包括步骤:1)将图中的所有顶点序号重新编码;2)在将图中所有顶点重排序之后,按照顶点序号由小到大依次以<顶点特征值、度及其游程编码个数>作为一个数据单元,规则的存储到顶点特征值存储器中;3)从序号最小的顶点开始,将每个顶点所连接的边的特征值按照目标顶点升序的顺序,将每对顶点所对应的边特征值依次存储到边特征值存储器中;4)基于重新排序后的图,得到图的邻接矩阵,对每个顶点的邻接向量进行游程编码,将每个顶点的游程编码依次存储到边存储器中;5)在访问顶点特征值过程中,由顶点编号访问该顶点的信息。相比于现有技术,本发明专利技术大大节省了存储空间。

【技术实现步骤摘要】
面向图的顶点数据规则存储结构和连接拓扑压缩方法
本专利技术涉及一种大型图联合存储顶点和边的压缩方法,具体涉及一种面向图的顶点数据规则存储结构和连接拓扑压缩方法。
技术介绍
图作为最经典、最常用的数据结构之一,现实世界中很多数据可以被抽象成多种多样的图结构的数据。图中的顶点可以代表不同的实体,图中的边可以代表不同实体之间的关系。常见的有网页链接图,社交关系图,基因分析图等。此外,图数据规模的增长非常迅速,如在2017年,Twitter公司每天的推文量上升至5×1010,随着机器学习和数据挖掘应用的日益广泛,图的规模也变的越来越大。另一方面,由于大规模的图数据表现出极度的不规则性,导致在传统的MapReduce和Hadoop系统上进行计算的过程中产生大量数据通信,进而造成计算效率低下的问题。如何有效的进行大规模图数据的处理与分析是目前学术界与工业界的一大研究热点,为了有效的应对上述挑战,很多图计算系统被提出来进行高效的图数据处理。GraphChi方法中,源顶点和目标顶点是随机分布存储的,当由源顶点特征值更新目标顶点特征值时,将造成对目标顶点本文档来自技高网...

【技术保护点】
1.面向图的顶点数据规则存储结构和连接拓扑压缩方法,其特征在于,包括以下步骤:/n1)将图中的所有顶点序号重新编码;/n2)在将图中所有顶点重排序之后,按照顶点序号由小到大依次以<顶点特征值、度及其游程编码个数>作为一个数据单元,规则的存储到顶点特征值存储器中;/n3)在将图中所有顶点重排序之后,从序号最小的顶点开始,将每个顶点所连接的边的特征值按照目标顶点升序的顺序,将每对顶点所对应的边特征值依次存储到边特征值存储器中;/n4)基于重新排序后的图,得到图的邻接矩阵,对每个顶点的邻接向量进行游程编码,将每个顶点的游程编码依次存储到边存储器中;/n5)在访问顶点特征值过程中,由于顶点...

【技术特征摘要】
1.面向图的顶点数据规则存储结构和连接拓扑压缩方法,其特征在于,包括以下步骤:
1)将图中的所有顶点序号重新编码;
2)在将图中所有顶点重排序之后,按照顶点序号由小到大依次以<顶点特征值、度及其游程编码个数>作为一个数据单元,规则的存储到顶点特征值存储器中;
3)在将图中所有顶点重排序之后,从序号最小的顶点开始,将每个顶点所连接的边的特征值按照目标顶点升序的顺序,将每对顶点所对应的边特征值依次存储到边特征值存储器中;
4)基于重新排序后的图,得到图的邻接矩阵,对每个顶点的邻接向量进行游程编码,将每个顶点的游程编码依次存储到边存储器中;
5)在访问顶点特征值过程中,由于顶点特征值所在的地址与顶点序号是一一线性对应的,因此由顶点编号访问该顶点的信息;在访问边特征值过程中,由度计数器记录边特征值的访问情况;在访问拓扑信息时,由游程编码计数器记录边的访问情况。


2.根据权利要求1所述的面向图的顶点数据规则存储结构和连接拓扑压缩方法,其特征在于,步骤1)的具体实现方法如下:
101)首先,找到整个图中邻接顶点最多的顶点Vm,对其邻接顶点依次进行顺序编号;
102)接下来再查找顶点Vm相邻顶点中邻接顶点比较多的顶点Vn,若Vn的某个邻接顶点已被编码,则该邻接顶点编码保持不变,对Vn剩下的邻接顶点依次排序编号;
103)重复迭代上述过程,直到所有的顶点都被编号。


3.根据权利要求1所述的面向图的顶点数据规则存储结构和连接拓扑压缩方法,其特征在于,步骤2)的具体实现方法如下:
201)在将图中所有顶点重排序之后,将顶点特征值、顶点的度、...

【专利技术属性】
技术研发人员:杨晨耿龙飞梅魁志耿莉
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1