一种基于顶点影响力的图数据布局方法技术

技术编号:19821912 阅读:31 留言:0更新日期:2018-12-19 14:45
本发明专利技术公开了一种基于顶点影响力的图数据布局方法,包括:根据图数据得到压缩稀疏行结构和顶点度文件,利用压缩稀疏行结构和顶点度文件得到顶点影响力数组;利用压缩稀疏行结构获取顶点影响力数组中顶点的邻居列表,将顶点的邻居列表依次加入顶点重映射数组,得到最优顶点重映射数组。本发明专利技术布局方法根据自然图结构特性,研究了图算法运行过程中的收敛特性,提出了顶点影响力这一概念,将顶点的度作为顶点的影响力,将顶点按照其影响力降序排列,然后依次重映射其邻居节点,使图数据分布呈现局部有序性,减少图计算过程中由于结构依赖性导致的内存随机访问开销,缩短迭代式图应用执行时间。

【技术实现步骤摘要】
一种基于顶点影响力的图数据布局方法
本专利技术属于图计算的预处理
,更具体地,涉及一种基于顶点影响力的图数据布局方法。
技术介绍
近年来,随着移动互联网、物联网、云计算等迅猛发展,生活中无处不在的移动设备、无线传感器、RFID时时刻刻都在产生数据,其中大量的数据为非结构化数据,规模大、无规律,难以用传统的方法来处理,以图的模式对这些复杂数据进行建模分析变得越来越流行。然而,图计算具有高关联性、低局部性的特点,致使图算法运行过程中存在大量内存随机访问,内存带宽成为限制图计算系统性能的瓶颈。有研究表明(见论文,Speedupgraphprocessingbygraphordering),图计算过程中由于高速缓存数据缺失造成的CPU停顿达整个应用执行时间的70%,因此减少图计算过程中内存随机访问显得尤为重要。进一步分析可以发现,尽管图算法多种多样,但是不同图算法在运行过程中,当需要对某个活跃顶点执行更新操作时,都需要访问与其相关联的邻居节点。而在当前众多的图计算系统中,通过对原始图数据预处理过后,内存中的图数据组织并未体现出图的结构特性,导致顶点更新所需要的邻居节点状态值零散分布在内本文档来自技高网...

【技术保护点】
1.一种基于顶点影响力的图数据布局方法,其特征在于,包括:(1)根据图数据得到压缩稀疏行结构和顶点度文件,利用压缩稀疏行结构和顶点度文件得到顶点影响力数组;(2)利用压缩稀疏行结构获取顶点影响力数组中顶点的邻居列表,将顶点的邻居列表依次加入顶点重映射数组,得到最优顶点重映射数组。

【技术特征摘要】
1.一种基于顶点影响力的图数据布局方法,其特征在于,包括:(1)根据图数据得到压缩稀疏行结构和顶点度文件,利用压缩稀疏行结构和顶点度文件得到顶点影响力数组;(2)利用压缩稀疏行结构获取顶点影响力数组中顶点的邻居列表,将顶点的邻居列表依次加入顶点重映射数组,得到最优顶点重映射数组。2.如权利要求1所述的一种基于顶点影响力的图数据布局方法,其特征在于,所述步骤(1)包括:(1-1)利用压缩稀疏行结构,采用图社区检测算法将图数据划分为多个社区;(1-2)利用顶点度文件对每个社区中的顶点按照度大小进行降序排列,得到每个社区的顶点排序结果;(1-3)将每个社区的顶点排序结果依次加入顶点...

【专利技术属性】
技术研发人员:王芳冯丹易前旭刘竞
申请(专利权)人:华中科技大学深圳华中科技大学研究院
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1