【技术实现步骤摘要】
一种面向知识图谱的图数据表示和映射方法
本专利技术属于图数据库
,特别涉及一种面向知识图谱的图数据表示和映射方法,能支持具有潜在的大量计算节点的计算机集群上的图数据表示和操作。
技术介绍
图是计算机科学中常用的一类抽象数据结构,图的普适性使得现实世界的实际网络往往能够抽象成图数据模型表示,其在基于计算机数据库的数据处理
具有广泛的应用前景。目前己经被广泛地应用于诸如计算机科学、语言学、逻辑学、物理、化学、电信工程等领域。然而,真实世界中实体规模的扩张,导致对应的图数据规模迅速增长,无论是RDF(ResourceDescriptionFramework)图数据,还是社交网络图的数据,动辄有数十亿个顶点和上万亿条边。本文所指的大规模强调的就是单个图的大规模性,通常包含十亿个顶点。面对这样大规模的图,对海量数据处理技术提出了巨大挑战,以图数据常用的最短路径计算为例,对于按邻接表形式存储的100亿顶点、600亿条边的图,假设每个顶点及出度边的存储空间占100字节,那么整个图的存储空间将超过1TB。如此大规模的图,对其存储 ...
【技术保护点】
1.一种面向知识图谱的图数据表示和映射方法,其特征在于,包括如下步骤:/n(10)将大规模图数据结构映射到消息空间,消息空间存储了包含顶点、弧及属性的关键数据结构,所述大规模图数据结构包括邻接表和索引表;/n(20)利用消息空间的全局分布式文件系统特性,持久化存储和全局访问大规模图数据结构;/n(30)提供全局可访问的索引表结构,用于实现对图数据的并行访问。/n
【技术特征摘要】
1.一种面向知识图谱的图数据表示和映射方法,其特征在于,包括如下步骤:
(10)将大规模图数据结构映射到消息空间,消息空间存储了包含顶点、弧及属性的关键数据结构,所述大规模图数据结构包括邻接表和索引表;
(20)利用消息空间的全局分布式文件系统特性,持久化存储和全局访问大规模图数据结构;
(30)提供全局可访问的索引表结构,用于实现对图数据的并行访问。
2.根据权利要求1所述的面向知识图谱的图数据表示和映射方法,其特征在于,所述步骤(10)包括:
所有图数据结构在消息空间中都有固定起始位置作为标识,通过消息的固定起始位置能够随机访问图数据结构;将顶点的固定起始位置汇总记录在索引表中,索引表结构包含多个顶点的索引号和对应的消息空间固定起始位置;使用者通过索引表查找和访问图数据结构...
【专利技术属性】
技术研发人员:刘颖,关礼安,白新有,朱连宏,张巍,陈剑,张洋铭,王朝志,赵杨华,
申请(专利权)人:军事科学院系统工程研究院系统总体研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。