【技术实现步骤摘要】
图数据处理方法及电子设备
[0001]本申请实施例涉及计算机
,尤其涉及一种图数据处理方法及电子设备。
技术介绍
[0002]图是一组点和边的集合,“点”表示实体,“边”表示实体间的关系,图数据是点、边及其关系的统称。在实际应用中,图数据可能会采用不同的文件格式来进行记录和存储。例如,ORC (Optimized Record Columnar,优化后的列式记录)格式、Parquet(面向分析型任务的列式存储)格式、HDF5(Hierarchical Data Format Version 5,层次性数据格式第五版)格式、CSV(Comma
‑
Separated Values,字符分隔值)格式,等等。此外,实际应用中,图数据的存储还具有很多在表示方法上的不同特征,如:是否包含属性、是否支持更新、按点还是边进行分区、边拓扑结构的表示方法(是否排序、按起点还是终点排序)等等不同的方式。
[0003]基于图数据的图计算非常丰富,因而也产生了很多针对图数据的服务和应用,如,图数据的内外存的存储、图数据 ...
【技术保护点】
【技术特征摘要】
1.一种图数据处理方法,包括:获取待存储的图数据的信息,其中,所述图数据的信息至少包括图数据的节点类型信息和数据值信息;根据所述图数据的节点类型信息所指示的节点类型,确定相匹配的节点标准格式;根据所述图数据的节点类型信息和数据值信息,将所述图数据存储为符合所述节点标准格式的标准图数据。2.根据权利要求1所述的方法,其中,所述图数据的信息还包括:所述图数据的标签信息,所述标签信息用于表征所述图数据在其所属的应用中的分类;所述根据所述图数据的节点类型信息和数据值信息,将所述图数据存储为符合所述节点标准格式的标准图数据,包括:根据所述图数据的标签信息、节点类型信息和数据值信息,将所述图数据存储为符合所述节点标准格式的标准图数据。3.根据权利要求1或2所述的方法,其中,所述节点类型包括:图数据中的点类型和边类型;当节点类型为点类型时,所述节点标准格式包括:使用逻辑点表记录点标识和与所述点标识相对应的至少一个点属性字段;当节点类型为边类型时,所述节点标准格式包括:使用逻辑边表记录边起点标识、边终点标识、和所述边起点标识和所述边终点标识所对应的边的边属性字段。4.根据权利要求3所述的方法,其中,所述点类型的节点标准格式还包括:节点关键值字段;和/或,所述边类型的节点标准格式还包括:使用所述逻辑边表记录边起点标识对应的起点的偏移位置信息。5.根据权利要求3所述的方法,其中,所述方法还包括:按照第一预设大小,将所述逻辑点表按行切分为多个子表;针对每个子表,按照所述逻辑点表的列划分,划分为多个列组;按照划分的多个列组,对所述逻辑点表对应的图数据进行物理存储,得到对应的多个物理点表。6.根据权利要求3所述的方法,其中,所述方法还包括:根据所述逻辑边表存储的图数据的信息,获得所述逻辑边表对应的用于记录所述偏移位置信息的偏移表、用于记录边的拓扑的拓扑结构表、和用于记录所述边属性字段的边属性表;按照第二预设大小,将所述偏移表按行切分为多个偏移子表;根据所述多个偏移子表,获得对应的多个拓扑结构子表和多个边属性子表;根据所述多个偏移子表、所述拓扑结构子表和所述多个边属性子表,对所述逻辑边表对应的图数据进行物理存储,得到对应的多个物理边表。7.根据权利要求6所述的方法,其中,所述根据所述多个偏移子表,获得对应的多个拓扑结构子表和边属性子表,包括:根据所述多个偏移子表,获得对应的多个包括拓扑结构表和边属性表的表块;
针对每个表块,按照第三预设大小,分别将每个表块中的拓扑结构表划分为多个拓扑结构子表...
【专利技术属性】
技术研发人员:于文渊,徐静波,罗小简,李雪,曾维彬,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。