一种基于压缩索引的属性图数据查询系统技术方案

技术编号:41256314 阅读:20 留言:0更新日期:2024-05-11 09:16
本发明专利技术公开了一种基于压缩索引的属性图数据查询系统,应用于基于压缩索引的属性图数据库,包括:图计算引擎对查询请求进行解析以判断其是否合法,并在查询请求合法时将查询请求转化为查询计划;根据查询计划确定查询请求所涉及的数据是否在数据更新表中被标记;数据更新表包括用户已经更新、但还未更新到压缩索引模块的属性图数据对应的VID;当所涉及的数据未在数据更新表中被标记时,定位索引单元获取待提取的文本串的起始位置及终止位置;属性索引单元根据起始位置和终止位置,利用高阶熵压缩全文自索引GeCSA算法提取文本串;数据处理器将文本串转化为预设格式,输出查询结果。本发明专利技术减少了属性图数据库的存储开销,进而提升查询性能。

【技术实现步骤摘要】

本专利技术属于数据处理,具体涉及一种基于压缩索引的属性图数据查询系统


技术介绍

1、随着社交网络、电子商务等领域的快速发展,属性图数据库的应用愈发广泛,它支持高效的复杂关联关系分析,处理复杂、关联的网状数据的效率远高于传统关系型数据库。然而,图数据通常较为复杂、庞大,这可能会使图数据库在进行查询操作时读取大量数据,磁盘读取速度的限制导致查询效率低下。

2、为了提高查询性能,目前主流的属性图数据库系统采取了多种策略和技术。例如:neo4j采用免索引邻接的策略,需要保证图结构的原生存储,即通过边关联的2个实体节点彼此的指向是物理层面的,通过边访问一个节点时该边保存的就是目标节点在磁盘上的物理地址,这样在边数量庞大时可以保证查询的高效性。neo4j采用自己提出的查询语言cypher,它是一种声明式的图数据库查询语言,能够精准且高效地对图数据进行查询和更新。由于保证了图的原生存储,设计了相应的图计算方法,neo4j的查询性能在同类产品中表现较好,但目前没有完全开源,其社区版功能受限。tigergraph是另一种较主流的属性图数据库,运用了高效的数据压本文档来自技高网...

【技术保护点】

1.一种基于压缩索引的属性图数据查询系统,其特征在于,包括:图计算引擎、后端存储接口、压缩索引模块和底层数据库,其中,所述压缩索引模块包括:定位索引单元、属性索引单元和数据处理器;

2.根据权利要求1所述的基于压缩索引的属性图数据查询系统,其特征在于,所述后端存储接口还用于定义Key-Column-Value模型,所述压缩索引模块还包括以所述Key-Column-Value模型存储的属性图数据,其中,“Key”包括属性图中顶点的顶点标识VID、“Column”包括所述属性图中顶点的数据类型、“Value”包括所述属性图中顶点的数据类型的数据内容,其中,所述属性图中所有顶点的顶...

【技术特征摘要】

1.一种基于压缩索引的属性图数据查询系统,其特征在于,包括:图计算引擎、后端存储接口、压缩索引模块和底层数据库,其中,所述压缩索引模块包括:定位索引单元、属性索引单元和数据处理器;

2.根据权利要求1所述的基于压缩索引的属性图数据查询系统,其特征在于,所述后端存储接口还用于定义key-column-value模型,所述压缩索引模块还包括以所述key-column-value模型存储的属性图数据,其中,“key”包括属性图中顶点的顶点标识vid、“column”包括所述属性图中顶点的数据类型、“value”包括所述属性图中顶点的数据类型的数据内容,其中,所述属性图中所有顶点的顶点标识从0开始连续递增。

3.根据权利要求2所述的基于压缩索引的属性图数据查询系统,其特征在于,所述属性图中顶点的数据类型包括:元数据、标签信息、属性信息和边信息。

4.根据权利要求3所述的基于压缩索引的属性图数据查询系统,其特征在于,所述定位索引单元还用于根据所述以key-column-value模型存储的属性图数据生成属性图文本。

5.根据权利要求4所述的基于压缩索引的属性图数据查询系统,其特征在于,根据所述以key-column-value模型存储的属性图数据生成属性图文本时,所述定...

【专利技术属性】
技术研发人员:彭延国王利原佳怡崔江涛乔晓田
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1