一种知识图谱数据压缩解压方法及系统技术方案

技术编号:37715079 阅读:21 留言:0更新日期:2023-06-02 00:10
本发明专利技术涉及一种知识图谱数据压缩解压方法及系统,方法包括获取知识图谱查询请求,将查询请求发送至图数据库,并记录知识图谱的查询条件;压缩程序响应于图数据库的返回结果,构成第一知识图谱,其中,第一知识图谱包括若干路径构成的由实体和关系组成的知识图谱数据;根据压缩程序去除第一知识图谱数据中的实体和关系的重复数据,得到第二知识图谱,其中,第二知识图谱表示经去除重复后的实体集合和关系集合;根据获取知识图谱查询请求的查询条件,对第二知识图谱进行处理;根据解压程序将第二知识图谱,重新构建第一知识图谱的实体和关系信息;根据压缩程序以及记录知识图谱的查询条件,解析出第一知识图谱的实体和关系的所有路径。有路径。有路径。

【技术实现步骤摘要】
一种知识图谱数据压缩解压方法及系统


[0001]本专利技术涉及知识图谱数据压缩解压
,尤其是涉及一种知识图谱数据压缩解压方法及系统。

技术介绍

[0002]近年来,知识图谱在越多越多的领域得到应用,图数据规模也越来越大,如何高效地处理知识图谱数据已经成为一个重要的课题,大部分课题目前都聚焦在知识图谱数据的生成、清洗和展示环节,对知识图谱数据在处理过程中出现的数据膨胀情况缺乏关注。相关的知识图谱查询动作中,预先将知识图谱的数据存储在图数据库中,当需要查询图数据库中的知识图谱数据时,利用图数据库查询知识图谱数据,图数据库返回的结果数据通常包含一个子图,该子图包含若干条路径,每条路径又由多个实体数据和关系数据组成。同一个实体或关系会成为不同路径的组成部分。
[0003]基于上述原因,导致结果数据中包含大量重复的实体和关系数据,出现明显的数据膨胀,进而影响后续对知识图谱数据的传输和计算处理效率。
[0004]因此,亟需一种能够将返回的知识图谱数据压缩,从而提升知识图谱数据的计算和处理效率。

技术实现思路

[0005本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱数据压缩解压方法,其特征在于,方法包括:获取知识图谱查询请求,将查询请求发送至图数据库,并记录所述知识图谱的查询条件;所述压缩程序响应于所述图数据库的返回结果,构成第一知识图谱,其中,所述第一知识图谱包括若干路径构成的由实体和关系组成的知识图谱数据;根据所述压缩程序去除所述第一知识图谱数据中的实体和关系的重复数据,得到第二知识图谱,其中,所述第二知识图谱表示经去除重复后的实体集合和关系集合;根据获取知识图谱查询请求的查询条件,对所述第二知识图谱进行处理;根据解压程序将所述第二知识图谱,重新构建所述第一知识图谱的实体和关系信息;根据所述压缩程序以及记录知识图谱的查询条件,解析出所述第一知识图谱的实体和关系的所有路径,形成所述第一知识图谱。2.根据权利要求1所述的一种知识图谱数据压缩解压方法,其特征在于,所述获取知识图谱查询请求,将查询请求发送至图数据库,并记录知识图谱的查询条件的步骤,所述查询条件包括:知识图谱的查询起点以及遍历深度。3.根据权利要求1所述的一种知识图谱数据压缩解压方法,其特征在于,所述压缩程序响应于所述图数据库的返回结果的步骤,所述压缩程序包括Java构成的压缩程序。4.根据权利要求1所述的一种知识图谱数据压缩解压方法,其特征在于,所述根据所述压缩程序去除所述第一知识图谱数据中的实体和关系的重复数据,得到第二知识图谱的步骤,包括:所述压缩程序遍历所述第一知识图谱数据,获取每条路径中的实体和关系;根据主键字段值的顶点及边缘对所述实体和关系去重,以使每个实体和关系均保留一份;将去重后的所有实体建立实体数据集,以及关系建立关系数据集。5.根据权利要求1所述的一种知识图谱数据压缩解压方法,其特征在于,所述根据获取知识图谱查询请求的查询条件,对所述第二知识图谱进行处理的步骤,包括:根据获取知识图谱查询请求的查询条件,确定所需的传输和处理方式;根据所述传输和处理方式,对所述第二知识图谱中的实体和关系进行属性标记和数据过滤。6.根据权利要求5所述的一种知识图谱数据压缩解压方法,其特征在于,所述根据解压程...

【专利技术属性】
技术研发人员:杨娟杨再飞邵伯仲翟士丹
申请(专利权)人:北京海致星图科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1