基于图结构数据的压缩存储方法技术

技术编号:29526652 阅读:40 留言:0更新日期:2021-08-03 15:13
本发明专利技术公开了一种基于图结构数据的压缩存储方法,包括:获取所要压缩存储的图结构数据;将图结构数据输入训练完成的图结构数据分类模型中,得到分类结果;根据分类结果确定图结构数据所对应的压缩子集类型;根据压缩子集类型的同构子图,对图结构数据进行切分;将切分后的区别于同构子图的图结构数据按照预设的压缩算法进行压缩;不同的压缩子集类型分别按照预设的压缩算法进行压缩及分区存储。通过本发明专利技术的技术方案,降低了图结构数据的所需存储容量,提高了数据的检索效率,减少了随机访问量,快速定位数据。

【技术实现步骤摘要】
基于图结构数据的压缩存储方法
本专利技术涉及数据存储
,尤其涉及一种基于图结构数据的压缩存储方法。
技术介绍
在社交网络、生物技术、语义网络等开放或异构环境下,图结构得到了广泛的应用,出现了大益规模巨大的图结构数据集。例如在SemanticWeb中,用图结构的RDF数据模型来表示数据,十亿级规模数据集上的应用被广泛提出。在分子生物学中,经常需要计算化合物之间的转化关系,或研究含有某些结构的化合物可能具有的特性等,而图能够很好的反应出化合物的结构特性,可用顶点来表示化合物中的原子,用边来表示原子之间的连接关系。这类图结构数据具有典型的特点:单个图的规模较小且顶点和边的类别比较少(原子和化合键的类别相对较少),但存在大量重复,对于整个数据库来说,图的数量十分庞大。在数据集上检索满足某种特定结构的化合物是频繁执行的查询操作之一,在查询执行时需要进行候选化合物的筛选,同分异构体的判断等操作。面对图数据庞大的数据集,可通过图数据的压缩存储方法将分子生物学中的图数据进行压缩存储,解决数据存储空间大的问题,并且在执行查询操作时,实现毫秒级地快速本文档来自技高网...

【技术保护点】
1.一种基于图结构数据的压缩存储方法,其特征在于,包括:/n获取所要压缩存储的图结构数据;/n将所述图结构数据输入训练完成的图结构数据分类模型中,得到分类结果;/n根据所述分类结果确定所述图结构数据所对应的压缩子集类型;/n根据所述压缩子集类型的同构子图,对所述图结构数据进行切分;/n将切分后的区别于所述同构子图的图结构数据按照预设的压缩算法进行压缩;/n不同的压缩子集类型分别按照预设的压缩算法进行压缩及分区存储。/n

【技术特征摘要】
1.一种基于图结构数据的压缩存储方法,其特征在于,包括:
获取所要压缩存储的图结构数据;
将所述图结构数据输入训练完成的图结构数据分类模型中,得到分类结果;
根据所述分类结果确定所述图结构数据所对应的压缩子集类型;
根据所述压缩子集类型的同构子图,对所述图结构数据进行切分;
将切分后的区别于所述同构子图的图结构数据按照预设的压缩算法进行压缩;
不同的压缩子集类型分别按照预设的压缩算法进行压缩及分区存储。


2.根据权利要求1所述的基于图结构数据的压缩存储方法,其特征在于,所述图结构数据分类模型的训练过程包括:
获取图结构数据样本,并根据所述图结构数据样本的存储模式和应用领域进行分类;
根据分类结果对所述图结构数据样本的类型进行标注;
基于机器学习算法构建所述图结构数据分类模型;
将所述图结构数据样本作为输入、以相应图结构数据样本的标注类型作为输出,对所述图结构数据分类模型进行训练;
在所述图结构数据分类模型的训练结果收敛后得到训练完成的所述图结构数据分类模型。


3.根据权利要求2所述的基于图结构数据的压缩存储方法,其特征在于,所述压缩子集类型的...

【专利技术属性】
技术研发人员:王绪刚
申请(专利权)人:北京欧拉认知智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1