一种历史数据库的压缩方法技术

技术编号：13841112 阅读：79 留言：0更新日期：2016-10-16 11:21

本发明专利技术公开了一种历史数据库的压缩方法，其特征在于，包括如下步骤：步骤1、将行式数据库转化为列式数据库，具体为：1a)分表；1b)拼装；步骤2、进行分段线性拟合有损压缩；步骤3、整理数据文件；步骤4、进行数据文件的无损压缩并整理索引，组成完整的两级压缩后的列式数据库。针对现有数据库的特点，分两级压缩，先采取分段线性拟合的有损压缩的方式，后采取数字字典的无损压缩方式，将数据压缩并节省所占用的空间，以满足现代综合监控系统对保存的历史数据的时间长度越来越久的要求，并将误差保持在一定的误差精度范围内。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种历史数据库的压缩方法。
技术介绍
现代综合监控系统的数据测点的并发量规模越来越大，数据采集的频率要求越来越高，在很多应用场景需要存储海量并发、高频捕捉的时序数据，每天需要存储的原始数据规模可以达到上百G，故需要对数据进行压缩存储。系统对历史数据的压缩一般采用有损数据压缩算法和无损压缩算法。通用的有损数据压缩算法分为3类：信号变换法、矢量量化法、以及分段线性法。分段线性法实现简单，比较适合历史数据的压缩，主要有：矩形波串法(box car，BC)和向后倾斜(backwardslope，DS)算法、旋转门(swing door trending，SDT)。而通用的无损压缩算法有霍夫曼(Huffman)编码、行程编码和字典编码等压缩算法。目前，综合监控系统的实时数据采集与缓存都是行式的，并且历史数据库的设计也主要是行式数据库，现在一般的历史数据库的设计都含有损压缩和无损压缩两级数据压缩，常见的是旋转门有损压缩+字典编码无损压缩。其存在下述不足：第一、行式数据库的压缩效率不高，越来越难以适应和满足综合监控系统对历史数据库数据压缩存储的需求。第二、旋转门压缩算法作为线性拟合的一种算法，具有效率高、压缩比高、误差可控制的优点。但是该算法结构还是相对有些复杂，代码实现难度比最小二乘法拟合的代码实现难度要小，但是还是有一定难度。
技术实现思路
针对上述问题，本专利技术提供一种历史数据库的压缩方法，针对现有数据库的特点，分两级压缩，先采取分段线性拟合的有损压缩的方式，后采取数字字典的无损压缩方式，将数据压缩并节省所占用的空间，以满足现代综合监控系统对保存的历...

【技术保护点】
一种历史数据库的压缩方法，其特征在于，包括如下步骤：步骤1、将行式数据库转化为列式数据库，具体为：1a)分表：将原有包含若干个测点数据的一个数据库表，分成若干个数据库表，其中，每个数据库表中仅含有单个测点的数据，且数据项是按照原有时间顺序排列；1b)拼装：假设分表后获得M行数据，每行数据具有W个字段，则将M行数据按照次序整合为一行，其中，先按照次序存储M行数据的第一个字段，最后按照次序存储M行数据的第W个字段，获得列式数据库；步骤2、进行分段线性拟合有损压缩；步骤3、整理数据文件保持各个列式数据文件的一致性；步骤4、进行数据文件的无损压缩并整理索引，组成完整的两级压缩后的列式数据库。

【技术特征摘要】
1.一种历史数据库的压缩方法，其特征在于，包括如下步骤：步骤1、将行式数据库转化为列式数据库，具体为：1a)分表：将原有包含若干个测点数据的一个数据库表，分成若干个数据库表，其中，每个数据库表中仅含有单个测点的数据，且数据项是按照原有时间顺序排列；1b)拼装：假设分表后获得M行数据，每行数据具有W个字段，则将M行数据按照次序整合为一行，其中，先按照次序存储M行数据的第一个字段，最后按照次序存储M行数据的第W个字段，获得列式数据库；步骤2、进行分段线性拟合有损压缩；步骤3、整理数据文件保持各个列式数据文件的一致性；步骤4、进行数据文件的无损压缩并整理索引，组成完整的两级压缩后的列式数据库。2.根据权利要求1所述的一种历史数据库的压缩方法，其特征在于，步骤2中，设时间片为Tp，对应的数据片为P1,P2…Pn，数据片的起止两点为P1和Pn，误差上限为δ，则分段线性拟合的过程是采用四点三段或三点两段分割法来分割并拟合P1,P2…Pn组成数据片段PS，具体为：1a)四点三段分割法：将数据片的起止两点P1与Pn连接成线段L后，L左右两侧的误差最大点分别为Pj，Pk两点，如果Pj和Pk到L的距离误差ΔPj和ΔPk中至少有一个超过误差上限δ，则根据P1，Pj，Pk，Pn四点将数据分割成PS1＝P1…Pj,PS2＝Pj…Pk,PS3＝Pk…Pn三个子数据片段；如果Pj和Pk到L的距离误差均未超过误差上限δ，则线段L为P1…Pn的
\t拟合线段；1b)若所有数据点均在L的一侧，则为三点两段分割法：将数据片的起止两点P1与Pn连接成线段L后，所有数据点均在L的一...

【专利技术属性】
技术研发人员：张迎，金舒，薛亮，周金国，董胜刚，戴宏斌，白忠贺，杨荣昌，
申请(专利权)人：南京国电南自美卓控制系统有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人