当前位置: 首页 > 专利查询>清华大学专利>正文

多级时序数据压缩方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33635138 阅读:29 留言:0更新日期:2022-06-02 01:46
本申请提供一种多级时序数据压缩方法、装置、电子设备及存储介质,该方法包括:接收待存储的时序数据并判断时序数据中是否存在压缩数据;若存在,则将压缩数据基于预定义的算法进行数据恢复;将恢复后的数据和除压缩数据外的时序数据按照时间顺序进行拼接,并对拼接后的数据进行压缩和存储。这样,可以针对除原始数据外的其它形式的数据进行压缩,确保其保留数据最重要规律特征的效果,提高压缩性能和精度。度。度。

【技术实现步骤摘要】
多级时序数据压缩方法、装置、电子设备及存储介质
[0001]本申请要求于2022年01月20日提交中国国家知识产权局、申请号为2022100643941、申请名称为“时序数据压缩方法、装置、电子设备及存储介质”的中国专利申请的优先权,其全部或部分内容通过引用结合在本申请中。


[0002]本申请涉及数据库
,尤其涉及一种多级时序数据压缩方法、装置、电子设备及存储介质。

技术介绍

[0003]随着信息技术的发展,各种行业或应用产生的数据越来越多,而时序数据便是其中非常重要的数据之一,时序数据是一种存在特定规律的数据,其代表一系列时间点上的观测值按等时间间隔获取所得的数据集合,为了降低时序数据的存储成本,一般通过对时序数据进行压缩来实现,针对时序数据进行有效压缩的要求越来越高。
[0004]现有技术中,一般采取抽样或其他方式选择时间序列中的部分数据来近似表达完整的时间序列,即通过保留时序数据的重要规律特征,丢弃部分不重要的数据或信息,来进行降采样压缩。
[0005]但是,上述方法如果针对除原始数据外的其它形式的数据进行压本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多级时序数据压缩方法,其特征在于,所述方法包括:接收待存储的时序数据并判断所述时序数据中是否存在压缩数据;若存在,则将所述压缩数据基于预定义的算法进行数据恢复;将恢复后的数据和除所述压缩数据外的时序数据按照时间顺序进行拼接,并对拼接后的数据进行压缩和存储。2.根据权利要求1所述的方法,其特征在于,所述对拼接后的数据进行压缩和存储,包括:获取压缩比,并基于所述压缩比和拼接后的数据的个数计算得到目标输出数据对应的目标个数;将所述拼接后的数据按照所述目标个数进行均分,得到M个数据集;针对每一个数据集,按照降采样方式从中选取特征时序数据,得到所述数据集对应的压缩数据。3.根据权利要求2所述的方法,其特征在于,按照降采样方式从中选取特征时序数据,包括:判断该数据集是否存在左右相邻的数据集;若是,则选取该数据集左右相邻的第一数据集和第二数据集,计算所述第一数据集中的第一均值和所述第二数据集中的第二均值,并计算该数据集中每一数据对应的点与所述第一均值和所述第二均值对应的点构成的三角形面积,选取构成所述三角形面积最大的点对应的时序数据;若否,则基于时间顺序选取该数据集中的第一个时序数据或最后一个时序数据。4.根据权利要求1所述的方法,其特征在于,将所述压缩数据基于预定义的算法进行数据恢复,包括:获取第三均值和所述压缩数据对应的原始时序数据的个数;所述第三均值为所述原始时序数据的时间戳间隔的均值;基于所述第三均值和所述原始时序数据的个数进行数据恢复。5.根据权利要求4所述的方法,其特征在于,基于所述第三均值和所述原始时序数据的个数进行数据恢复,包括:计算任意两个连续的压缩数据对应的点构成的直线函数以及所述两个连续的压缩数据对应的时间戳的差值;基...

【专利技术属性】
技术研发人员:王建民朱妤晴
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1