数据压缩方法、装置和终端设备制造方法及图纸

技术编号:22946050 阅读:18 留言:0更新日期:2019-12-27 17:27
本发明专利技术适用于数据压缩技术领域,提供了一种数据压缩方法、装置和终端设备。该方法包括:获取待压缩的时间序列,并基于SemiConnAlg算法将所述时间序列转换为半连续分段集合;根据所述半连续分段集合确定所述待压缩数据的混合分段集合;以所述混合分段集合的形式存储所述待压缩数据。本发明专利技术解决了最优化的分段线性近似问题,具有线性的时间复杂度,在保证最优存储的同时,具有更优的执行效率。

Data compression method, device and terminal equipment

【技术实现步骤摘要】
数据压缩方法、装置和终端设备
本专利技术属于数据压缩
,尤其涉及一种数据压缩方法、装置和终端设备。
技术介绍
时间序列是一种数据的集合,其中每个数据点由时间戳和对应的数据值构成,这类数据通常以数据流的形式存在于现实众多领域之中,譬如云计算和医疗科学。由于数据流是随时间流失不断收集,没有穷尽,存储这样的数据类型不仅占用大量的硬盘资源,而且在实时分析这些数据时会有更多困难,所以研究高效的压缩存储方法显得尤为重要。虽然现有的技术中关于数据压缩方法众多,但依然存在数据压缩过程数据占用空间大,执行效率低的问题。
技术实现思路
有鉴于此,本专利技术实施例提供了一种数据压缩方法、装置和终端设备,以解决现有技术中的数据压缩过程数据占用空间大,执行效率低的问题。本专利技术实施例的第一方面提供了一种数据压缩方法,包括:获取待压缩的时间序列,并基于SemiConnAlg算法将所述时间序列转换为半连续分段集合;根据所述半连续分段集合确定所述待压缩数据的混合分段集合;以所述混合分段集合的形式存储所述待压缩数据。可选的,基于SemiConnAlg算法将所述时间序列转换为半连续分段集合,包括:基于DisConnAlg算法将所述时间序列转换为多个不连续分段;依次判断每个不连续分段与其右相邻的不连续分段之间是否满足半连续相交条件;若满足,则将满足半连续相交条件的所有相邻的不连续分段依次进行半连续相交,得到半连续分段集合;若不满足,则将所述与其右相邻的不连续分段的末端逐点删除,使不连续分段与该末端逐点删除后的不连续分段之间满足半连续相交条件,并进行半连续相交,得到半连续分段集合。可选的,依次判断每个不连续分段与其右相邻的不连续分段之间是否满足半连续相交条件,包括:判断每个所述不连续分段的极限线段与其右相邻的不连续分段的极限线段是否相交,且每个所述不连续分段与其右相邻的不连续分段之间是否满足预设误差条件。可选的,根据所述半连续分段集合确定所述待压缩数据的混合分段集合,包括:根据预设半连续分段确定混合分段的起始位置,所述预设半连续分段为所述半连续分段集合中所有不满足所述半连续相交条件生成的半连续分段;根据所述混合分段的起始位置对所述预设半连续分段进行分段,得到所述待压缩数据的混合分段集合。可选的,根据预设半连续分段确定混合分段的起始位置,包括:判断所述预设半连续分段与预设不连续分段之间是否满足混合分段条件,所述预设不连续分段为构成所述预设半连续分段的不连续分段;若满足,则确定所述预设不连续分段的起始时刻为所述混合分段的起始位置。可选的,判断所述预设半连续分段与预设不连续分段之间是否满足混合分段条件,包括:判断所述预设半连续分段的结束时间是否小于或等于所述预设不连续分段的结束时间。可选的,根据预设半连续分段确定混合分段的起始位置,还包括:基于所述SemiConnAlg算法,将所述预设半连续分段转换为k个半连续段,将所述预设不连续分段转换为k-1个半连续段,其中,k值为相邻所述预设半连续分段之间的满足所述半连续相交条件生成的半连续分段个数;判断所述k个半连续段的结束时间是否小于或等于所述k-1个半连续段的结束时间;若小于或等于,则确定所述预设不连续分段的起始时刻为所述混合分段的起始位置。本专利技术实施例的第二方面提供了一种数据压缩装置,包括:半连续分段模块,用于获取待压缩的时间序列,并基于SemiConnAlg算法将所述时间序列转换为半连续分段集合;混合分段模块,用于根据所述半连续分段集合确定所述待压缩数据的混合分段集合;存储模块,用于以所述混合分段集合的形式存储所述待压缩数据。本专利技术实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述实施例的第一方面提供的任一项所述的数据压缩方法的步骤。本专利技术实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例的第一方面提供的任一项所述的数据压缩方法的步骤。本专利技术实施例与现有技术相比存在的有益效果是:通过基于SemiConnAlg算法将所述时间序列转换为半连续分段集合,再根据半连续分段集合确定待压缩数据的混合分段集合,最后以混合分段集合的形式存储所述待压缩数据,解决了最优化的分段线性近似问题,使得压缩后的数据具有线性的时间复杂度,在保证最优存储的同时,具有更优的执行效率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的数据压缩方法的实现流程示意图;图2是图1中步骤S101的具体实现流程示意图;图3是图1中步骤S102的具体实现流程示意图;图4是图3中步骤S301的具体实现流程示意图;图5是本专利技术实施例提供的分段线性近似法的线段示意图;图6是本专利技术实施例提供的“反向-检验”策略和“扩展-收缩”策略的示意图;图7是本专利技术实施例提供的更新上、下极限线段和凸壳的流程示意图;图8是本专利技术实施例提供的SemiConnAlg算法输出存储的示意图;图9是本专利技术实施例提供的SemimixedAlg方法和PipeMixedAlg方法的平均时间成本示意图;图10是本专利技术实施例提供的SemimixedAlg方法和PipeMixedAlg方法的平均内存成本示意图;图11是本专利技术实施例提供的SemimixedAlg方法和PipeMixedAlg方法在数据规模增长下的稳定性示意图;图12是本专利技术实施例提供的SemimixedAlg方法和PipeMixedAlg方法在误差增长下的稳定性示意图;图13是本专利技术实施例提供的数据压缩装置的结构示意图;图14是本专利技术实施例提供的终端设备的结构示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。参见图1,为本实施例提供的数据压缩方法的一个实施例实现流程示意图,详述如下:步骤S101,获取待压缩的时间序列,并基于SemiConnAlg算法将所述时间序列转换为半连续分段集合。步骤S102,根据所述半连续分段本文档来自技高网...

【技术保护点】
1.一种数据压缩方法,其特征在于,包括:/n获取待压缩的时间序列,并基于SemiConnAlg算法将所述时间序列转换为半连续分段集合;/n根据所述半连续分段集合确定所述待压缩数据的混合分段集合;/n以所述混合分段集合的形式存储所述待压缩数据。/n

【技术特征摘要】
1.一种数据压缩方法,其特征在于,包括:
获取待压缩的时间序列,并基于SemiConnAlg算法将所述时间序列转换为半连续分段集合;
根据所述半连续分段集合确定所述待压缩数据的混合分段集合;
以所述混合分段集合的形式存储所述待压缩数据。


2.如权利要求1所述的数据压缩方法,其特征在于,基于SemiConnAlg算法将所述时间序列转换为半连续分段集合,包括:
基于DisConnAlg算法将所述时间序列转换为多个不连续分段;
依次判断每个不连续分段与其右相邻的不连续分段之间是否满足半连续相交条件;
若满足,则将满足半连续相交条件的所有相邻的不连续分段依次进行半连续相交,得到半连续分段集合;
若不满足,则将所述与其右相邻的不连续分段的末端逐点删除,使不连续分段与该末端逐点删除后的不连续分段之间满足半连续相交条件,并进行半连续相交,得到半连续分段集合。


3.如权利要求2所述的数据压缩方法,其特征在于,依次判断每个不连续分段与其右相邻的不连续分段之间是否满足半连续相交条件,包括:
判断每个所述不连续分段的极限线段与其右相邻的不连续分段的极限线段是否相交,且每个所述不连续分段与其右相邻的不连续分段之间是否满足预设误差条件。


4.如权利要求2所述的数据压缩方法,其特征在于,根据所述半连续分段集合确定所述待压缩数据的混合分段集合,包括:
根据预设半连续分段确定混合分段的起始位置,所述预设半连续分段为所述半连续分段集合中所有不满足所述半连续相交条件生成的半连续分段;
根据所述混合分段的起始位置对所述预设半连续分段进行分段,得到所述待压缩数据的混合分段集合。


5.如权利要求4所述的数据压缩方法,其特征在于,根据预设半连续分段确定混合分段的起始位置,包括:
判断所述预设半连续...

【专利技术属性】
技术研发人员:赵环宇冯春雨黎彤亮庞超逸黄世中王怀瑞
申请(专利权)人:河北省科学院应用数学研究所
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1