基于霍夫曼编码的交通能源数据压缩传输方法技术

技术编号:37308918 阅读:26 留言:0更新日期:2023-04-21 22:52
本发明专利技术涉及数据处理领域,具体涉及基于霍夫曼编码的交通能源数据压缩传输方法,包括:获取时序离散数据集,得到正常数据集以及重要数据集;获取时序离散数据集中的所有数据样本以及重要数据样本;根据重要数据集以及正常数据集得到重要数据样本的重要程度;当重要数据样本的整体频率大于等于重要程度时,重要数据样本的权值类型为整体频率;否则根据重要数据样本的压缩量增长率以及压缩总损失率,得到重要数据样本的整体数据压缩损失量,进而得到重要数据样本的权值类型;根据所有重要数据样本以及对应的权值类型进行编码压缩,得到压缩数据,对压缩数据进行传输。本发明专利技术在实现对重要数据进行短码编码的同时,保证了压缩效率。保证了压缩效率。保证了压缩效率。

【技术实现步骤摘要】
基于霍夫曼编码的交通能源数据压缩传输方法


[0001]本专利技术涉及数据处理领域,具体涉及基于霍夫曼编码的交通能源数据压缩传输方法。

技术介绍

[0002]随着技术的发展,各种交通工具层出不穷,而对应的是交通能源的消耗,例如城市轨道交通所对应的交通能源大多数为电力。而为了全面的了解城市轨道交通中的能源消耗情况以及检查轨道交通的日常运转情况,常用的方式为对一定时间内的城市轨道交通所消耗的电力能源数据传输至终端进行相应的分析。但是因为每日的轨道交通运行时间较长,所产生的数据量极大,对其进行传输之前首先需要进行压缩处理,例如利用无损压缩算法霍夫曼编码的方式对交通能源数据进行压缩,而后对压缩数据进行传输。
[0003]霍夫曼编码是一种基于待编码数据出现频率的变长编码,即不同的数据经过编码之后,其码长依照频率由大到小码长依次由短到长,这种编码方式仅考虑了频率问题,而未考虑到不同数据的重要程度,现有技术中对于该问题的解决方式为利用重要程度来替代频率作为权值进行编码,使得重要数据在编码时对应的码长较短,这种以重要程度作为权值进行编码时无法兼顾压缩效率,因此设计一种可以同时结合重要程度以及数据出现频率,对交通能源数据的特征进行量化,进而对交通能源数据的特征对交通能源数据进行压缩传输的方法是非常重要的。

技术实现思路

[0004]本专利技术提供基于霍夫曼编码的交通能源数据压缩传输方法,以解决现有的问题。
[0005]本专利技术的基于霍夫曼编码的交通能源数据压缩传输方法采用如下技术方案:本专利技术一个实施例提供了基于霍夫曼编码的交通能源数据压缩传输方法,该方法包括以下步骤:获取待压缩传输的交通能源数据,得到时序离散数据集;对时序离散数据集进行聚类,得到正常数据集以及重要数据集;获取时序离散数据集中的所有数据样本;将处于重要数据集中的数据样本称为重要数据样本;根据重要数据样本在重要数据集中出现的次数以及正常数据集中所有数据的平均值得到重要数据样本的重要程度;将重要数据样本在时序离散数据集中出现的频率作为重要数据样本的整体频率;当重要数据样本的整体频率大于等于重要程度时,将重要数据样本的整体频率作为重要数据样本的权值类型;当重要数据样本的整体频率小于重要程度时,获取重要数据样本对应的各个待调整数据样本;获取重要数据样本的第一码长以及第二码长;根据重要数据样本的重要程度、第一码长以及第二码长得到重要数据样本的压缩量增长率;根据重要数据样本对应的各个待调整数据样本的第三码长、第四码长得到重要数据样本的压缩总损失率;将压缩总损失率与压缩量增长率之间的比值作为重要数据样本的整体数据压缩损失量;根
据重要数据样本的整体数据压缩损失量得到重要数据样本的权值类型;根据所有重要数据样本以及对应的权值类型进行编码压缩,得到压缩数据,对压缩数据进行传输。
[0006]优选的,所述数据样本的获取方法为:将时序离散数据集中具有相同数值的数据称为一种数据,每一种数据为一个数据样本。
[0007]优选的,所述重要数据样本的重要程度的获取表达式为:其中,为第i个重要数据样本的重要程度,为第i个重要数据样本在重要数据集中出现的次数,表示重要数据集中所有数据的总个数,表示第个重要数据样本的数据大小,表示正常数据集中所有数据的平均值;为取绝对值符号。
[0008]优选的,所述获取重要数据样本对应的各个待调整数据样本的方法为:将整体频率大于等于重要数据样本的整体频率,且小于重要数据样本的重要程度的所有数据样本称为重要数据样本的待调整数据样本。
[0009]优选的,所述重要数据样本的第一码长以及第二码长的获取方法为:将根据重要数据样本的整体频率进行编码时重要数据样本对应的码长称为重要数据样本的第一码长;将根据重要数据样本的重要程度进行编码时重要数据样本对应的码长称为重要数据样本的第二码长。
[0010]优选的,所述各个待调整数据样本的第三码长、第四码长的获取方法为:将重要数据样本的权值类型为整体频率时,各个待调整数据样本对应的码长称为各个待调整数据样本的第三码长;将重要数据样本的权值类型为重要程度时,各个待调整数据样本对应的码长称为各个待调整数据样本的第四码长。
[0011]优选的,所述重要数据样本的压缩量增长率的获取表达式为:其中,为第i个重要数据样本的压缩量增长率;表示第i个重要数据样本在时序离散数据集A中出现的次数;表示第i个重要数据样本的第一码长;表示第i个重要数据样本的第二码长。
[0012]优选的,所述重要数据样本的压缩总损失率的获取表达式为:其中,为第i个重要数据样本的压缩总损失率;为第i个重要数据样本对应的待调整数据样本的总个数;表示第个待调整数据样本在时序离散数据集中出现的次数;表示第i个重要数据样本对应的第个待调整数据样本的第三码长;表示第i个重要数据样本对应的第个待调整数据样本的第四码长。
[0013]优选的,所述重要数据样本的权值类型包括重要程度以及整体频率。
[0014]本专利技术的有益效果是:首先对采集的交通能源数据中所有的重要数据样本对应的重要程度进行量化,并在分别根据整体频率以及重要权重对重要数据样本进行编码时,对所得压缩效果进行量化,进而确定重要数据样本的权值类型,也就是根据重要数据样本的压缩量增长率以及压缩总损失率对重要数据样本的整体数据压缩损失量进行量化,从而对使用重要程度对重要数据样本进行编码时的压缩效果进行评估,进而确定重要数据样本的权值类型;最后根据所有重要数据样本以及对应的权值类型进行编码压缩,对所得压缩数据进行传输;相比于只根据各个交通能源数据出现的频率作为权值进行霍夫曼编码,本专利技术能够使部分重要数据处于短码编码的状态,降低重要数据在传输与存储的过程中的误码率以及码元丢失率,保证重要数据的安全性;在根据重要数据样本的重要程度进行编码时,对于其余数据样本产生的影响进行量化,根据量化结果确定重要数据样本编码时的权值类型,从而实现在对重要数据进行短码编码的时候,整体数据的压缩率尽可能的小,节约了压缩以及传输成本。
附图说明
[0015]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]图1为本专利技术的基于霍夫曼编码的交通能源数据压缩传输方法的步骤流程图。
具体实施方式
[0017]为了更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的基于霍夫曼编码的交通能源数据压缩传输方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0018]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于霍夫曼编码的交通能源数据压缩传输方法,其特征在于,该方法包括以下步骤:获取待压缩传输的交通能源数据,得到时序离散数据集;对时序离散数据集进行聚类,得到正常数据集以及重要数据集;获取时序离散数据集中的所有数据样本;将处于重要数据集中的数据样本称为重要数据样本;根据重要数据样本在重要数据集中出现的次数以及正常数据集中所有数据的平均值得到重要数据样本的重要程度;将重要数据样本在时序离散数据集中出现的频率作为重要数据样本的整体频率;当重要数据样本的整体频率大于等于重要程度时,将重要数据样本的整体频率作为重要数据样本的权值类型;当重要数据样本的整体频率小于重要程度时,获取重要数据样本对应的各个待调整数据样本;获取重要数据样本的第一码长以及第二码长;根据重要数据样本的重要程度、第一码长以及第二码长得到重要数据样本的压缩量增长率;根据重要数据样本对应的各个待调整数据样本的第三码长、第四码长得到重要数据样本的压缩总损失率;将压缩总损失率与压缩量增长率之间的比值作为重要数据样本的整体数据压缩损失量;根据重要数据样本的整体数据压缩损失量得到重要数据样本的权值类型;根据所有重要数据样本以及对应的权值类型进行编码压缩,得到压缩数据,对压缩数据进行传输。2.根据权利要求1所述的基于霍夫曼编码的交通能源数据压缩传输方法,其特征在于,所述数据样本的获取方法为:将时序离散数据集中具有相同数值的数据称为一种数据,每一种数据为一个数据样本。3.根据权利要求1所述的基于霍夫曼编码的交通能源数据压缩传输方法,其特征在于,所述重要数据样本的重要程度的获取表达式为:其中,为第i个重要数据样本的重要程度,为第i个重要数据样本在重要数据集中出现的次数,表示重要数据集中所有数据的总个数,表示第个重要数据样本的数据大小,表示正常数据集中所有数据的平均值;为取绝对值符号。4.根据权利要求1所述的基于霍夫曼编码的交通能源数据压缩传输方法,其特征在于,所述获...

【专利技术属性】
技术研发人员:李向飞
申请(专利权)人:北京优天下科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1