【技术实现步骤摘要】
基于数据分析的车辆销售信息优化存储方法
[0001]本专利技术涉及数据压缩存储
,具体涉及一种基于数据分析的车辆销售信息优化存储方法
。
技术介绍
[0002]车辆销售信息数据包括车辆的基本信息
(
如品牌
、
型号
、
颜色
、
发动机规格等
)、
销售记录
、
客户信息等
。
随着汽车销售业务的增长和数字化转型,数据量不断增加,对数据的存储和处理提出了更高的要求,故需要对车辆销售信息数据进行可靠优化存储
。
[0003]霍夫曼编码是一种较为常用的数据压缩存储方法,现有技术通常采用动态霍夫曼编码对车辆销售信息数据进行压缩存储
。
动态霍夫曼编码能够较好地应对需要频繁更新的车辆销售信息数据,而且能够比较满足数据的压缩率
。
然而,现有的动态霍夫曼编码通过字符在历史编码中的出现频率动态调整各类字符在霍夫曼树上的位置,以达到历史最优树的编码
。
随着编码的进行,一些历史数据在霍夫曼数得确定过程中已经不再具有参考意义,继续根据该历史出现频率进行编码会使未来出现的字符数据过于受到历史数据的影响,导致编码压缩效果较差
。
技术实现思路
[0004]有鉴于此,为了解决采用现有的数据压缩存储方法会导致车辆销售信息数据的编码压缩效果较差的技术问题,本专利技术提供一种基于数据分析的车辆销售信息优化存储方法
。 >[0005]所采用的技术方案具体如下:
[0006]一种基于数据分析的车辆销售信息优化存储方法,包括:
[0007]获取待压缩车辆销售数据信息,以及历史参考车辆销售数据信息;
[0008]根据所述待压缩车辆销售数据信息中的各种字符在所述历史参考车辆销售数据信息中的位置信息,得到各种字符所对应的初始位置特征,并根据各种字符的所述初始位置特征
、
所述位置信息以及在所述历史参考车辆销售数据信息中的频次,得到各种字符的位置削减因子;
[0009]根据各种字符的位置削减因子,结合历史参考车辆销售数据信息的预设位置特征,得到各种字符在所述历史参考车辆销售数据信息中的修正位置特征;
[0010]根据各种字符的所述修正位置特征以及所述预设位置特征,得到各种字符的频率变化权值,并结合各种字符在所述历史参考车辆销售数据信息中出现的频率,得到各种字符的霍夫曼优先级指标;
[0011]根据各种字符的霍夫曼优先级指标,采用霍夫曼编码算法,对所述待压缩车辆销售数据信息进行编码压缩存储
。
[0012]优选地,各种字符在所述历史参考车辆销售数据信息中的位置信息为各种字符在所述历史参考车辆销售数据信息中的索引编号;
[0013]所述根据各种字符的所述初始位置特征
、
所述位置信息以及在所述历史参考车辆销售数据信息中的频次,得到各种字符的位置削减因子,包括:
[0014]对于第
i
类字符,第
i
类字符的位置削减因子的计算公式如下:
[0015][0016]其中,
F
i
为第
i
类字符的位置削减因子,
n
i
为第
i
类字符在历史参考车辆销售数据信息中的频次,
H
i
(j)
为第
i
类字符中的第
j
个字符的索引编号,为第
i
类字符的初始位置特征对应的数值,
L
为历史参考车辆销售数据信息的字符总数量,
min()
为最小值函数
。
[0017]优选地,所述初始位置特征为第
i
类字符中各个字符的索引编号的平均值
。
[0018]优选地,所述历史参考车辆销售数据信息的预设位置特征为历史参考车辆销售数据信息的字符总数量的二分之一;
[0019]所述根据各种字符的位置削减因子,结合历史参考车辆销售数据信息的预设位置特征,得到各种字符在所述历史参考车辆销售数据信息中的修正位置特征,包括:
[0020]对于第
i
类字符,第
i
类字符在所述历史参考车辆销售数据信息中的修正位置特征的计算公式如下:
[0021][0022]其中,
G
i
为第
i
类字符在历史参考车辆销售数据信息中的修正位置特征,
F
i
为第
i
类字符的位置削减因子,为第
i
类字符的初始位置特征对应的数值,
L
为历史参考车辆销售数据信息的字符总数量
。
[0023]优选地,所述根据各种字符的所述修正位置特征以及所述预设位置特征,得到各种字符的频率变化权值,包括:
[0024]计算各种字符的所述修正位置特征与所述预设位置特征的差值,各种字符的频率变化权值与所述差值呈正相关关系
。
[0025]优选地,所述结合各种字符在所述历史参考车辆销售数据信息中出现的频率,得到各种字符的霍夫曼优先级指标,包括:
[0026]计算各种字符在所述历史参考车辆销售数据信息中出现的频率与对应的频率变化权值的乘积,作为各种字符的霍夫曼优先级指标
。
[0027]优选地,所述根据各种字符的霍夫曼优先级指标,采用霍夫曼编码算法,对所述待压缩车辆销售数据信息进行编码压缩存储,包括:
[0028]将各种字符的霍夫曼优先级指标替换各种字符在所述待压缩车辆销售数据信息中的频率,然后采用霍夫曼编码算法,对所述待压缩车辆销售数据信息进行编码压缩存储
。
[0029]优选地,所述历史参考车辆销售数据信息的获取过程,包括:
[0030]按照时序获取历史车辆销售初始数据信息,将所述历史车辆销售初始数据信息进行
ASCII
编码,得到历史车辆销售编码数据信息;
[0031]从所述历史车辆销售编码数据信息中选取预设长度的数据信息,作为所述历史参考车辆销售数据信息
。
[0032]优选地,所述预设长度的获取过程,包括:
[0033]获取所述待压缩车辆销售数据信息中的字符种类数量,计算所述字符种类数量与预设种类倍数的乘积,作为所述预设长度;其中所述预设种类倍数为大于1的正整数
。
[0034]优选地,所述待压缩车辆销售数据信息的获取过程,包括:
[0035]获取待压缩车辆销售初始数据信息,将所述待压缩车辆销售初始数据信息进行
ASCII
编码,得到所述待压缩车辆销售数据信息
。
[0036]本专利技术至少具有如下有益效果:针对霍夫曼编码中数据在霍夫曼树上的优先级受字符历史出现频率影响较大的问题,根据待压缩车本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种基于数据分析的车辆销售信息优化存储方法,其特征在于,包括:获取待压缩车辆销售数据信息,以及历史参考车辆销售数据信息;根据所述待压缩车辆销售数据信息中的各种字符在所述历史参考车辆销售数据信息中的位置信息,得到各种字符所对应的初始位置特征,并根据各种字符的所述初始位置特征
、
所述位置信息以及在所述历史参考车辆销售数据信息中的频次,得到各种字符的位置削减因子;根据各种字符的位置削减因子,结合历史参考车辆销售数据信息的预设位置特征,得到各种字符在所述历史参考车辆销售数据信息中的修正位置特征;根据各种字符的所述修正位置特征以及所述预设位置特征,得到各种字符的频率变化权值,并结合各种字符在所述历史参考车辆销售数据信息中出现的频率,得到各种字符的霍夫曼优先级指标;根据各种字符的霍夫曼优先级指标,采用霍夫曼编码算法,对所述待压缩车辆销售数据信息进行编码压缩存储
。2.
根据权利要求1所述的基于数据分析的车辆销售信息优化存储方法,其特征在于,各种字符在所述历史参考车辆销售数据信息中的位置信息为各种字符在所述历史参考车辆销售数据信息中的索引编号;所述根据各种字符的所述初始位置特征
、
所述位置信息以及在所述历史参考车辆销售数据信息中的频次,得到各种字符的位置削减因子,包括:对于第
i
类字符,第
i
类字符的位置削减因子的计算公式如下:其中,
F
i
为第
i
类字符的位置削减因子,
n
i
为第
i
类字符在历史参考车辆销售数据信息中的频次,
H
i
(j)
为第
i
类字符中的第
j
个字符的索引编号,为第
i
类字符的初始位置特征对应的数值,
L
为历史参考车辆销售数据信息的字符总数量,
min()
为最小值函数
。3.
根据权利要求2所述的基于数据分析的车辆销售信息优化存储方法,其特征在于,所述初始位置特征为第
i
类字符中各个字符的索引编号的平均值
。4.
根据权利要求1所述的基于数据分析的车辆销售信息优化存储方法,其特征在于,所述历史参考车辆销售数据信息的预设位置特征为历史参考车辆销售数据信息的字符总数量的二分之一;所述根据各种字符的位置削减因子,结合历史参考车辆销售数据信息的预设位置特征,得到各种字符在所述历史参考车辆销售数据信息中的修正位置特征,包括:对于第
i
类字符,第
【专利技术属性】
技术研发人员:施康,高超,黄钰,
申请(专利权)人:杭州易靓好车互联网科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。