数据无损压缩方法、系统、电子设备及介质技术方案

技术编号：32216223 阅读：30 留言：0更新日期：2022-02-09 17:21

本发明专利技术公开了一种数据无损压缩方法、系统、电子设备及介质，本方法利用式r2p(0)2+r3p(0)2p(1)<1计算加权系数r，最后利用加权系数r实现对目标二进制序列X的压缩过程，可以有效的解决译码歧义问题，而且压缩效果相较于算术编码有较大提升。本方法是以比特为单位的压缩方法，无需大量的硬件缓存和编码，又因为是线性编码，所以适合流数据的压缩，运算的硬件资源少。源少。源少。

全部详细技术资料下载

【技术实现步骤摘要】
数据无损压缩方法、系统、电子设备及介质

[0001]本专利技术涉及数据压缩
，特别涉及一种数据无损压缩方法、系统、电子设备及介质。

技术介绍

[0002]大数据时代，数据量快速增长给网络传输和存储带来巨大压力。为了解决这一问题，一方面需提升硬件设施，另一方面是构造具有更高压缩率的无损编码算法。常见的无损压缩方法有字典编码、行程编码、算术编码等，统称为熵编码。但目前的熵编码技术方案还存在着压缩率较低的缺陷。

技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题。为此，本专利技术提出一种数据无损压缩方法、系统、电子设备及介质。相比于算术编码，本专利技术具有更好的压缩效果，还可以有效的解决译码歧义问题。
[0004]本专利技术的第一方面，提供了一种数据无损压缩方法，包括如下步骤：
[0005]步骤S101、获取目标二进制序列X；
[0006]步骤S103、统计所述目标二进制序列X中符号0的概率p(0)和符号1的概率p(1)；
[0007]步骤S105、根据公式r2p(0)2+r3p(0)2p(1)＜1，计算加权系数r，令i＝1；
[0008]步骤S107、编码所述目标二进制序列X中的第i位符号：
[0009]若第i位符号为符号0，则R
i
＝R
i
‑1rp(0)，L
i
＝L
i
‑1，i＝i+1；若第i位符号为符号1，则R
i
＝R
i
>‑1r2p(0)p(1)，L
i
＝L
i
‑1+R
i
‑1r2p(0)2，i＝i+1；其中，R
i
、R
i
‑1、L
i
以及L
i
‑1为编码变量，R0＝1，L0＝0；
[0010]步骤S109、若i≤n，则跳转至步骤S107；若i＞n，得到编码完所述目标二进制序列X最后一位符号后的L
n
，其中，所述n表示所述目标二进制序列X的序列长度。
[0011]根据本专利技术的实施例，至少具有如下技术效果：
[0012]本方法利用式r2p(0)2+r3p(0)2p(1)＜1计算加权系数r，最后利用加权系数r实现对目标二进制序列X的压缩过程，可以有效的解决译码歧义问题，而且压缩效果相较于算术编码有较大提升。本方法是以比特为单位的压缩方法，无需大量的硬件缓存和编码，又因为是线性编码，所以适合流数据的压缩，运算的硬件资源少。
[0013]本专利技术的第二方面，提供了一种数据无损压缩系统，包括：
[0014]数据获取单元，用于获取目标二进制序列X；
[0015]数据压缩单元，用于执行如下步骤：
[0016]步骤S103、统计所述目标二进制序列X中符号0的概率p(0)和符号1的概率p(1)；
[0017]步骤S105、根据公式r2p(0)2+r3p(0)2p(1)＜1，计算加权系数r，令i＝1；
[0018]步骤S107、编码所述目标二进制序列X中的第i位符号：
[0019]若第i位符号为符号0，则R
i
＝R
i
‑1rp(0)，L
i
＝L
i
‑1，i＝i+1；若第i位符号为符号1，则
R
i
＝R
i
‑1r2p(0)p(1)，L
i
＝L
i
‑1+R
i
‑1r2p(0)2，i＝i+1；其中，R
i
、R
i
‑1、L
i
以及L
i
‑1为编码变量，R0＝1，L0＝0；
[0020]步骤S109、若i≤n，则跳转至步骤S107；若i＞n，得到编码完所述目标二进制序列X最后一位符号后的L
n
，其中，所述n表示所述目标二进制序列X的序列长度。
[0021]本专利技术的第三方面，提供了一种电子设备，包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器；所述存储器存储有可被所述至少一个控制处理器执行的指令，所述指令被所述至少一个控制处理器执行，以使所述至少一个控制处理器能够执行上述的数据无损压缩方法。
[0022]本专利技术的第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行上述的数据无损压缩方法。
[0023]需要注意的是，本专利技术的第二方面至第四方面与现有技术之间的有益效果与上述的数据无损压缩方法与现有技术之间的有益效果相同，此处不再细述。
[0024]本专利技术的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本专利技术的实践了解到。
附图说明
[0025]本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：
[0026]图1为本专利技术一个实施例提供的当n＝1时，x1＝0，1，...，k的加权分布函数的示意图；
[0027]图2为本专利技术一个实施例提供的当n＝2并且已知x1时，x2＝0，1，...，k的加权分布函数的示意图；
[0028]图3为本专利技术一个实施例提供的一种数据无损压缩方法的流程示意图；
[0029]图4为本专利技术另外一个实施例提供的一种数据无损压缩方法的流程示意图；
[0030]图5为本专利技术一个实施例提供的一种数据无损压缩系统的结构示意图。
具体实施方式
[0031]下面详细描述本专利技术的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本专利技术，而不能理解为对本专利技术的限制。
[0032]为了便于本领域技术人员理解本申请实施例的相关内容，先简要介绍加权概率、加权概率模型以及加权模型的信息熵的原理。
[0033]1、加权概率和加权概率模型；
[0034]令X＝{x1，x2，...，x
n
}是有限个值或可数个可能值的随机过程。除非特别提醒，这个随机过程的可能值的集合都将记为非负整数的集合A＝{0，1，2，...，s}，x
i
∈A(i＝1，2，...，n)。于是对于A中一切数值有概率空间：
[0035][0036]其中x∈A。由于随机过程必须转移到集合A中的某个数值，所以在任意时刻i有：
[0037][0038]于是，任意时刻i累积分布函数F(a)可以用p(x)表示为：
[0039]F(a)＝∑
x≤a
p(x)
ꢀꢀ
(3)
[0040]其中，0≤F(a)≤1，a∈A。
[0041]定义1，加权概率质量函数为：
[0042][004本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据无损压缩方法，其特征在于，包括如下步骤：步骤S101、获取目标二进制序列X；步骤S103、统计所述目标二进制序列X中符号0的概率p(0)和符号1的概率p(1)；步骤S105、根据公式r2p(0)2+r3p(0)2p(1)＜1，计算加权系数r，令i＝1；步骤S107、编码所述目标二进制序列X中的第i位符号：若第i位符号为符号0，则R
i
＝R
i
‑1rp(0)，L
i
＝L
i
‑1，i＝i+1；若第i位符号为符号1，则R
i
＝R
i
‑1r2p(0)p(1)，L
i
＝L
i
‑1+R
i
‑1r2p(0)2，i＝i+1；其中，R
i
、R
i
‑1、L
i
以及L
i
‑1为编码变量，R0＝1，L0＝0；步骤S109、若i≤n，则跳转至步骤S107；若i＞n，得到编码完所述目标二进制序列X最后一位符号后的L
n
，其中，所述n表示所述目标二进制序列X的序列长度。2.根据权利要求1所述的数据无损压缩方法，其特征在于，通过金盛公式从所述公式r2p(0)2+r3p(0)2p(1)＜1中计算所述加权系数r。3.根据权利要求1所述的数据无损压缩方法，其特征在于，还包括步骤：步骤S201、令i＝1，j＝0；步骤S203、计算第i个符号0的区间上标值：步骤S205、判断所述L
n
与的大小，若输出符号0，j＝j+1；若输出符号1，j＝j+1；步骤S209、i＝i+1，若j≤n，则跳转至步骤S203；若j＞n，译码完成，得到所述目标二进制序列X。4.根据权利要求3所述的数据无损压缩方法，其特征在于，在步骤S205之后，还包括步骤：步骤S206、将当前译码出的符号1重置为符号0，将当前所有译码出的符号组合为当前序列Z；步骤S207、令z＝1，编码所述当前序列Z中的第z位符号：步骤S2071、若第z位符号为符号0，则R
z
＝R
z
‑1rp
Z
(0)，L
z
＝L
z
‑1，z＝z+1；若第z位符号为符号1，则R
z
＝R
z
‑1r2p
Z
(0)p
Z
(1)，L
z
＝L
z
‑1+R
z
‑1r2p
Z
(0)2，z＝z+1；其中，R
z
、R
z
‑1、L
z
以及L
z
‑1为编码变量，R0＝1，L0＝0；p
Z
(0)为所述当前序列Z中符号0的概率；p
Z
(1)为所述当前序列Z中符号1的概率；步骤S2072、若z≤m，则跳转步骤S2071；若z＞m，得到编码完所述序列Z最后一位符号后的L
m
，其中，所述m表示所述当前序列Z的序列长度；步骤S208、当所述L
m
和所述L
n
从第一个符号至最后一个符号均匹配，则进入步骤S209，否则，将步骤S206中重置后的符号0重新重置为符号1，进入步骤S209。5.一种数据无损压缩系统，其特征在于，包括：数据获取单元，用于获取目标二进制序列X；数据压缩单元，用于执行如下步骤：步骤S103、统计所述目标二进制序列X中符号0的概率p(0)和符号1的概率p(1)；步骤S105、根...

【专利技术属性】
技术研发人员：王杰林，何桃军，
申请(专利权)人：湖南遥昇通信技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人