一种网络访问请求数据的压缩方法技术

技术编号:36863311 阅读:17 留言:0更新日期:2023-03-15 18:43
本发明专利技术涉及数据压缩处理领域,具体涉及一种网络访问请求数据的压缩方法,包括:获取网络访问请求数据中的各个高频字符;根据目标字符在目标录入长度下对应的各个字典条目以及各个字典条目的出现概率,得到可压缩程度以及压缩数据量,进而得到对应的压缩收益;根据目标字符的各个相邻字典录入长度对应的压缩收益得到目标字符在目标录入长度下对应的压缩损失量;根据目标字符在目标录入长度下对应的压缩收益以及压缩损失量得到目标字符的最佳录入长度,进而得到各个高频字符的最佳录入长度;根据各个高频字符的最佳录入长度得到压缩字典;根据压缩字典对网络访问请求数据进行压缩。本发明专利技术可以在压缩字典的建立初期保持良好的压缩效果。的压缩效果。的压缩效果。

【技术实现步骤摘要】
一种网络访问请求数据的压缩方法


[0001]本专利技术涉及数据压缩处理领域,具体涉及一种网络访问请求数据的压缩方法。

技术介绍

[0002]随着科技的发展,各行各业对于网络数据的交换需求越来越大,而在进行数据交换的时候,需要进行网络访问请求数据的传输。为了提高数据交换的效率,一般需要对网络访问请求数据进行压缩,网络访问请求数据为小数据量的文本数据,其进行压缩时需要进行无损压缩,而现有的压缩算法中对于文本数据进行无损压缩时最常使用的算法为LZW压缩算法;利用LZW压缩算法对网络访问请求数据进行压缩的时候,是通过对待压缩的网络访问请求数据以单字符开始作为基础建立压缩字典进行压缩,但是因为网络访问请求数据的整体数据量较小,在LZW压缩算法的压缩字典未建立完全的时候,网络访问请求数据中的多个字符无法压缩,进而无法对网络访问请求数据达到最高的压缩量,使得压缩后的网络访问请求数据量过大,压缩后的数据传输成本较高。

技术实现思路

[0003]本专利技术提供一种网络访问请求数据的压缩方法,以解决现有的问题。
[0004]本专利技术的一种网络访问请求数据的压缩方法采用如下技术方案:本专利技术一个实施例提供了一种网络访问请求数据的压缩方法,该方法包括以下步骤:获取网络访问请求数据,并获取所得网络访问请求数据中的各个高频字符;以任意一个高频字符为目标字符,以任意字典录入长度为目标录入长度,获取目标字符在目标录入长度下对应的所有字符组合,得到各个字典条目以及各个字典条目的出现概率,每个字典条目对应一个或多个相同的字符组合;根据所得字典条目的个数以及各个字典条目的出现概率得到目标字符在目标录入长度下对应的可压缩程度;根据目标字符在目标录入长度下对应的所有字符组合得到目标字符在目标录入长度下对应的压缩数据量;根据所得可压缩程度以及压缩数据量得到目标字符在目标录入长度下对应的压缩收益;根据目标字符的各个相邻字典录入长度之间压缩收益的差值得到目标字符在目标录入长度下对应的压缩损失量;根据目标字符在目标录入长度下对应的压缩收益以及压缩损失量得到目标字符的最佳录入长度;以各个高频字符为目标字符,得到各个高频字符的最佳录入长度;根据各个高频字符的最佳录入长度得到压缩字典;根据压缩字典对网络访问请求数据进行压缩。
[0005]优选的,所述各个高频字符的获取方法包括:获取网络访问请求数据中各个单字符的出现概率,将所得各个出现概率的平均值
作为平均出现概率,将出现概率大于平均出现概率的各个单字符记为各个高频字符。
[0006]优选的,所述各个字典条目以及各个字典条目的出现概率的获取方法为:以目标字符在网络访问请求数据中的各个位置为各个起始位置,获取从各个起始位置开始,连续目标录入长度的字符构成的所有字符组合,将相同的字符组合称为一个字典条目,根据不同的字符组合得到各个字典条目,各个字典条目对应的字符组合在所有字符组合出现的概率作为各个字典条目的出现概率。
[0007]优选的,所述目标字符在目标录入长度下对应的可压缩程度的获取方法为:根据目标字符在目标录入长度下所得各个字典条目对应的出现概率,得到压缩难度;根据所有字典条目的个数以及所得压缩难度得到目标字符在目标录入长度下对应的可压缩程度。
[0008]优选的,所述目标字符在目标录入长度下对应的压缩数据量的获取步骤包括:计算目标字符在目标录入长度下对应不同字符组合的个数之间的累加和,将所得累加和与各个字典录入长度之间的乘积作为目标字符在目标录入长度下对应的压缩数据量。
[0009]优选的,所述目标字符在目标录入长度下对应的压缩收益的获取方法为:将目标字符在目标录入长度下对应的可压缩程度以及压缩数据量之间的乘积作为目标字符在目标录入长度下对应的压缩收益。
[0010]优选的,所述各个高频字符在各个字典录入长度下对应的压缩损失量的获取方法包括:分别计算小于目标录入长度的各个字典录入长度与相邻字典录入长度对应压缩收益之间的差值,将所得各个差值之间的累加和作为目标字符在字典录入长度为目标录入长度时对应的压缩损失量。
[0011]优选的,所述目标字符的最佳录入长度的获取方法为:当目标字符在目标录入长度下对应的压缩收益大于压缩损失量时,将目标录入长度作为目标字符的最佳录入长度,否则对目标录入长度进行加一操作,得到新的目标录入长度,根据目标字符在新的目标录入长度下对应的压缩收益以及压缩损失量对新的目标录入长度进行处理,直到得到目标字符的最佳录入长度。
[0012]本专利技术的有益效果是:通过对网络访问请求数据中的高频字符在不同字典录入长度下对应的可压缩程度以及压缩数据量进行计算,得到各个高频字符在不同字典录入长度下的压缩收益;根据较长字符组合无法对较短字符组合进行压缩的局限性,进一步根据同一个高频字符在不同字典录入长度下的压缩损失量对同一高频字符的各个字典录入长度进行评估,从而得到各个高频字符的最佳录入长度,而后将高频字符的最佳录入长度与传统压缩算法相结合的方式对网络访问请求数据进行压缩字典的建立,使得在压缩字典未建立完善的时候,即压缩字典的建立初期,仍然可以对网络访问请求数据中的高频字符进行较长字节的数据压缩,相较于现有的压缩算法,可以实现在压缩字典的建立初期有着较好的压缩效果,从而更适合网络访问请求数据等小数据量文本数据的压缩。
附图说明
[0013]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0014]图1为本专利技术的一种网络访问请求数据的压缩方法的步骤流程图。
具体实施方式
[0015]为了更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的一种网络访问请求数据的压缩方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0016]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。
[0017]下面结合附图具体的说明本专利技术所提供的一种网络访问请求数据的压缩方法的具体方案。
[0018]请参阅图1,其示出了本专利技术一个实施例提供的一种网络访问请求数据的压缩方法的步骤流程图,该方法包括以下步骤:步骤S001:获取网络访问请求数据,并获取所得网络访问请求数据中的各个高频字符。
[0019]首先获取待压缩的网络访问请求数据,其中网络访问请求数据是指,在客户端需要对某一个终端进行访问数据交换的时候,由客户端对目标终端发出请求的一串文本数据,例如某一个用户需要进行某一个网站的访问时,用户对应的客户端需要发送一个HTTP请求至服务器,其中请求包括请求行、请求头本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网络访问请求数据的压缩方法,其特征在于,该方法包括以下步骤:获取网络访问请求数据,并获取所得网络访问请求数据中的各个高频字符;以任意一个高频字符为目标字符,以任意字典录入长度为目标录入长度,获取目标字符在目标录入长度下对应的所有字符组合,得到各个字典条目以及各个字典条目的出现概率,每个字典条目对应一个或多个相同的字符组合;根据所得字典条目的个数以及各个字典条目的出现概率得到目标字符在目标录入长度下对应的可压缩程度;根据目标字符在目标录入长度下对应的所有字符组合得到目标字符在目标录入长度下对应的压缩数据量;根据所得可压缩程度以及压缩数据量得到目标字符在目标录入长度下对应的压缩收益;根据目标字符的各个相邻字典录入长度之间压缩收益的差值得到目标字符在目标录入长度下对应的压缩损失量;根据目标字符在目标录入长度下对应的压缩收益以及压缩损失量得到目标字符的最佳录入长度;以各个高频字符为目标字符,得到各个高频字符的最佳录入长度;根据各个高频字符的最佳录入长度得到压缩字典;根据压缩字典对网络访问请求数据进行压缩。2.根据权利要求1所述的一种网络访问请求数据的压缩方法,其特征在于,所述各个高频字符的获取方法包括:获取网络访问请求数据中各个单字符的出现概率,将所得各个出现概率的平均值作为平均出现概率,将出现概率大于平均出现概率的各个单字符记为各个高频字符。3.根据权利要求1所述的一种网络访问请求数据的压缩方法,其特征在于,所述各个字典条目以及各个字典条目的出现概率的获取方法为:以目标字符在网络访问请求数据中的各个位置为各个起始位置,获取从各个起始位置开始,连续目标录入长度的字符构成的所有字符组合,将相同的字符组合称为一个字典条目,根据不同的字符组合得到各个字典条目,各个字典条目对应的字符组合在所有字符组合出现的概率作为各...

【专利技术属性】
技术研发人员:米存照
申请(专利权)人:北京特立信电子技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1