无损压缩方法、电子设备及存储介质技术

技术编号:37635657 阅读:29 留言:0更新日期:2023-05-20 08:55
本申请实施例提供一种无损压缩方法、电子设备及存储介质。针对待压缩字符串中的任一个当前待编码字符,基于当前待编码字符的哈希结果从待压缩字符串中找到位于其前面的相同字符;接着,根据当前待编码字符和位于其前面的相同字符各自的字符位置,确定当前待编码字符的偏移值;接着,考虑当前待编码字符前面的若干个字符各自的偏移值和在最近一个轮次的字符串匹配的匹配长度,对当前待编码字符和位于其前面的相同字符进行至少一个轮次的字符串匹配,得到当前待编码字符最终的匹配长度;最后,基于各个当前待编码字符对应的编码结果生成待压缩字符串的无损压缩结果。该方法具有较高的压缩率和压缩速率,提供较好的无损压缩性能。能。能。

【技术实现步骤摘要】
无损压缩方法、电子设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种无损压缩方法、电子设备及存储介质。

技术介绍

[0002]云计算技术和物联网技术的飞速发展带来数据爆炸式增长,使得数据压缩技术变得越来越重要,已经成为网络数据传输的关键技术,对数据进行压缩能够极大地提升数据传输速度与节约存储资源。
[0003]无损压缩方法是较为通用的数据压缩方法,例如,海量数据或高清图像的实时数据压缩等各种应用场景均会使用无损压缩方法进行数据压缩。实时数据压缩需求对无损压缩方法的压缩速率提出了更高要求,然而,目前的无损压缩方法是在牺牲压缩率的前提下改善压缩速率的,压缩性能有待改善。

技术实现思路

[0004]本申请的多个方面提供一种无损压缩方法、电子设备及存储介质,用以使得无损压缩方法具有较高的压缩率和压缩速率,提供较好的无损压缩性能。
[0005]本申请实施例提供一种无损压缩方法,包括:依次将待压缩字符串的一个字符作为当前待编码字符,重复执行以下步骤,直至当前待编码字符是待压缩字符串中的最后一个字符:对当前待编本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种无损压缩方法,其特征在于,包括:依次将待压缩字符串的一个字符作为当前待编码字符,重复执行以下步骤,直至所述当前待编码字符是所述待压缩字符串中的最后一个字符:对所述当前待编码字符进行哈希处理,得到目标哈希结果,以及确定所述目标哈希结果对应的已编码的目标历史字符的字符位置;将所述当前待编码字符的字符位置相对于所述目标历史字符的字符位置的位置偏移量,作为所述当前待编码字符的偏移值;根据至少一个在所述当前待编码字符前面的第一字符的偏移量和在最近一个轮次的字符串匹配的匹配长度,针对所述当前待编码字符和所述目标历史字符进行至少一个轮次的字符串匹配,得到所述当前待编码字符最终的匹配长度,所述匹配长度表征进行字符串匹配的字符串之间自首个字符起的相同字符的字符数量;根据多个所述当前待编码字符的编码结果,生成所述待压缩字符串的无损压缩结果,其中,所述编码结果包括偏移值、最终的匹配长度和字符位置。2.根据权利要求1所述的方法,其特征在于,针对所述当前待编码字符和所述目标历史字符进行至少一个轮次的字符串匹配,得到所述当前待编码字符最终的匹配长度,包括:若所述至少一个第一字符中存在与所述当前待编码字符具有相同偏移值的目标第一字符,则判断所述目标第一字符在最近一个轮次的字符串匹配的匹配长度是否指示进行字符串匹配的字符串中各相同位置上的字符均相同;若判断结果为是,则按照单轮次字符串匹配模式将自所述当前待编码字符起的连续W个字符组成的字符串与自所述目标历史字符起的连续W个字符组成的字符串进行字符串匹配,得到所述当前待编码字符最终的匹配长度,W为正整数。3.根据权利要求2所述的方法,其特征在于,还包括:若所述至少一个第一字符中不存在与所述当前待编码字符具有相同偏移值的目标第一字符,或者,所述判断结果为否,则按照多轮次字符串匹配模式进行至少一个轮次的字符串匹配;根据所述当前待编码字符在各个轮次的匹配长度,得到所述当前待编码字符最终的匹配长度;其中,下一个轮次需要进行字符串匹配的两个字符串是位于上一个轮次进行字符串匹配的两个字符串后面的连续W个字符组成的两个字符串,第一个轮次需要进行字符串匹配的两个字符串是自所述当前待编码字符起的连续W个字符组成的字符串与自所述目标历史字符起的连续W个字符组成的字符串。4.根据权利要求3所述的方法,其特征在于,按照多轮次字符串匹配模式进行至少一个轮次的字符串匹配包括:将自所述当前待编码字符起的连续W个字符组成的字符串与自所述目标历史字符起的连续W个字符组成的字符串进行当前轮次的字符串匹配,得到所述当前待编码字符在当前轮次的匹配长度;若所述当前待编码字符在所述当前轮次的匹配长度指示进行字符串匹配的字符串中各相同位置上的字符均相同,则将位于所述当前轮次进行字符串匹配的两个字符串后面的连续W个字符组成的两个字符串,作为下一个轮次需要进行字符串匹配的两个字符串,将下
一个轮次作为新的当前轮次,重...

【专利技术属性】
技术研发人员:李哲袁信任麒斌杨倩刘泽华蒋东华许浩曾鸣
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1