数据压缩方法及装置、电子设备、计算机可读存储介质制造方法及图纸

技术编号:42165998 阅读:21 留言:0更新日期:2024-07-27 00:14
本公开实施例提供了一种数据压缩方法及装置、电子设备、计算机可读存储介质,该数据压缩方法包括:根据待压缩数据的取值分布规则确定待压缩数据中取值分布占比大于占比阈值的目标数据;待压缩数据取值分布不均匀;基于目标数据大小确定存储空间大小要求;根据存储空间大小要求对待压缩数据进行至少一次分解,获取多组分解数据;至少一组分解数据大小均小于或等于存储空间大小要求;根据每组分解数据的数量对每组分解数据进行抛弃或采用相应的存储方式存储。该实施例方案增大了稠密化存储的信息量与存储量的比值,提高压缩效率,为霍夫曼编码序列并行解码提供了技术基础,从而有利于降低解码延迟,提高在大模型带宽压缩等场景中的解码速度。

【技术实现步骤摘要】

本公开实施例涉及数据压缩,特别涉及一种数据压缩方法及装置、电子设备、计算机可读存储介质


技术介绍

1、大语言模型在推理场景中,产生每个token(令牌)的计算量远小于权重参数的传输量,因此压缩大语言模型的总存储量或带宽传输量可大幅提高推理速度。

2、对权重等数据进行无损压缩,可以减少存储和通信量。霍夫曼等熵编码技术根据数据的统计特性确定编码单元的编码长度,实现不定长编码,可以逼近香农信息极限。

3、然而,霍夫曼解码是串行的,需要逐bit(位)的查找解码二叉树完成解码,难以并行。尽管出现了一些并行化的改进方法,将霍夫曼编解码应用于大模型权重到计算芯片的权重传输带宽缩减上,依然面临解码延迟较大而难以应用的问题。而且该解码方法一般难以适配gpu(graphical processing unit,图形处理单元)、类脑芯片等计算芯片,从而难以用到大模型推理带宽缩减等场景上。


技术实现思路

1、本公开实施例提供了一种数据压缩方法及装置、电子设备、计算机可读存储介质。

2、第一方面,本文档来自技高网...

【技术保护点】

1.一种数据压缩方法,其特征在于,所述方法包括:

2.根据权利要求1所述的数据压缩方法,其特征在于,所述待压缩数据包括大模型权重数据;

3.根据权利要求2所述的数据压缩方法,其特征在于,在众核芯片的片外存储所述每组分解数据以后,所述方法还包括:

4.根据权利要求1所述的数据压缩方法,其特征在于,所述目标数据的大小包括位宽,所述存储空间大小要求包括位宽要求;

5.根据权利要求1所述的数据压缩方法,其特征在于,所述根据所述存储空间大小要求对所述一组待压缩数据进行至少一次分解,获取多组分解数据,包括:

6.根据权利要求1所述的数据压缩...

【技术特征摘要】

1.一种数据压缩方法,其特征在于,所述方法包括:

2.根据权利要求1所述的数据压缩方法,其特征在于,所述待压缩数据包括大模型权重数据;

3.根据权利要求2所述的数据压缩方法,其特征在于,在众核芯片的片外存储所述每组分解数据以后,所述方法还包括:

4.根据权利要求1所述的数据压缩方法,其特征在于,所述目标数据的大小包括位宽,所述存储空间大小要求包括位宽要求;

5.根据权利要求1所述的数据压缩方法,其特征在于,所述根据所述存储空间大小要求对所述一组待压缩数据进行至少一次分解,获取多组分解数据,包括:

6.根据权利要求1所述的数据压缩方法,其特征在于,所述存储方式包括以下任意一种:稠密化存储、准稀疏化存储和稀疏化存储;

7.根据权利要求6所述的数据压缩方法,其特征在于,所述根据每组分解数据...

【专利技术属性】
技术研发人员:刘发强张伟豪
申请(专利权)人:北京灵汐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1