一种浮点数的压缩方法、解压方法和计算设备技术

技术编号:45664133 阅读:18 留言:0更新日期:2025-06-27 19:03
一种浮点数的压缩方法、解压方法和计算设备。计算设备接收到目标浮点数后,将目标浮点数的指数与预测值作差,从而将目标浮点数从偏态分布转换成正态分布,以便目标浮点数的指数使用熵编码进行无损压缩,实现计算设备对发送的数据进行无损压缩,减少传输过程中占用的通信带宽,且不需要额外占用其他模块的计算资源。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种浮点数的压缩方法、解压方法和计算设备


技术介绍

1、随着gpt、chat ai等大语言模型发展,大语言模型的参数量越来越多,达到千亿规模。由于大语言模型的参数量比较多,所以大语言模型的训练过程需要多个设备参与。分布到多个设备的参数量进行训练时,多个设备之间需要相互通信,以便一个设备的参数量传输到另一个设备。通常情况下,设备之间的通信带宽很小,很难满足多个设备对大语言模型进行训练的通信需求。因此,在设备之间的通信带宽有限的情况下,如何实现多个设备对大语言模型进行训练是目前亟需解决的问题。


技术实现思路

1、为了解决上述的问题,本申请的实施例中提供了一种浮点数的压缩方法,对浮点数的指数部分进行熵编码以实现无损压缩,以及预留一个短编码作为零值的浮点数无损压缩的结果,从而实现对发送的数据无损压缩,减少传输过程中占用的通信带宽。另外,本申请还提供了与该浮点数的压缩方法对应的浮点数的压缩装置、浮点数的解压方法、该浮点数的解压方法对应的浮点数的解压装置和计算设备。</p>

2、为此本文档来自技高网...

【技术保护点】

1.一种浮点数的压缩方法,其特征在于,所述方法由计算设备执行,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述获取目标浮点数之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,在所述对所述多个浮点数的数值求平均值,得到当前数据滑动窗口的预测值之前,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,当前数据滑动窗口的浮点数包括所述浮点数队列中的第一个浮点数,

5.根据权利要求1-4任意一项所述的方法,其特征在于,在所述将所述原始的指数部分与预测值作差,得到所述目标浮点数的指数差值之前,所述方法还包括:<...

【技术特征摘要】

1.一种浮点数的压缩方法,其特征在于,所述方法由计算设备执行,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述获取目标浮点数之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,在所述对所述多个浮点数的数值求平均值,得到当前数据滑动窗口的预测值之前,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,当前数据滑动窗口的浮点数包括所述浮点数队列中的第一个浮点数,

5.根据权利要求1-4任意一项所述的方法,其特征在于,在所述将所述原始的指数部分与预测值作差,得到所述目标浮点数的指数差值之前,所述方法还包括:

6.一种浮点数的解压方法,其特征在于,所述方法由计算设备执行,所述方法包括:

7.根据权利要求6所述的方法,其特征在于,所述数据报文包括特定编码,所述方法还包括:

8.一种浮点数的压缩装置,其特征在于,包括...

【专利技术属性】
技术研发人员:郑楷
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1