【技术实现步骤摘要】
一种神经网络数据的压缩方法、装置及计算机可读存储介质
本专利技术属于神经网络数据的压缩领域,具体涉及一种神经网络数据的压缩方法、装置及计算机可读存储介质。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。随着神经网络的快速发展,对神经网络模型的识别准确率要求不断地提高,神经网络的规模也不断增加。对存储空间和内存带宽的需求也日益增大,这一方面导致存储成本的升高,另一方面导致神经网络芯片的片内片外访存效率降低,影响了神经网络的数据处理性能。因此,如何对神经网络数据实现压缩,是提高神经网络运算速度的关键问题。
技术实现思路
针对上述现有技术难以提高片内片外访存效率的问题。本专利技术实施例提出了一种神经网络数据的压缩方法、装置及计算机可读存储介质。利用这种方法及装置,能够解决上述问题。本专利技术的实施例中提供了以下方案。第一方面,提供一种神经网络数据的压缩方法,包括:接收待压缩数据,待压缩数据为神经网络模 ...
【技术保护点】
1.一种神经网络数据的压缩方法,其特征在于,包括:/n接收待压缩数据,所述待压缩数据为神经网络模型的任意层的激活输出;/n根据所述待压缩数据与预设数据长度确定多个数据块;/n根据位平面压缩算法对所述多个数据块进行压缩操作。/n
【技术特征摘要】
1.一种神经网络数据的压缩方法,其特征在于,包括:
接收待压缩数据,所述待压缩数据为神经网络模型的任意层的激活输出;
根据所述待压缩数据与预设数据长度确定多个数据块;
根据位平面压缩算法对所述多个数据块进行压缩操作。
2.根据权利要求1所述的方法,其特征在于,所述待压缩数据由多个浮点值组成,且所述浮点值的数据格式为BFloat16。
3.根据权利要求2所述的方法,其特征在于,根据所述待压缩数据与预设数据长度确定多个数据块,还包括:
根据所述预设数据长度对所述待压缩数据进行分组操作;
根据所述待压缩数据的每个分组中的多个浮点值确定每个分组对应的数据块。
4.根据权利要求3所述的方法,其特征在于,根据所述待压缩数据与预设数据长度确定每个分组对应的数据块,还包括:
将所述待压缩数据的每个分组中包含的多个浮点值转换为多个无符号整数值或有符号整数值;
根据所述待压缩数据的每个分组中包含的多个无符号整数值或或有符号整数值确定每个分组对应的数据块。
5.根据权利要求3所述的方法,其特征在于,根据所述待压缩数据的每个分组中的多个浮点值确定每个分组对应的数据块,还包括:
确定所述待压缩数据的每个分组中包含的多个浮点值的指数部分和尾数部分,并单独存储所述多个浮点值的尾数部分;
根据所述待压缩数据的每个分组中包含的多个浮点值的指数部分确定每个分组对应的数据块。
6.根据权利要求1所述的方法,其特征在于,
所述根据所述待压缩数据与预设数据长度确定多个数据块,还包括:根据所述预设数据长度分别对所述待压缩数据的每行浮点值进行分组操作,从而确定所述每行浮点值对应的至少一个数据块;以及,
所述根据位平面压缩算法对所述多个数据块进行压缩操作,还包括:根据所述每行浮点值对应的至少一个数据块并行执行所述压缩操作。
7.根据权利要求1-6中任一项所述的方法,其特征在于,根据位平面压缩算法对所述多个数据块进行压缩操作之前,还包括:
判断所述多个数据块中的每一个数据块是否满足所述预设数据长度;
其中,若所述多个数据块中的指定数据块不满足所述预设数据长度,则为所述指定数据块添加不压缩标识,且无需对所述指定数据块执行所述压缩操作。
8.一种神经网络数据的压缩装置,其特征在于,包括:
接收单元,用于接收待压缩数据,所述待压缩数据为神经网络模型的任意层的激活输出;
确定单元,用于根据所述待压缩数据与预设数据长度确定多个数据块;
压...
【专利技术属性】
技术研发人员:霍成海,张楠赓,
申请(专利权)人:杭州嘉楠耘智信息科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。