压缩操作数的方法、解压缩压缩数据序列的方法及系统技术方案

技术编号：39257503 阅读：12 留言：0更新日期：2023-10-30 12:09

本发明专利技术实施例提供压缩操作数的方法、解压缩压缩数据序列的方法及系统。本发明专利技术提供的一种压缩用于神经网络计算的操作数的方法，包括：接收多个操作数，其中每个操作数具有包括符号位、指数和分数的浮点表示；将该多个操作数重新排序为由符号位构成的第一序列、由指数构成的第二序列和由分数构成的第三序列；和压缩该第一序列、该第二序列和该第三序列以至少去除重复的指数，从而无损地生成压缩后的数据序列。实施本发明专利技术实施例可无损地生成压缩后的数据序列以及可无损地恢复多个操作数。数据序列以及可无损地恢复多个操作数。数据序列以及可无损地恢复多个操作数。

全部详细技术资料下载

【技术实现步骤摘要】
压缩操作数的方法、解压缩压缩数据序列的方法及系统

[0001]本专利技术的实施例涉及神经网络处理，更具体地，涉及压缩操作数的方法、解压缩压缩数据序列的方法及系统。

技术介绍

[0002]深度神经网络是具有输入层(input layer)、输出层(output layer)以及位于输入层和输出层之间的一个或多个隐藏层(hidden layer)的神经网络。每一层对一个或多个张量(tensor)执行操作。张量是一个数学对象(mathematical object)，其可以是零维的(又名定标器(scaler))、一维的(又名向量(vector))、二维的(又名矩阵(matrix))或多维的。一些层将权重应用于张量，例如在卷积操作中。通常，由一个神经网络层产生的张量存储在存储器中，并由下一层从存储器中获取以作为输入。存储和获取张量以及存储和获取任何适用的权重都可能使用存储器总在线的大量数据带宽。
[0003]神经网络计算需要密集的计算和带宽需求。现代计算器通常在数值计算(numerical computation)中使用具有大位宽(bit width)(例如，16位或32位)的浮点数来实现高精度。然而，高精度是以高功耗和高存储器带宽为代价的。在保持神经网络计算可接受的精度的同时平衡低功耗和低存储器带宽需求是一项挑战。
[0004]例如，带宽测量和乘加(Multiply
‑
And
‑
Add，MAC)操作的计算量在过去十年中以快速的速度稳步增长。神经网络应用的类型已经从图像分类...

【技术保护点】

【技术特征摘要】
1.一种压缩用于神经网络计算的操作数的方法，其特征在于，包括：接收多个操作数，其中每个操作数具有包括符号位、指数和分数的浮点表示；将该多个操作数重新排序为由符号位构成的第一序列、由指数构成的第二序列和由分数构成的第三序列；和压缩该第一序列、该第二序列和该第三序列以至少去除重复的指数，从而无损地生成压缩后的数据序列。2.如权利要求1所述的压缩用于神经网络计算的操作数的方法，其特征在于，共享相同指数的多个符号位、多个指数和多个分数被分别重新排序到该第一序列、该第二序列和该第三序列中的每一个中的相邻空间位置。3.如权利要求1所述的压缩用于神经网络计算的操作数的方法，其特征在于，还包括：在多批次的N个操作数中执行该重新排序和该压缩，N是一个非负整数。4.如权利要求1所述的压缩用于神经网络计算的操作数的方法，其特征在于，在压缩该第一序列、该第二序列和该第三序列时，还去除重复的符号位。5.如权利要求1所述的压缩用于神经网络计算的操作数的方法，其特征在于，还包括：生成指示在该重新排序和该压缩中使用的参数的元数据。6.如权利要求1所述的压缩用于神经网络计算的操作数的方法，其特征在于，该多个操作数包括卷积神经网络的层的多个权重。7.如权利要求1所述的压缩用于神经网络计算的操作数的方法，其特征在于，该多个操作数包括来自执行卷积神经网络的一层的加速器的激活输出。8.如权利要求7所述的压缩用于神经网络计算的操作数的方法，其特征在于，还包括：将该压缩后的数据序列存储在存储器中；和获取该压缩后的数据序列以进行解压缩，以供该加速器执行该卷积神经网络的一后续层。9.如权利要求1所述的压缩用于神经网络计算的操作数的方法，其特征在于，适用于任何位宽的指数。10.一种解压缩压缩数据序列的方法，其特征在于，包括：将压缩后的数据序列解压缩为N个符号位构成的第一序列、N个指数构成的第二序列和N个分数构成的第三序列，其中N为正整数，其中该压缩后的数据序列表示N个操作数且不包含重复的指数；将该N个符号位构成的该第一序列、该N个指数构成的第二序列和该N个分数构成的第三序列重新排序为表示该N个操作数的N个浮点数构成的恢复后的...

【专利技术属性】
技术研发人员：郭玹凯，李怀霆，曾守曜，陈柏谕，
申请(专利权)人：联发科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人