【技术实现步骤摘要】
数据表示方法、张量量化方法及乘加计算装置
[0001]本申请涉及卷积神经网络
,具体涉及一种数据表示方法、张量量化方法及乘加计算装置。
技术介绍
[0002]随着人工智能(AI)的不断发展,它已经从早期的人工特征工程进化到现在可以从海量数据中学习,机器视觉、语音识别以及自然语言处理等领域都取得了重大突破。DNN(Deep NeuralNetwork,深度神经网络)在人工智能领域受到越来越多的青睐。然而,随着网络结构变得越来越大、越来越复杂,我们需要大量的计算资源,在具有高端GPU服务器集群中对其进行训练。
[0003]近年来,随着DNN在实际生产生活中得到越来越广泛的应用,尤其是在线学习、增量学习、联邦学习等技术的兴起,同时人们对数据隐私的保护也越来越重视,因此在端侧设备上进行高能效的DNN训练逐渐成为一个迫切的需求。低比特训练是一类有效的解决方案。传统的低比特训练过程采用标准的32位浮点数(FP32)进行计算,其包含1位符号(sign)、8位无符号指数(exp)和23位尾数(mant)。FP32所表示数据的计 ...
【技术保护点】
【技术特征摘要】
1.一种数据表示方法,所述数据表示方法应用于卷积神经网络,其特征在于,包括:获取目标数据,所述目标数据包括标志位和有符号数,所述标志位和所述有符号数的位宽之和等于预设位宽,所述有符号数包括高位和低位;获取所述有符号数的分割位,所述分割位将所述有符号数分割为靠近所述标志位的第一数据和远离所述标志位的第二数据,所述第一数据与所述分割位的组合为高位,所述第二数据与所述分割位的组合为低位;根据所述标志位和所述高位中的各个数值,确定所述目标数据的所属分段,所述所属分段为第一段、第二段和第三段中的一种;根据所述目标数据的所属分段,对所述目标数据进行表示,其中,如果所述目标数据为第一段,则所述目标数据用所述低位进行表示;如果所述目标数据为第二段,则所述目标数据用有符号数对应的数值与2
d
的乘积进行表示;如果所述目标数据为第三段,则所述目标数据用有符号数对应的数值与2
k
‑2的乘积进行表示;其中,d为分割位,k为所述预设位宽。2.根据权利要求1所述的数据表示方法,其特征在于,根据所述标志位和所述高位中的各个数值,确定所述目标数据的所属分段,包括:根据所述高位中的数值是否相同,确定所述目标数据的潜在所属分段,其中,如果所述高位中的数值全部相同,则所述目标数据为潜在第一段;否则,所述目标数据为潜在第三段;根据所述标志位的数值,确定所述目标数据的所属分段,其中,如果所述标志位的数值为1,则所述目标数据为第二段;如果所述标志位的数值为0,所述目标数据的所属分段为所述潜在所属分段对应的段数。3.一种张量量化方法,所述张量量化方法应用于卷积神经网络,其特征在于,包括:获取第一张量;计算所述第一张量的最大绝对值;将所述最大绝对值与预先确定的最大表示范围的商作为缩放因子;利用所述缩放因子对所述第一张量进行缩放,获得第二张量;根据所述第二张量的绝对值,确定所述第二张量的所属分段,其中,如果所述第二张量的绝对值小于2
d
,则所述第二张量为第一段;如果所述第二张量的绝对值在2
d
和2
k
‑
2+d
之间,则所述第二张量为第二段;如果所述第二张量的绝对值大于2
k
‑
2+d
,则所述第二张量为第三段;根据所述第二张量的所属分段,对所述第二张量进行量化;将缩放因子与量化后的第二张量的乘积作为所述第一张量原本的数值范围。4.根据权利要求3所述的张量量化方法,其特征在于,根据所述第二张量的所属分段,对所述第二张量进行量化,包括:如果所述第二张量的所属分段为第一段,则根据以下公式对所述第二张量x
s
进行量化:x
pi
=round(x
s
);其中,round为四舍五入函数,x
pi
为量化后的第二张量;或者,如果所述第二张量的所属分段为第二段,则根据以下公式对所述第二张量x
s
进行量化:x
pi
=round(x
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。