【技术实现步骤摘要】
一种面向神经网络稀疏特征的数据去零编码及封装方法
本专利技术属于信息处理
,具体涉及一种数据去零编码及封装方法。
技术介绍
受到神经网络结构模型的影响,在计算中存在大量的激活操作,目前最常见的激活函数为RELU函数,而通过RELU函数激活后的输出数据中有着伴随着大量的零值的稀疏化特征。传统的卷积神经网路加速器在计算过程中往往会伴随着高达40%的零值分布情况,零值的分布在神经网络计算过程中十分普遍。神经网络加速器的带宽限制是制约其高效完成计算任务的瓶颈,计算过程往往伴随着大量的数据,这些数据直接进行传输会消耗大量的传输时间。但是由于这些数据中的稀疏化特征,直接传输原始数据时接口传输了大量的无效零值,对于提升计算的性能是十分不利的。在神经网络加速器中,由于硬件模型操作造成的这种大量的零值,在计算和数据传输过程中会耗费大量的计算资源和传输带宽处理这些零值的问题。这种零值的问题极大制约了神经网络加速器性能的提升,造成资源尤其是传输带宽的极大浪费。深度卷积神经网络模型具有模型深度高、层次复杂、数据量级大、 ...
【技术保护点】
1.一种面向神经网络稀疏特征的数据去零编码及封装方法,其特征在于,包括以下步骤:/n步骤1:神经网络加速器的输出特征图具有三维结构;将输出特征图三维结构中的任意两个维度定义为数据的二维位置信息,二维位置信息之外第三个维度表示的通道数为C;设定原始二进制数据位宽为N,N=2
【技术特征摘要】
1.一种面向神经网络稀疏特征的数据去零编码及封装方法,其特征在于,包括以下步骤:
步骤1:神经网络加速器的输出特征图具有三维结构;将输出特征图三维结构中的任意两个维度定义为数据的二维位置信息,二维位置信息之外第三个维度表示的通道数为C;设定原始二进制数据位宽为N,N=2n,n=1,2,3……;C=p*N,p=1,2,3…;
定义数据存储传输单元:任意一个数据存储传输单元中包含C个原始数据,同一个数据存储传输单元中的C个原始数据的二维位置信息相同,且这C个原始数据分布在第三个维度的C个通道上,每个通道一个原始数据;
步骤2:将数据存储传输单元划分为连续的p个数据去零单元,数据去零单元中的数据个数为N;
步骤3:将数据存储传输单元的第一个数据去零单元中的非零值数据标记为1,零值数据标记为0,由连续N个标记形成一个位宽为N的二进制数据,记为掩码信息Mask1;将掩码信息Mask1和数据去零单元中的非零值数据组成结构体MaskData1,结构体MaskData1中掩码信息Mask1排第一位,数据去零单元中的非零值数据按照在数据去零单元中顺序依次排列在掩码信息Mask1后面;
步骤4:将数据存储传输单元的其余数据去零单元按照步骤3的方法进行处理,得到p个结构体MaskData,将这p个结构体MaskData按照数据去零单元在数据存储传输单元中的顺序依次排列,记为总结构体pMaskData;完成第一级编码;
步骤5:设定神经网络加速器的数据传输位宽为M,M=2m,m=1,2,3……,m>n,m/n=q;将总结构体pMaskData按每M...
【专利技术属性】
技术研发人员:张萌,王党辉,张盛兵,朱挺,李楚曦,丁汇,姚腾腾,王淼,
申请(专利权)人:西北工业大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。