【技术实现步骤摘要】
一种卷积神经网络处理方法及装置
[0001]本专利技术涉及卷积神经网络领域,尤其涉及一种卷积神经网络处理方法及装置。
技术介绍
[0002]卷积运算是由乘和加两种基本运算组成的,基本上所有卷积计算方法都能拆解成这两种运算的组合,所以任何形式的卷积均可拆成乘和加的小单元来并行实现,在保证完备性的前提下提高并行度;目前的卷积形式逐渐多样化,和最基础的的卷积形式有很大的差别,而现有的卷积神经网络计算方法多只针对一种卷积形式,也就意味着只有卷积核形式确定时,计算才有比较高的效率,对于不规则的卷积形式在进行卷积运算的效率低下。无法充分利用卷积运算可以并行实现的特点。
[0003]比如脉动阵列是近年来常见的卷积神经网络加速阵列,其比较擅长实现步长为1的卷积,当步长改变时其原始流程会带来大量的冗余计算,而且其架构适合标准的稠密卷积,不适合处理稀疏卷积,如果卷积的形式不是稠密的,那么其在脉动阵列中数据无法连续传递,就无法高效地实现其他的卷积形式。
[0004]而GPU作为当前最常见的深度学习加速设备,它是利用多计算单元并行计 ...
【技术保护点】
【技术特征摘要】
1.一种卷积神经网络处理方法,其特征在于,包括:在对输入特征图的第一特征层进行第一轮计算过程中,基于与所述第一轮计算过程对应的查找表,确定所述第一轮计算过程的每次计算结果在输出特征图中的存储位置;基于确定出的存储位置,将每次计算结果进行对应存储。2.根据权利要求1所述的处理方法,其特征在于,所述查找表包括:第一输入参数、第二输入参数、与第一输入参数和第二输入参数这两者建立对应关系的输出参数;其中,所述第一输入参数包括所述输入特征图的第一特征层的初始计算坐标;所述第二输入参数包括卷积核序号、卷积核参数;以及,通过如下方式确定所述第一特征层进行第一轮计算过程中,首次计算结果的存储位置:基于所述第一输入参数和所述第二输入参数确定所述输出参数;所述输出参数用于指示首次计算结果的存储位置。3.根据权利要求2所述的处理方法,其特征在于,所述查找表还包括:步长;以及,通过如下方式确定第一特征层进行第一轮计算过程中除首次计算结果外的其它计算结果的存储位置:基于所述首次计算结果的存储位置和所述步长,确定其他计算结果的存储位置。4.根据权利要求2所述的处理方法,其特征在于,所述卷积核序号指示卷积核参数信息,所述卷积核参数包括:初始位置中心、卷积移动周期、卷积核中心、卷积核偏移量;所述初始位置中心用于指示卷积核中心在输入特征图上的初始位置;所述卷积移动周期用于指示卷积核在输入特征图上分别在x,y方向上移动;所述卷积核偏移量包括相对于所述初始位置中心的偏移量。5.根据权利要求1所述的处理方法,其特征在于,所述输入特征图包括至少两个特征层,不同特征层之间分别进行计算,以及,所述方法还包括:筛选出与...
【专利技术属性】
技术研发人员:李森,雷亚雄,赵志达,高曰超,
申请(专利权)人:北京思丰可科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。