【技术实现步骤摘要】
卷积神经网络大核池化的方法和装置
[0001]本专利技术涉及计算机视觉和人工智能
,具体为卷积神经网络池化层的处理,提出了一种大核池化的方法和装置。
技术介绍
[0002]随着人工智能领域的高速发展,卷积神经网络(convolutional neural networks,CNN)被更多的应用于图像分类和图像识别等领域。
[0003]卷积神经网络通常包含多组的卷积层、池化层(pooling layer)等神经网络层。卷积层能够提取数据的局部特征,而池化层用于减少参数量以及神经网络的运算。池化层通常包含两种运算:最大值池化和平均值池化运算。
[0004]目前,产业界正在加速AI芯片的落地应用,不同厂商推出的AI芯片软硬件架构也是多种多样,一种能够平衡算力、功耗、通用性、面积等因素的AI芯片能够更好的占领应用市场。
[0005]现有的AI芯片包括卷积核或池化核的硬件结构主要分为两大类。第一类采用定制指令集形式的架构,通过设计最小的硬件单元(如卷积运算核、池化运算核),硬件运算单元在指令格式下进行计算 ...
【技术保护点】
【技术特征摘要】
1.一种卷积神经网络大核池化的方法,其特征在于,所述方法包括:池化输出映射到输入的HBLK/WBLK分块方式,包括:对H/W方向维度进行池化核kh/kw长度特征数据的运算,将该方向的临时运算结果保存在内部缓存SRAM中,以最大输出临时数据量的方式进行存储,当超过内部缓存尺寸范围时,将进行cblk的H/W方向分块;W、H方向代表特征图宽和高方向;kw/kh分别为W/H方向池化核的尺寸。2.如权利要求1所述的卷积神经网络大核池化的方法,其特征在于,所述池化输出映射到输入的HBLK/WBLK分块方式还包括:池化核运算的范围是可裁剪的,包括W、H、C方向的裁剪,当内部HBLK/WBLK控制单元根据内部缓存和当前池化参数判断需要分块时,池化运算装置的每个HBLK/WBLK输入单元信息是硬件装置根据输出参数和当前块动态坐标信息进行自动运算的。3.如权利要求1所述的卷积神经网络大核池化的方法,其特征在于,所述方法还包括:当池化核的尺寸大于硬件装置支持最大的范围[Kw_max,Kh_max]时,定义一种命令CMD多次拆分的方式,通过配置各个拆分核的配置信息,多次运算后,组合地通过部分核结果运算最终池化运算结果,以支持kw>Kw_max或kh>Kh_max的池化核;Kw_max/Kh_max分别为当前池化硬件装置在W/H方向支持池化核的最大长度。4.如权利要求1所述的卷积神经网络大核池化的方法,其特征在于,所述方法还包括:池化张量特征数据在外部存储,包括:张量特征数据在C方向维度进行cblk_size大小的分割;所述C方向维度为channel维度。5.如权利要求4所述的卷积神经网络大核池化的方法,其特征在于,当前cblk(n)的数据按照W
·
(H
·
csize)的方式进行存储,在cblk(n)中,数据按照h(m)
·
cblk_size的方式连续存储一个W平面,并连续的保存至当前cblk(n)的最后一个W平面,紧接着存储下一个cblk(n+1)块的张量数据;cblk(n)代表C方向按照cblk_size进行分割的块尺寸(n>=1)。6.如权利要求4或5所述的卷积神经网络大核池化的方法,其特征在于...
【专利技术属性】
技术研发人员:郑旭标,
申请(专利权)人:珠海亿智电子科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。