【技术实现步骤摘要】
一种带新型卷积运算加速模块的卷积神经网络硬件加速器
本专利技术涉及电子信息以及深度学习
,尤其涉及一种带新型卷积运算加速模块的卷积神经网络硬件加速器。
技术介绍
近年来深度学习技术发展火热,尤其是基于猫脑视觉皮层神经细胞工作机制构建的带独特感受野结构的卷积神经网络在视觉应用领域取得了巨大的成功,比如CNN在大型的图片分类数据集ImageNet上取得了超过人眼的识别正确率。但是这种强大的算法在走向实际应用的过程中碰到很大的障碍,这是因为CNN能有用武之地的真实世界应用很多都是在计算资源少的移动端设备上实现,如带AI能力的智能手机和智慧安防摄像头,而如今最为出名的CNN网络ResNet-50,它由50层基本结构堆叠而成,每层基本结构包含大量的卷积运算,这样的计算密集型算法如果不加以改造或者不针对其特点设计专门的加速硬件,直接在移动端设备的CPU上实现,难以满足很多应用对实时性的要求。因此要真正让卷积神经网络在移动端设备运行起来,目前有两种途径达到这个目的。一种途径就是对网络进行轻量化改造,让它的网络结构更简单,运算量更少,比如模型压缩技术中的剪枝技术,参数量化技 ...
【技术保护点】
1.一种带新型卷积运算加速模块的卷积神经网络硬件加速器,其特征在于,包括:运算进程管理模块,接受主控模块的控制,用于管理卷积神经网络中单层卷积运算的进程;特征图缓存模块,用于缓存卷积运算的输入特征图与输出特征图;新型卷积运算加速模块,包括了输入特征图预取模块、乘积模块、输出特征图存取模块和累加模块,用于对卷积运算进行加速计算;参数表模块,接受主控模块的配置,用于提供当前层卷积运算的卷积核参数。
【技术特征摘要】
1.一种带新型卷积运算加速模块的卷积神经网络硬件加速器,其特征在于,包括:运算进程管理模块,接受主控模块的控制,用于管理卷积神经网络中单层卷积运算的进程;特征图缓存模块,用于缓存卷积运算的输入特征图与输出特征图;新型卷积运算加速模块,包括了输入特征图预取模块、乘积模块、输出特征图存取模块和累加模块,用于对卷积运算进行加速计算;参数表模块,接受主控模块的配置,用于提供当前层卷积运算的卷积核参数。2.根据权利要求1所述的带新型卷积运算加速模块的卷积神经网络硬件加速器,其特征在于,所述新型卷积运算加速模块包括:输入特征图预取模块,从特征图缓存模块读取当前卷积运算需要的输入特征图像素点;乘积模块,将输入特征图像素点与对应卷积核参数相乘;输出特征图存取模块,先从特征图缓存读取当前卷积运算涉及的所有输出特征图像素点已有的中间结果,待累加模块完成工作后,把当前卷积运算涉及的所有输出特征图像素点新的中间结果写回特征图缓存;累加模块,完成乘积模块的运算结果与输出特征图存取模块读取的输出特征图像素点已有中间结果的累加工作。3.根据权利要求2所述的带新型卷积运算加速模块的卷积神经网络硬件加速器,其特征在于,所述输入特征图预取模块读取卷积神经网络第一层的输入特征图像素点时是从能够提供图像视频数据的外部模块获取。4.根据权利要求2所述的带新型卷积运算加速模块的卷积神经网络硬件加速器,其特征在于,所述乘积模块将输入特征图像素点与对应卷积核参数相乘的同时进行面向输出特征图多个像素点的多个卷积运算中的单个乘法运算,运算结果送至累加模块。5.根据权利要求4所述的带新型卷积运算加速模块的卷积神经网络硬件加速器,其特征在于,所述...
【专利技术属性】
技术研发人员:张萌,朱振宇,贾贤飞,柳飞扬,
申请(专利权)人:东南大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。