当前位置: 首页 > 专利查询>东南大学专利>正文

一种带新型卷积运算加速模块的卷积神经网络硬件加速器制造技术

技术编号:22364666 阅读:57 留言:0更新日期:2019-10-23 04:52
本发明专利技术公开了一种带新型卷积运算加速模块的卷积神经网络硬件加速器,包括运算进程管理模块;参数表模块;特征图缓存模块;新型卷积运算加速模块;新型卷积运算加速模块包括:输入特征图预取模块,从特征图缓存读取输入像素点;乘积模块,将输入像素点与卷积核权重相乘;输出特征图存取模块,负责从特征图缓存读取输出像素点旧中间结果,把输出像素点新中间结果写回特征图缓存;累加模块,完成乘积模块的运算结果与输出像素点旧中间结果的累加工作。本发明专利技术的一种带新型卷积运算加速模块的卷积神经网络硬件加速器,可以对卷积神经网络中的卷积运算过程进行加速,在很多有着低数据传输带宽,低功耗和逻辑资源少特点的移动端设备中有很大的应用价值。

【技术实现步骤摘要】
一种带新型卷积运算加速模块的卷积神经网络硬件加速器
本专利技术涉及电子信息以及深度学习
,尤其涉及一种带新型卷积运算加速模块的卷积神经网络硬件加速器。
技术介绍
近年来深度学习技术发展火热,尤其是基于猫脑视觉皮层神经细胞工作机制构建的带独特感受野结构的卷积神经网络在视觉应用领域取得了巨大的成功,比如CNN在大型的图片分类数据集ImageNet上取得了超过人眼的识别正确率。但是这种强大的算法在走向实际应用的过程中碰到很大的障碍,这是因为CNN能有用武之地的真实世界应用很多都是在计算资源少的移动端设备上实现,如带AI能力的智能手机和智慧安防摄像头,而如今最为出名的CNN网络ResNet-50,它由50层基本结构堆叠而成,每层基本结构包含大量的卷积运算,这样的计算密集型算法如果不加以改造或者不针对其特点设计专门的加速硬件,直接在移动端设备的CPU上实现,难以满足很多应用对实时性的要求。因此要真正让卷积神经网络在移动端设备运行起来,目前有两种途径达到这个目的。一种途径就是对网络进行轻量化改造,让它的网络结构更简单,运算量更少,比如模型压缩技术中的剪枝技术,参数量化技术中的二值网络XNO本文档来自技高网...

【技术保护点】
1.一种带新型卷积运算加速模块的卷积神经网络硬件加速器,其特征在于,包括:运算进程管理模块,接受主控模块的控制,用于管理卷积神经网络中单层卷积运算的进程;特征图缓存模块,用于缓存卷积运算的输入特征图与输出特征图;新型卷积运算加速模块,包括了输入特征图预取模块、乘积模块、输出特征图存取模块和累加模块,用于对卷积运算进行加速计算;参数表模块,接受主控模块的配置,用于提供当前层卷积运算的卷积核参数。

【技术特征摘要】
1.一种带新型卷积运算加速模块的卷积神经网络硬件加速器,其特征在于,包括:运算进程管理模块,接受主控模块的控制,用于管理卷积神经网络中单层卷积运算的进程;特征图缓存模块,用于缓存卷积运算的输入特征图与输出特征图;新型卷积运算加速模块,包括了输入特征图预取模块、乘积模块、输出特征图存取模块和累加模块,用于对卷积运算进行加速计算;参数表模块,接受主控模块的配置,用于提供当前层卷积运算的卷积核参数。2.根据权利要求1所述的带新型卷积运算加速模块的卷积神经网络硬件加速器,其特征在于,所述新型卷积运算加速模块包括:输入特征图预取模块,从特征图缓存模块读取当前卷积运算需要的输入特征图像素点;乘积模块,将输入特征图像素点与对应卷积核参数相乘;输出特征图存取模块,先从特征图缓存读取当前卷积运算涉及的所有输出特征图像素点已有的中间结果,待累加模块完成工作后,把当前卷积运算涉及的所有输出特征图像素点新的中间结果写回特征图缓存;累加模块,完成乘积模块的运算结果与输出特征图存取模块读取的输出特征图像素点已有中间结果的累加工作。3.根据权利要求2所述的带新型卷积运算加速模块的卷积神经网络硬件加速器,其特征在于,所述输入特征图预取模块读取卷积神经网络第一层的输入特征图像素点时是从能够提供图像视频数据的外部模块获取。4.根据权利要求2所述的带新型卷积运算加速模块的卷积神经网络硬件加速器,其特征在于,所述乘积模块将输入特征图像素点与对应卷积核参数相乘的同时进行面向输出特征图多个像素点的多个卷积运算中的单个乘法运算,运算结果送至累加模块。5.根据权利要求4所述的带新型卷积运算加速模块的卷积神经网络硬件加速器,其特征在于,所述...

【专利技术属性】
技术研发人员:张萌朱振宇贾贤飞柳飞扬
申请(专利权)人:东南大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1