卷积神经网络加速器制造技术

技术编号:29979459 阅读:10 留言:0更新日期:2021-09-08 10:10
本申请提供一种卷积神经网络加速器,卷积加速模块的并行输出通道数与池化加速模块的并行输入通道数相等,实现卷积神经网络加速器针对卷积层和池化层的层间流水化运算,以及通过设计卷积加速模块的5个单元,实现了卷积神经网络加速器对卷积层的5层流水化运算,提高卷积神经网络加速器对卷积神经网络的运算速度。度。度。

【技术实现步骤摘要】
卷积神经网络加速器


[0001]本申请涉及卷积神经网络加速器
,涉及一种卷积神经网络加速器。

技术介绍

[0002]随着人工智能技术的飞速发展,出现了以卷积神经网络(Convolutional Neural Network,CNN)为基础的深度学习技术。局部感知和权值共享的结构使得CNN能够更好地进行特征提取,从而降低网络模型的复杂度。
[0003]在变电站中,诸多设备需要使用图像处理技术进行信息采集、数据处理等,传统的图像处理方法通常采用人工特征提取,难以进行大规模的快速应用,CNN技术的引入极大的增强了图像处理技术在变电站中的应用。
[0004]然而随着CNN网络性能的增强,CNN网络所需要的计算力也越来越高,为了加速对卷积神经网络的运算,有必要提供一种卷积神经网络加速器。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种卷积神经网络加速器。
[0006]一种卷积神经网络加速器,包括:卷积加速模块和池化加速模块;所述卷积加速模块的并行输出通道数与所述池化加速模块的并行输入通道数相等;所述卷积加速模块包括卷积行缓存单元、卷积滑窗单元、卷积计算单元、数据累加单元和卷积输出单元;
[0007]所述卷积行缓存单元,用于对具有第一行数、第一列数和多输入通道的待卷积输入数据进行读取,得到具有第二行数、所述第一列数和所述多输入通道的待卷积缓存数据,对所述待卷积缓存数据进行行缓存;其中,所述第二行数与卷积核的行数一致;
[0008]所述卷积滑窗单元,用于从所述待卷积缓存数据中,提取具有所述第二行数、第二列数和所述多输入通道的待卷积特征数据;所述第二列数与所述卷积核的列数一致;
[0009]所述卷积计算单元,用于将所述待卷积特征数据与预设组数的卷积核进行通道对应的卷积计算,得到所述预设组数的卷积计算结果,将所述预设组数的卷积计算结果传输至数据累加单元;其中,每组卷积核所包括的卷积核的数量与所述输入通道的数量一致,所述预设组数与所述卷积加速模块的并行输出通道数一致;
[0010]所述数据累加单元,用于对同组的卷积计算结果进行累加,得到对应于所述待卷积特征数据的所述预设组数的卷积输出数据,并将对应于所述待卷积特征数据的所述预设组数的卷积输出数据写入所述卷积输出单元;
[0011]所述卷积输出单元,用于在基于对应于所述待卷积特征数据的所述预设组数的卷积输出数据,形成对应于所述待卷积输入数据的所述预设组数的卷积输出数据的情况下,将对应于所述待卷积输入数据的所述预设组数的卷积输出数据输入至所述池化加速模块;
[0012]所述池化加速模块,用于对对应于所述待卷积输入数据的所述预设组数的卷积输出数据进行池化处理。
[0013]在其中一个实施例中,所述池化加速模块包括池化行缓存单元、池化滑窗单元、池
化计算单元和池化输出单元;
[0014]所述池化行缓存单元,用于对所述卷积输出单元输出的对应于所述待卷积输入数据的所述预设组数的卷积输出数据进行读取,得到具有第三行数和第三列数的待池化缓存数据,对所述待池化缓存数据进行行缓存;其中,所述第三行数与池化核的行数一致;
[0015]所述池化滑窗单元,用于从所述待池化缓存数据汇中提取具有所述第三行数和第四列数的待池化特征数据;其中,所述第四列数与所述池化核的列数一致;
[0016]所述池化计算单元,用于利用池化核对所述待池化特征数据进行池化计算,得到池化计算结果;
[0017]所述池化输出单元,用于将所述池化计算结果作为池化输出数据进行输出。
[0018]在其中一个实施例中,
[0019]所述卷积加速模块和所述池化加速模块部署在卷积神经网络加速器的可编程逻辑部分,所述卷积神经网络加速器还包括处理系统部分;所述处理系统部分,用于向所述卷积行缓存单元传输所述待卷积输入数据;
[0020]所述处理系统与所述卷积行缓存单元之间的并行数据传输通道数小于所述卷积加速模块的并行输入通道数,且所述并行数据传输通道数与所述并行输入通道数具有整数倍关系。
[0021]在其中一个实施例中,卷积神经网络的各网络层的权重、偏置和输入数据被进行舍弃高位保留低位的溢出处理;所述各网络层的输出数据被进行定点数据的最大值替代的溢出处理;所述各网络层的中间处理数据被进行位宽扩大的溢出处理。
[0022]在其中一个实施例中,所述各网络层的权重和偏置被进行舍弃高位保留低位的溢出处理之前,还被进行第一预处理;所述第一预处理为:用定点数据的最大值替代大于定点数据范围的权重或偏置。
[0023]在其中一个实施例中,所述各网络层的输入数据被进行舍弃高位保留低位的溢出处理之前,还被进行第二预处理;所述第二预处理为:对所述输入数据进行归一化处理并将归一化处理后的输入数据映射至特定数据区间;所述特定数据区间是根据定点数据的整数部分位宽和量化因子确定的。
[0024]在其中一个实施例中,所述定点数据的位宽和量化因子是对所述卷积神经网络中的数据进行定点化处理并对定点化处理后的数据进行误差统计确定的。
[0025]在其中一个实施例中,所述卷积输出单元为FIFO单元;
[0026]所述卷积行缓存单元,用于在所述FIFO单元处于非空状态时,对所述待卷积输入数据进行读取。
[0027]在其中一个实施例中,所述卷积行缓存单元每进行一次待卷积输入数据的读取,则对所述FIFO单元进行与所述FIFO单元的深度对应次数的写入。
[0028]在其中一个实施例中,
[0029]所述数据累加单元,用于在所述FIFO单元处于非满状态时,对所述FIFO单元进行数据写入。
[0030]上述卷积神经网络加速器,包括卷积加速模块和池化加速模块;所述卷积加速模块的并行输出通道数与所述池化加速模块的并行输入通道数相等,实现卷积神经网络加速器的层间流水化运算,提高卷积神经网络加速器对卷积神经网络的运算速度。
[0031]进一步地,所述卷积加速模块包括卷积行缓存单元、卷积滑窗单元、卷积计算单元、数据累加单元和卷积输出单元;所述卷积行缓存单元,用于对具有第一行数、第一列数和多输入通道的待卷积输入数据进行读取,得到具有第二行数、所述第一列数和所述多输入通道的待卷积缓存数据,对所述待卷积缓存数据进行行缓存;其中,所述第二行数与卷积核的行数一致;所述卷积滑窗单元,用于从所述待卷积缓存数据中,提取具有所述第二行数、第二列数和所述多输入通道的待卷积特征数据;所述第二列数与所述卷积核的列数一致;所述卷积计算单元,用于将所述待卷积特征数据与预设组数的卷积核进行通道对应的卷积计算,得到所述预设组数的卷积计算结果,将所述预设组数的卷积计算结果传输至数据累加单元;其中,每组卷积核所包括的卷积核的数量与所述输入通道的数量一致,所述预设组数与所述卷积加速模块的并行输出通道数一致;所述数据累加单元,用于对同组的卷积计算结果进行累加,得到对应于所述待卷积特征数据的所述预设组数的卷积输出数据,并将对应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种卷积神经网络加速器,其特征在于,包括:卷积加速模块和池化加速模块;所述卷积加速模块的并行输出通道数与所述池化加速模块的并行输入通道数相等;所述卷积加速模块包括卷积行缓存单元、卷积滑窗单元、卷积计算单元、数据累加单元和卷积输出单元;所述卷积行缓存单元,用于对具有第一行数、第一列数和多输入通道的待卷积输入数据进行读取,得到具有第二行数、所述第一列数和所述多输入通道的待卷积缓存数据,对所述待卷积缓存数据进行行缓存;其中,所述第二行数与卷积核的行数一致;所述卷积滑窗单元,用于从所述待卷积缓存数据中,提取具有所述第二行数、第二列数和所述多输入通道的待卷积特征数据;所述第二列数与所述卷积核的列数一致;所述卷积计算单元,用于将所述待卷积特征数据与预设组数的卷积核进行通道对应的卷积计算,得到所述预设组数的卷积计算结果,将所述预设组数的卷积计算结果传输至数据累加单元;其中,每组卷积核所包括的卷积核的数量与所述输入通道的数量一致,所述预设组数与所述卷积加速模块的并行输出通道数一致;所述数据累加单元,用于对同组的卷积计算结果进行累加,得到对应于所述待卷积特征数据的所述预设组数的卷积输出数据,并将对应于所述待卷积特征数据的所述预设组数的卷积输出数据写入所述卷积输出单元;所述卷积输出单元,用于在基于对应于所述待卷积特征数据的所述预设组数的卷积输出数据,形成对应于所述待卷积输入数据的所述预设组数的卷积输出数据的情况下,将对应于所述待卷积输入数据的所述预设组数的卷积输出数据输入至所述池化加速模块;所述池化加速模块,用于对对应于所述待卷积输入数据的所述预设组数的卷积输出数据进行池化处理。2.根据权利要求1所述的卷积神经网络加速器,其特征在于,所述池化加速模块包括池化行缓存单元、池化滑窗单元、池化计算单元和池化输出单元;所述池化行缓存单元,用于对所述卷积输出单元输出的对应于所述待卷积输入数据的所述预设组数的卷积输出数据进行读取,得到具有第三行数和第三列数的待池化缓存数据,对所述待池化缓存数据进行行缓存;其中,所述第三行数与池化核的行数一致;所述池化滑窗单元,用于从所述待池化缓存数据汇中提取具有所述第三行数和第四列数的待池化特征数据;其中,所述第四列数与所述池化核的列数一致;所述池化计算单元,用于利用池化核对所述待池化特征...

【专利技术属性】
技术研发人员:陈浩敏郭晓斌于力席禹
申请(专利权)人:南方电网数字电网研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1