【技术实现步骤摘要】
一种卷积神经网络的建立装置及方法
本专利技术涉及嵌入式系统的大数据量深度学习计算领域,特别涉及一种采用现场可编程门阵列(FPGA)上实现卷积神经网络的建立装置及方法。
技术介绍
卷积神经网络(CNN)是近年发展起来,并引起广泛重视的一种高效识别方法。特别是在模式分类领域,CNN由于避免了对特征图的复杂前期预处理,可以直接输入原始特征图,并得到最终的特征图的分类结果,因而得到了更为广泛的应用。由于CNN涉及运算的特征图的数据量大且运算复杂,一般都采用大型计算机编程实现,这会增加实现的难度及费用。
技术实现思路
有鉴于此,本专利技术实施例提供一种CNN的建立装置,该装置采用FPGA简单实现CNN的特征图的卷积神经运算。本专利技术实施例还提供一种CNN的建立方法,该方法采用FPGA简单实现CNN的特征图的卷积神经运算。本专利技术实施例是这样实现的:一种卷积神经网络的建立装置,在现场可编程门阵列FPGA设置2~64个卷积计算模块,分别处理不同的输出通道;在每个卷积计算模块中包括:特征图输入缓存单元、特征图加载单元、卷积运算单元、权值缓存单元、权值加载单元、全输入通道累加单元、 ...
【技术保护点】
1.一种卷积神经网络的建立装置,其特征在于,在现场可编程门阵列FPGA设置2~64个卷积计算模块,分别处理不同的输出通道;在每个卷积计算模块中包括:特征图输入缓存单元、特征图加载单元、卷积运算单元、权值缓存单元、权值加载单元、全输入通道累加单元、像素累加单元及特征图输出缓存单元;其中,特征图输入缓存单元,用于缓存特征图,将2~32个输入通道的1个像素的特征图数据发送给特征图加载单元;特征图加载单元,用于接收2~32个输入通道的1个像素的特征图数据,并寄存;权值缓存单元,用于缓存2~32个输入通道对应的权值,并行发送给权值加载单元;权值加载单元,用于并行接收对应2~32个输入 ...
【技术特征摘要】
1.一种卷积神经网络的建立装置,其特征在于,在现场可编程门阵列FPGA设置2~64个卷积计算模块,分别处理不同的输出通道;在每个卷积计算模块中包括:特征图输入缓存单元、特征图加载单元、卷积运算单元、权值缓存单元、权值加载单元、全输入通道累加单元、像素累加单元及特征图输出缓存单元;其中,特征图输入缓存单元,用于缓存特征图,将2~32个输入通道的1个像素的特征图数据发送给特征图加载单元;特征图加载单元,用于接收2~32个输入通道的1个像素的特征图数据,并寄存;权值缓存单元,用于缓存2~32个输入通道对应的权值,并行发送给权值加载单元;权值加载单元,用于并行接收对应2~32个输入通道的权值,并寄存;卷积运算单元,用于根据从特征图加载单元接收的2~32个输入通道的1个像素的特征图数据,及从权值加载单元接收2~32个输入通道的对应权值,并行进行2~32个输入通道的1个像素的特征图数据的卷积累加运算,得到累加后的卷积值;全输入通道累加单元,用于累加所有输入通道的卷积值,发送给像素累加单元;像素累加单元,用于对全输入通道累加单元累加的所有输入通道的卷积值进行像素累加,最终得到经过卷积神经运算的特征图;特征图输出缓存单元,用于接收经过卷积神经运算的特征图,并进行缓存。2.如权利要求1所述的装置,其特征在于,所述特征图输入缓存单元采用在FPGA上的块随机存取存储器BRAM;所述特征图加载单元采用FPGA上的reg类型的寄存器实现。3.如权利要求1所述的装置,其特征在于,...
【专利技术属性】
技术研发人员:杨志明,陈巍巍,杨超,
申请(专利权)人:深思考人工智能机器人科技北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。