一种基于PSoC的卷积神经网络加速器制造技术

技术编号:19935237 阅读:32 留言:0更新日期:2018-12-29 04:55
本专利公开了一种基于PSoC器件构建的卷积神经网络加速器,包括片外存储器、CPU、特征图输入存储器、特征图输出存储器、偏置存储器、权重存储器、直接内存存取与神经元数目相同的计算单元,所述计算单元包括先入先出队列、状态机、数据选择器、平均值池化模块、最大值池化模块、乘加计算模块、激活函数模块,所构成的乘加计算模块内计算是并行执行的,可用于多种架构的卷积神经网络系统。本发明专利技术充分利用片上可编程系统(PSoC,Programmable System on Chip)器件中可编程部分实现计算量大,并行性高的卷积神经网络计算部分,利用CPU实现串行算法及状态控制。

【技术实现步骤摘要】
一种基于PSoC的卷积神经网络加速器
本专利技术涉及卷积神经网络结构技术,特别涉及一种基于PSoC的卷积神经网络加速器。
技术介绍
卷积神经网络以局部权重共享在图像处理具有独特的优越性,其布局更接近实际的生物神经网络、共享权重降低了神经网络的复杂度,降低了神经网络的计算量。目前卷积神经网络在视频监控、机器视觉、模式识别、图像搜索等领域广泛应用。但是卷积网络硬件实现需要大量硬件资源,带宽利用率低及数据复用低等问题。卷积神经网络中需要支持不同大小的卷积操作,池化操作及全连接操作,同时许多卷积神经网络应用中,通常包含图片处理部分,因此FPGA(现场可编程门阵列,FieldProgrammableGateArray)纯粹的硬件逻辑实现限制了扩展性。对于卷积神经网络的实现来说,硬件实现的网络是固定的,带宽利用率低,无法扩展支持其他结构的卷积神经网络。PSoC器件具有硬件可编程部分以及软件编程的特性,被认为是实现卷积神经网络合适的平台。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提供一种基于PSoC的卷积神经网络加速器,将整个神经网络加速器硬件可编程部分可简化为乘加计算模块、激活函本文档来自技高网...

【技术保护点】
1.一种基于PSoC的卷积神经网络加速器,其特征在于,包括:片外存储器、CPU、特征图输入存储器、特征图输出存储器、偏置存储器、权重存储器、直接内存存取DMA和与神经元数目相同的计算单元,所述直接内存存储DMA在CPU的控制下从片外存储器读取传输到特征图输入存储器、偏置存储器和权重存储器,或将特征图数据存储器的数据写回到片外存储器,CPU需要控制输入特征图、偏置、权重、输出特征图在片外存储器的存储位置,以及多层的卷积神经网络的参数传输,以适应多种架构的神经网络。

【技术特征摘要】
1.一种基于PSoC的卷积神经网络加速器,其特征在于,包括:片外存储器、CPU、特征图输入存储器、特征图输出存储器、偏置存储器、权重存储器、直接内存存取DMA和与神经元数目相同的计算单元,所述直接内存存储DMA在CPU的控制下从片外存储器读取传输到特征图输入存储器、偏置存储器和权重存储器,或将特征图数据存储器的数据写回到片外存储器,CPU需要控制输入特征图、偏置、权重、输出特征图在片外存储器的存储位置,以及多层的卷积神经网络的参数传输,以适应多种架构的神经网络。2.根据权利要求1所述的一种基于PSoC的卷积神经网络加速器,其特征在于,所述计算单元包括先入先出队列、状态机、第一数据选择器、第二数据选择器、平均值池化模块、最大值池化模块、乘加计算模块和激活函数模块,其中所述第一数据选择器与特征图输入存储器通信,输入特征图输入数据经过第一数据选择器输入到平均值池化模块、最大值池化模块、乘加计算模块和激活函数模块,所述第二数据选择器与特征图输出存储器通信,平均值池化模块、最大值池化模块和乘加计算模块的输出结果经...

【专利技术属性】
技术研发人员:熊晓明李子聪曾宇航胡湘宏
申请(专利权)人:广东工业大学佛山芯珠微电子有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1