针对卷积神经网络硬件加速器的调试模块制造技术

技术编号：18290033 阅读：46 留言：0更新日期：2018-06-24 04:58

本发明专利技术公开了一种针对卷积神经网络硬件加速器的调试模块，目的是增大定位准确性和降低调试难度。本发明专利技术由DRAM即动态随机存取存储器、FIFO即先进先出队列、读DRAM计数模块、写DRAM计数模块和数据对齐模块组成；写DRAM计数模块和读DRAM计数模块均是二进制计数器，DRAM是拥有写端口和读端口的双端口DRAM；数据对齐模块对读DRAM数据进行拼接和补零操作，得到写FIFO数据；FIFO是读写异步FIFO。DRAM的数据位宽和深度根据所需观测数据信号的位宽和数量设置，FIFO的数据位宽根据DDR的数据位宽设置，数据深度根据写FIFO数据的数量设置。本发明专利技术能够更加准确方便地定位问题位置，既增大定位准确性又降低调试难度。

全部详细技术资料下载

【技术实现步骤摘要】
针对卷积神经网络硬件加速器的调试模块
本专利技术涉及计算机领域的硬件加速器调试模块，尤其指一种针对卷积神经网络的硬件加速器调试模块。
技术介绍
卷积神经网络CNN（ConvolutionalNeuralNetworks）受神经科学研究的启发，经过长达20多年的演变，CNN在计算机视觉、人工智能领域越来越突出。CNN已经广泛用于图像识别，因为它能模仿生物视觉神经的行为获得很高识别准确率。一个典型CNN由两部分组成：特征提取器和分类器。特征提取器过滤输入图像，产生表示图像不同特征（这些特征可能包括拐角，线，圆弧等，对位置和形变不敏感）的低维向量。向量送入分类器（通常基于传统的人工神经网络），得到向量对应的输入图像属于某个类别（不同的分类任务有不同的类型集合，如人脸识别任务中，每个人都代表一个类别）的可能性。CNN作为一种前馈网络结构，网络层之间具有高度的独立性：各层网络计算独立，层间无数据反馈。因此，CNN是一种高度并行的网络结构。但通用处理器的为执行逻辑处理和事务处理而优化的特性并不适合用来挖掘CNN的并行性，基于软件方式的CNN神经网络在实时性和功耗方面都不能满足应用的需求。为了充分挖掘卷积神经网络固有的并行性，越来越多的研究者开始采用现场可编程门阵列FPGA（FieldProgrammableGateArray）开发基于CNN神经网络的应用。FPGA作为一种可编程器件，具有计算资源丰富、灵活可配、开发周期短、高性能等优点。目前广泛采用的FPGA设计的CNN加速器（即卷积神经网络硬件加速器）的结构如图1所示，整个加速器主要由四个部分组成，PCIE(Peri...
针对卷积神经网络硬件加速器的调试模块

【技术保护点】
1.一种针对卷积神经网络硬件加速器的调试模块，其特征在于针对卷积神经网络硬件加速器的调试模块由DRAM即动态随机存取存储器、FIFO即先进先出队列、读DRAM计数模块、写DRAM计数模块和数据对齐模块组成；写DRAM计数模块是一个二进制计数器，写DRAM计数模块与传输控制模块、DRAM相连，它从传输控制模块接收写DRAM数据有效信号，当写DRAM数据有效信号有效时，写DRAM计数模块对写地址信号进行加一，并置写使能信号、第一使能信号有效，将写地址信号、写是能信号和第一使能信号发送给DRAM；所述传输控制模块为被调试的卷积神经网络硬件加速器中的传输控制模块；DRAM是一个双端口DRAM，拥有一个写端口和一个读端口；DRAM与传输控制模块、写DRAM计数模块、读DRAM计数模块以及数据对齐模块相连；DRAM从传输控制模块接收写DRAM数据，从写DRAM计数模块接收写地址信号、写使能信号、第一使能信号，当写使能信号和第一使能信号都有效时，DRAM将写DRAM数据写入写地址信号对应的地址中；DRAM从读DRAM计数模块接收第二使能信号、读地址信号，当第二使能信号有效时，DRAM将读地址信号对应...

【技术特征摘要】
1.一种针对卷积神经网络硬件加速器的调试模块，其特征在于针对卷积神经网络硬件加速器的调试模块由DRAM即动态随机存取存储器、FIFO即先进先出队列、读DRAM计数模块、写DRAM计数模块和数据对齐模块组成；写DRAM计数模块是一个二进制计数器，写DRAM计数模块与传输控制模块、DRAM相连，它从传输控制模块接收写DRAM数据有效信号，当写DRAM数据有效信号有效时，写DRAM计数模块对写地址信号进行加一，并置写使能信号、第一使能信号有效，将写地址信号、写是能信号和第一使能信号发送给DRAM；所述传输控制模块为被调试的卷积神经网络硬件加速器中的传输控制模块；DRAM是一个双端口DRAM，拥有一个写端口和一个读端口；DRAM与传输控制模块、写DRAM计数模块、读DRAM计数模块以及数据对齐模块相连；DRAM从传输控制模块接收写DRAM数据，从写DRAM计数模块接收写地址信号、写使能信号、第一使能信号，当写使能信号和第一使能信号都有效时，DRAM将写DRAM数据写入写地址信号对应的地址中；DRAM从读DRAM计数模块接收第二使能信号、读地址信号，当第二使能信号有效时，DRAM将读地址信号对应地址中的数据传输到数据对齐模块；DRAM数据位宽和深度根据观测数据信号的位宽和数量设置；读DRAM计数模块是一个二进制计数器，读DRAM计数模块与传输控制模块、DRAM、FIFO相连，它从传输控制模块接收计算完成信号，向DRAM传输读地址信号和第二使能信号，向FIFO传输读DRAM数据有效信号；当计算完成信号有效时，置第二使能信号为有效，对读地址信号进行加一并传给DRAM，同时，置读DRAM数据有效信号有效，并将读DRAM数据有效信号发送给FIFO，读DRAM数据有效信号也叫写FIFO数据有效信号；数据对齐模块与DRAM、FIFO相连，接收来自DRAM的读DRAM数据，对读DRAM数据进行拼接和补零操作，得到写FIFO数据，向FIFO传输写FIFO数据；数据对齐模块将m个读DRAM数据首尾依次相连，并在后面补充w个0得到写FIFO数据，mod表示取余操作；m和w均为正整数；FIFO是一个读写异步FIFO，其空信号表明FIFO是否为...

【专利技术属性】
技术研发人员：黄松璞，姜晶菲，窦勇，许金伟，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人