一种基于FPGA的图像目标识别加速系统技术方案

技术编号:28943211 阅读:26 留言:0更新日期:2021-06-18 21:51
本发明专利技术公开了一种基于FPGA的图像目标识别加速系统;包括集成于FPGA的XDMA模块、存储器接口模块、加速核、同步模块和控制模块以及连接FPGA的片外主存储器,其中,XDMA模块,其用于上位机与FPGA的数据传输;存储器接口模块,其用于实现控制片外主存储器读写逻辑功能;加速核,其用于算法的加速运算;同步模块,其主要用于解决XDMA模块与加速核和存储器接口模块之间的跨时钟域数据传输问题,控制模块,其用于控制XDMA模块、存储器接口模块、加速核、同步模块的运行。本发明专利技术采用具有可编程性的FPGA加速深度学习算法,设计了适合运行当前主流的图像目标识别领域中的深度学习算法的加速系统。

【技术实现步骤摘要】
一种基于FPGA的图像目标识别加速系统
本专利技术涉及神经网络
,更具体地说,它涉及一种基于FPGA的图像目标识别加速系统。
技术介绍
图像目标识别技术是计算机视觉领域的研究热点和难点。近年来,深度学习算法取得了突破性的发展,在诸多领域得到了很好的应用。在计算机视觉领域的应用更是突飞猛进,深度学习算法以其优异的性能逐渐取代了传统图像目标识别算法,广发应用到图像目标识别领域的深度学习算法层出不穷,如R-CNN系列算法,YOLO系列算法,以及SSD算法等。传统目标识别算法是基于滑动窗口的框架,使用不同大小的窗口在输入图片多次滑动,存在效率低下的缺点。基于深度学习的目标识别算法针对传统算法逐步进行改进,从基于候选区域的采用两步识别的方式R-CNN系列算法,发展到采用单步识别方式的YOLO系列算法,识别效率和精度均实现了不同程度的提升。但是深度学习算法为目标识别带来性能提升的背后,需要巨大的存储和计算资源的支持,一些小型的终端设备的存储和计算能力都很有限,部署运算量庞大,模型复杂的深度学习算法有很大挑战;目前,对深度学习算法加速的本文档来自技高网...

【技术保护点】
1.一种基于FPGA的图像目标识别加速系统,其特征在于,包括集成于FPGA的XDMA模块、存储器接口模块、加速核、同步模块和控制模块以及连接FPGA的片外主存储器,其中,/nXDMA模块,其用于上位机与FPGA的数据传输;/n存储器接口模块,其用于实现控制片外主存储器读写逻辑功能;/n加速核,其用于算法的加速运算;/n同步模块,其主要用于解决XDMA模块与加速核和存储器接口模块之间的跨时钟域数据传输问题;/n控制模块,其用于控制XDMA模块、存储器接口模块、加速核、同步模块的运行;/n片外主存储器,其用于存储加速核运算所需的数据以及其运算过程中所产生的数据;/n加速核运算所需的数据至少包括来源...

【技术特征摘要】
1.一种基于FPGA的图像目标识别加速系统,其特征在于,包括集成于FPGA的XDMA模块、存储器接口模块、加速核、同步模块和控制模块以及连接FPGA的片外主存储器,其中,
XDMA模块,其用于上位机与FPGA的数据传输;
存储器接口模块,其用于实现控制片外主存储器读写逻辑功能;
加速核,其用于算法的加速运算;
同步模块,其主要用于解决XDMA模块与加速核和存储器接口模块之间的跨时钟域数据传输问题;
控制模块,其用于控制XDMA模块、存储器接口模块、加速核、同步模块的运行;
片外主存储器,其用于存储加速核运算所需的数据以及其运算过程中所产生的数据;
加速核运算所需的数据至少包括来源于上位机的原始数据,原始数据至少包括图像数据以及权值参数数据;
加速核包括输入输出特征谱缓存模块、权值缓存模块、向量乘加模块、池化模块、激活函数模块和通道加法模块;
输入输出特征谱缓存模块,其用于存储从片外主存储器中读取的图像数据以及存储向量乘加模块运算获得的输出特征谱;
输入输出特征谱缓存模块还用于将从片外主存储器中读取的图像数据转化为输入特征谱;
权值缓存模块,其用于存储从片外主存储器中读取的权值参数数据;
向量乘加模块,其采用向量乘加形式从输入输出特征谱缓存和权值缓存中读取数据进行运算,并将计算出的结果依次传输到后续的通道加法模块、池化模块和激活函数模块;
通道加法模块,其用于进行通道加法运算;
激活函数模块,其用于进行激活函数运算;
池化模块,其用于进行最大池化运算。


2.根据权利要求1所述的一种基于FPGA的图像目标识别加速系统,其特征在于,所述XDMA模块通过PCIe接口连接上位机,通过PCIe接口接收上位机的原始数据。


3.根据权利要求1所述的一种基于FPGA的图像目标识别加速系统,其特征在于,所述向量乘加模块将NxN的卷积运算转化成1x1的卷积运算,通过时分复用向量乘加模块在一个时段内进行一个1x1的卷积运算,将多个时段卷积运算获得的中间结果进行累加得到最终的卷积输出结果。


4.根据权利要求1所述的一种基于FPGA的图像目标识别加速系统,其特征在于,所述采用向量乘加形式从输入输出特征谱缓存和权值缓存中读取数据进行运算包括:
向量乘加模块分为S个时段进行运算,在每个时段的运算中,将卷积核中一个位置通道维度上的向量作为权值参数输入,并输入与该权值参数重叠的输入特征谱的区域的通道维度的特征向量进行卷积运算获得...

【专利技术属性】
技术研发人员:冯涛
申请(专利权)人:南京广捷智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1