一种基于制造技术

技术编号:39658922 阅读:20 留言:0更新日期:2023-12-09 11:28
本发明专利技术属于目标检测技术领域,具体涉及一种基于

【技术实现步骤摘要】
一种基于FPGA的DPU的目标检测加速方法


[0001]本专利技术属于目标检测
,具体涉及一种基于
FPGA

DPU
的目标检测加速方法


技术介绍

[0002]目标检测是计算机视觉领域中的热门研究方向之一,广泛应用于智能安防

自动驾驶

医学影像分析等领域

近年来随着深度学习技术的发展,目标检测的准确率不断提高,但是,同时也导致计算复杂度和模型体积的增加,如
YOLOv3
使用的
Darknet

53
网络共
106

,
直接部署到终端上的计算效率较低,很难满足实时性要求

因此,如何将目标检测模型快速高效地部署到终端上,成为当前的一个研究热点和挑战

[0003]当前,针对目标检测硬件部署的研究主要包括两个方向:一是基于
FPGA/ASIC
等专用的硬件加速器进行目标检测模型的加速;二是在...

【技术保护点】

【技术特征摘要】
1.
一种基于
FPGA

DPU
的目标检测加速方法,其特征在于:所述基于
FPGA

DPU
的目标检测加速方法包括:步骤一

通过
FPGA
开发工具集成包含
DPU

AI
智能计算系统,生成并导出比特流文件,将比特流文件传入
Linux
软件开发工具中,利用
Linux
软件开发工具搭建具有
DPU AI
智能计算模块的
Linux
系统,并将其烧录至
SD
卡中;步骤二

在通用计算平台上对模型进行训练

优化并编译成
DPU
可识别的
.Xmodel
文件;步骤三

通过
SD
卡启动
FPGA
开发板,在基于
FPGA

Linux
系统上运行
.Xmodel
文件,实现
DPU IP
调用和模型的推理
。2.
根据权利要求1所述的一种基于
FPGA

DPU
的目标检测加速方法,其特征在于:步骤一中,
AI
智能计算系统还包括时钟模块和中央处理器;设置系统复位,采用
IP

Processor System Reset
,分频器产生三个时钟频率,使用三个复位
IP
核;
AI
智能计算系统配备三个不同的时钟域;
AI
智能计算系统包括中断处理模块;步骤三中,
FPGA
开发板选用
ZYNQ7Processing System IP
核;
FPGA
开发板采用
DDR、SD、USBIP
,时钟频率使用分频器
IP
,进行分频设置
。3.
根据权利要求1所述的一种基于
FPGA

DPU
的目标检测加速方法,其特征在于:步骤二中,采用
Pytorch
框架搭建深度学习模型对模型进行训练,深度学习模型包括四个部分,分别是输入端
、Backbone、Neck、Prediction

Backbone
是主干网络,主要功能是用来做特征提取,
Neck
部分作用是更好的提取
backbone
部分给出的
feature
参数,从而提高网络的性能;深度学习模型采用
ReLU
激活函数,方便模型在部署到
FPGA
开发板时做适配
。4.
根据权利要求3所述的一种基于
FPGA

DPU
的目标检测加速方法,其特征在于:深度学习模型在输入端做
Mosaic
数据增强以及自适应锚框计算;
Mosaic
数据增强技术通过对数据集中的图片进行随机缩放

随机剪裁

随机排布的方式进行拼接,提高数据集图片背景复杂度,对于小目标检测效果有很大改善;自适应锚框技术,是在网络训练过程中,在初始锚框的基础上输出预测框,进而和真实框进行对比,建立真实框与预测框之间的损失函数,反向更新迭代网络参数,提高初始锚框的效果
。5.
根据权利要求1所述的一种基于
FPGA

DPU
的目标检测加速方法,其特征在于:对模型进行优化为:搭建工具链,采用工具链对模型算子检查

量化

校准

微调

...

【专利技术属性】
技术研发人员:韩睿戴哲仁王文浩翁张力蒋鹏李晨夏巧群李富强周莉刘爽温典
申请(专利权)人:国网浙江省电力有限公司宁波供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1