一种基于量化压缩的Yolov2-Tiny的目标检测FPGA加速器制造技术

技术编号：39297382 阅读：12 留言：0更新日期：2023-11-07 11:05

本发明专利技术公开了一种基于量化压缩的Yolov2

全部详细技术资料下载

【技术实现步骤摘要】
一种基于量化压缩的Yolov2
‑
Tiny的目标检测FPGA加速器

[0001]本专利技术涉及Yolov2
‑
Tiny网络计算加速领域，尤其涉及一种基于Yolov2
‑
Tiny的目标检测用FPGA加速器。

技术介绍

[0002]随着计算机视觉领域的快速发展，目标检测技术在道路监控、无人驾驶汽车、医学图像分析和国防安全等领域发挥着重要作用。YOLOv2
‑
Tiny(You Only Look Once，YOLO)目标检测算法模型将目标类别判定和位置信息结合在一个卷积神经网络中，加快检测速度的同时保持了检测精度。
[0003]在大多数实际应用中，目标检测技术都需要应用到嵌入式设备，目前市场主要使用GPU处理器，其效率远高于CPU处理器，但其功耗过高且价格昂贵，难以广泛适用于各种环境。针对目标检测的具体应用场景，终端设备离线小型化，研究方向逐渐转向ASIC和FPGA。在ASIC上实现的神经网络具有较高的计算性能和较低的功耗，但其研发成本高，设计周期长，且不能通过重新编程来调整硬件结构，增加了设计的风险和成本。FPGA作为一种现场可编程的逻辑器件，具有强大的可重构能力，极大地缩短了设计周期，且FPGA具有高性能、低功耗、速度快的优点，是实现目标检测算法的良好选择。
[0004]然而采用FPGA加速神经网络也面临着一些挑战，对于实时目标检测系统，YOLOv2
‑
tiny网络结构相对较大，目标检测卷积神经网络计算访存密集，在

【技术保护点】

【技术特征摘要】
1.一种基于量化压缩的Yolov2
‑
Tiny的目标检测FPGA加速器，其特征在于，包括状态控制单元(1)、输入特征图缓存单元(2)、输出特征图缓存单元(3)、输入权重参数缓存单元(4)、数据整形单元(5)、卷积计算核心单元(6)、通道累加单元(7)、池化计算单元(8)；其中，输入特征图缓存单元(2)的输出连接数据整形单元(5)，数据整形单元(5)和输入权重参数缓存单元(4)的输出连接卷积计算核心单元(6)，卷积计算核心单元(6)的输出连接通道累加单元(7)，通道累加单元(7)的输出连接输出特征图缓存单元(3)，池化计算单元(8)与输出特征图缓存单元(3)连接，状态控制单元(1)用于对各个单元进行状态控制；所述基于量化压缩的Yolov2
‑
Tiny中，每一层卷积层后都引入批归一化层，并将批归一化层与卷积层进行融合，融合后的权重参数和偏置参数通过软件预处理来进行更新；算法执行过程中，采用均匀量化的方式对权重参数进行逐层量化。2.根据权利要求1所述的基于量化压缩的Yolov2
‑
Tiny的目标检测用FPGA加速器，其特征在于，算法执行过程中，将输入特征图分块，先按输入通道，再按输入特征图的宽，最后按输入特征图的高，依次获取输入特征图以及相应的权重参数和偏置参数，在进行卷积计算和池化计算后输出滑动立方体，直到整个层的卷积计算完成；对于连接到池化层的Conv层，在输出滑动立方体写入片外存储器之前执行最大池化。3.根据权利要求1所述的基于量化压缩的Yolov2
‑
Tiny的目标检测用FPGA加速器，其特征在于，采用特征图权重重用策略从PS端向PL端搬运数据，在卷积1
‑
3层采用权重参数复用方式，后面层采用输入特征图复用方式；其中，对于权重参数数据，将每个卷积核的权重按照输出通道的顺序展开，首先将每个卷积核的权重展开为W0
‑
W8，并附上对应通道的卷积核，再按照输出通道的顺序展开，并通过DMA将该块数据从DDR中搬运到输入权重参数缓存单元(4)的第一块权重缓存区，再重复上述过程，搬运后续的参数。4.根据权利要求1
‑
3任一所述的基于量化压缩的Yolov2
‑
Tiny的目标检测用FPGA加速器，其特征在于，所述数据整形单元(5...

【专利技术属性】
技术研发人员：刘昊，王丽洁，陈健，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人