当前位置: 首页 > 专利查询>北京大学专利>正文

一种移动端设备目标检测系统的低功耗低资源占用跨网络层数据流方法和硬件结构技术方案

技术编号:43567721 阅读:25 留言:0更新日期:2024-12-06 17:37
本发明专利技术公开了一种移动端设备目标检测系统的低功耗低资源占用跨网络层数据流方法,并基于此数据流方法进行对应的目标检测系统的硬件结构设计。本发明专利技术设计的YOLOv2目标检测网络推理过程经过量化重构之后主要卷积层、尺度缩放层、最大池化层、重排序层的计算。本发明专利技术提出的移动端设备目标检测系统执行YOLOv2网络推理的流程为:输入特征图输入线性卷积层电路执行并行MAC计算,得到卷积输出特征图;将卷积输出特征图输入尺度缩放层电路进行尺度缩放操作;如果后续为最大池化层,将卷积输出特征图输入最大池化层电路的最大池化操作;如果后续为重排序层,将卷积输出特征图输入重排序层电路进行重排序操作;按照量化重构后的YOLO网络结构,重复上述以卷积层为中心的片上跨网络层执行,直到完成网络结构中所有网络层的计算。本发明专利技术通过采用多层次数据复用策略和多层次缓冲设计,最大化输入特征图和多通道卷积核权重在片内的数据复用,减少大量额外产生功耗和延迟的片外数据重载,将目标检测系统的功耗和片上内存资源占用降低至最低,相比于其他相关文献的工作更适用于硬件资源和功耗都极其受限的移动端设备。

【技术实现步骤摘要】

本专利技术公开了一种移动端设备目标检测系统的低功耗低资源占用跨网络层数据流方法和硬件结构,将高精度yolov2网络模型映射到低功耗低资源条件的移动端设备。该数据流策略从yolov2网络结构的特点出发,对于量化压缩后的yolov2目标检测网络的推理过程进行针对性改进。在采用纯整数运算推理量化策略量化压缩模型之后,卷积层后续的批归一化层变为mac计算后对特征图尺度进行线性压缩以及加β-γμ/σ偏置的过程。本专利技术通过将卷积计算过程中最为关键和适合硬件优化的mac计算从卷积层中抽离出来,作为一个线性卷积层单独进行优化,并且将卷积层剩余其他步骤的计算过程进行整合,也就是将加偏置、移位操作和leaky relu处理共同放到一个尺度缩放层处理,以此优化整个yolo网络卷积层的结构。对于量化压缩和重构卷积层后的yolov2网络两次线性卷积之间的操作,包括尺度缩放层、最大池化层、重排序层,其实都是再对前面线性卷积层的输出特征图做变换处理,本专利技术因此将线性卷积层与这些网络层整合为数据流策略的一次跨网络层片内执行,各个网络层以及输入特征图和权重的数据加载操作都采用并行计算方式实现。从整体上看,本文档来自技高网...

【技术保护点】

1.一种移动端设备目标检测系统的低功耗低资源占用跨网络层数据流方法和硬件结构,包括线性卷积层的并行MAC计算、尺度缩放层的尺度缩放操作、最大池化层的最大池化操作、重排序层的重排序操作,其特征在于:

2.由权利要求1所述的一种线性卷积层的并行MAC计算方法,其特征在于:

3.由权利要求1所述的一种尺度缩放层的尺度缩放操作方法,其特征在于

4.由权利要求1所述的一种最大池化层的最大池化操作方法,其特征在于:

5.由权利要求1所述的一种重排序层的重排序操作方法,其特征在于:

【技术特征摘要】

1.一种移动端设备目标检测系统的低功耗低资源占用跨网络层数据流方法和硬件结构,包括线性卷积层的并行mac计算、尺度缩放层的尺度缩放操作、最大池化层的最大池化操作、重排序层的重排序操作,其特征在于:

2.由权利要求1所述的一种线性卷积层的并行mac计...

【专利技术属性】
技术研发人员:冯建华齐观平侯明浩张宇浩李鹏龙陈宇航王然崔博文叶红飞
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1