System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于存算一体架构的目标检测方法和系统技术方案_技高网

一种基于存算一体架构的目标检测方法和系统技术方案

技术编号:40420779 阅读:9 留言:0更新日期:2024-02-20 22:39
本发明专利技术提出一种基于存算一体架构的目标检测方法和系统,属于图像检测技术领域。所述存算一体架构至少包括主控制器和Q个存算单元。所述主控制器获取待检测的目标图像和待运行的目标检测网络,基于所述目标图像的参数、所述目标检测网络的参数和所述Q个存算单元的参数,确定所述目标图像和所述目标检测网络分别在所述Q个存算单元中的部署参数,并将所述部署参数发送至所述Q个存算单元。所述Q个存算单元中每一个存算单元均根据接收到的所述部署参数来部署所述目标图像的子特征图和所述目标检测网络的网络节点。所述主控制器和部署有所述目标图像的子特征图和所述目标检测网络的网络节点的Q个存算单元协同执行对所述目标图像的检测。

【技术实现步骤摘要】

本专利技术属于图像检测,尤其涉及一种基于存算一体架构的目标检测方法和系统


技术介绍

1、目标检测是计算机视觉技术中一项非常基础和重要的任务,主要解决数字图像中单个或多个感兴趣目标的识别和定位问题。近年来,随着深度学习在目标检测领域的大规模应用,目标检测技术的精度和速度得到迅速提高,已广泛应用于人脸检测、交通标志检测和遥感图像检测等各个领域。

2、现有的目标检测系统一般基于cpu和gpu/dsp等传统的冯诺伊曼架构构建,存在存储墙与功耗墙瓶颈。目标检测神经网络权重参数大,算力要求高,在传统计算系统架构下,需要在内存和计算单元之间频繁搬运数据,大量能量损失在数据搬运中,导致系统功耗高,限制了应用场景,如何提高目标检测系统的能效成为一个亟待解决的问题。

3、专利cn202310064000.7(名称:一种目标检测方法、装置、电子设备及存储介质)提供了一种目标检测方法、装置、电子设备及存储介质,电子设备可以获取待检测图像;基于所述待检测图像的宽高以及用于处理所述待检测图像的处理器的数量,将所述待检测图像切分成多个子图像;将所述多个子图像分别发送至不同的处理器,以使所述处理器运行的神经网络对接收到的子图像进行目标检测,输出该子图像的目标检测结果;对所述目标检测结果进行融合,得到所述待检测图像的目标检测结果。由于多个处理器可以同时对待检测图像的各子图像进行目标检测,进而将每个处理器输出的子图像的目标检测结果进行融合,得到待检测图像的目标检测结果。这样可以实现多个处理器协同工作,降低目标检测的延迟。

4、专利cn202010003131.0(名称:一种面向嵌入式深度学习的超大尺寸图像目标检测方法及系统)提出了一种面向嵌入式深度学习的超大尺寸图像目标检测方法及系统,包括:图像预处理单元、目标检测单元、图像后处理单元。本专利技术提出的面向嵌入式深度学习的超大尺寸图像目标检测方法,面向嵌入式深度学习领域越来越多的超大尺寸图像处理需求,针对嵌入式多核处理器运行深度神经网络的局限性,基于分块思想将单幅图像分割为多幅图像,从而实现单幅图像的并行化目标检测,再通过图像后处理单元对检测结果进行分析,将多幅检测结果融为一体,有效解决嵌入式计算平台处理效率低下的问题。

5、论文mcunet:tiny deep learning on iot devices中提出了mcunet方案可以通过高效的网络架构搜索(tinynas)和轻量推理引擎(tinyengine)的联合设计,实现在mcu(microcontroller unit微控制单元,又称单片机)上运行imagenet级别的推理。

6、目标检测神经网络目前取得了非常好的进展,出现了大量基于深度学习的网络,代表性网路如fast rcnn、yolo系列、detr等,这些算法可以部署在gpu上进行实时计算,也可以部署到带npu等ai专用加速器的平台上,但上述目标检测系统功耗大多在几瓦至上百瓦左右,无法满足端侧ai应用场景低功耗的需求。

7、端侧应用场景因功耗限制,大量使用微控制器(mcu)作为处理器,硬件资源非常有限,算力和存储资源不到手机、gpu的千分之一,原先部署在gpu、npu上的目标检测网络运行在mcu存在较大困难,先前的模型压缩、网络优化相关工作,主要是优化减小神经网络的计算量和模型权重大小,没有考虑到运行时神经网络的activation大小,这导致优化过的神经网络难以满足mcu的资源限制。论文mcunet:tiny deep learning on iot devices提出的方法部分解决了上述问题,可将轻量化目标检测网络部署在mcu平台并运行,但受限于mcu的算力瓶颈,运行计算量较大的网络时间过长,不能满足实际场景的要求。

8、专利cn202310064000.7和专利cn202010003131.0提出基于多核处理器的系统,对图像进行切分的方法来提高处理速度,缩短目标检测网络推理的时间,其提出的方法是基于分块思想将单幅图像分割为多幅子图像,处理器对各个子图像进行独立的目标检测计算出目标位置、类别、置信度等信息,后处理单元对各子图的目标检测结果进行融合,通常目标检测网络推理过程中中间层特征图仍需较大的缓存,该方法不适合存储容量受限的端侧场景。


技术实现思路

1、为满足端侧智能化的应用需求,针对现有技术能效低、功耗高的问题,本专利技术提出了一种基于存算一体架构的目标检测方案。

2、本专利技术第一方面提出一种基于存算一体架构的目标检测方法。所述存算一体架构至少包括主控制器和q个存算单元,在所述方法中:

3、步骤s1、所述主控制器获取待检测的目标图像和待运行的目标检测网络,基于所述目标图像的参数、所述目标检测网络的参数和所述q个存算单元的参数,确定所述目标图像和所述目标检测网络分别在所述q个存算单元中的部署参数,并将所述部署参数发送至所述q个存算单元;

4、步骤s2、所述q个存算单元中每一个存算单元均根据接收到的所述部署参数来部署所述目标图像的子特征图和所述目标检测网络的网络节点;

5、步骤s3、所述主控制器和部署有所述目标图像的子特征图和所述目标检测网络的网络节点的q个存算单元协同执行对所述目标图像的检测。

6、根据本专利技术第一方面的方法,在所述步骤s1中:

7、所述目标图像的参数包括所述目标图像的尺寸;

8、所述目标检测网络至少包括卷积模块、最大池化模块、平均池化模块、激活函数模块、批量归一化模块,所述目标检测网络包含若干节点,每一网络节点对应一个处理模块,每一网络节点对于输入/输出的特征图有不同的尺寸约束,所述目标检测网络的参数包括网络节点类型、网络分支、特征图尺寸;

9、所述q个存算单元的参数包括存算单元数量、数据传输带宽、算力大小、算力利用率、权重容量、权重排布率、缓存大小;

10、基于所述目标图像的参数、所述目标检测网络的参数和所述q个存算单元的参数,确定的所述目标图像和所述目标检测网络分别在所述q个存算单元中的部署参数包括所述目标检测网络的网络分段参数、每个网络分段的段内分组参数、所述目标图像的特征图切分参数。

11、根据本专利技术第一方面的方法,在所述步骤s1中,确定所述目标检测网络的网络分段参数包括:

12、遍历所述目标检测网络,标记所有包含权重的网络节点,所述包含权重的网络节点指所述卷积模块;

13、以所述目标检测网络的网络分支节点为分隔点,对标记出的所述所有包含权重的网络节点进行分段,以获取所述目标检测网络的n个网络分段,{s(0),s(1),s(2),...s(n-1)}。

14、根据本专利技术第一方面的方法,在所述步骤s1中,确定所述目标图像的特征图切分参数包括:

15、配置所述目标图像的特征图切分方式,包括h轴切分、w轴切分、c轴切分、tile切分、混合切分,所述混合切分指h轴切分、w轴切分、c轴切分、tile切分的任意组合,其中,所述目本文档来自技高网...

【技术保护点】

1.一种基于存算一体架构的目标检测方法,其特征在于,所述存算一体架构至少包括主控制器和Q个存算单元,在所述方法中:

2.根据权利要求1所述的一种基于存算一体架构的目标检测方法,其特征在于,在所述步骤S1中:

3.根据权利要求2所述的一种基于存算一体架构的目标检测方法,其特征在于,在所述步骤S1中,确定所述目标检测网络的网络分段参数包括:

4.根据权利要求3所述的一种基于存算一体架构的目标检测方法,其特征在于,在所述步骤S1中,确定所述目标图像的特征图切分参数包括:

5.根据权利要求4所述的一种基于存算一体架构的目标检测方法,其特征在于,在所述步骤S1中,确定每个网络分段的段内分组参数包括:

6.一种基于存算一体架构的目标检测系统,其特征在于,所述目标检测系统至少包括主控制器、Q个存算单元和目标检测网络,其中:

7.根据权利要求6所述的一种基于存算一体架构的目标检测系统,其特征在于:

8.根据权利要求7所述的一种基于存算一体架构的目标检测系统,其特征在于,所述主控单元被配置为:

9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时,实现权利要求1-5任一项所述的一种基于存算一体架构的目标检测方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1-5任一项所述的一种基于存算一体架构的目标检测方法。

...

【技术特征摘要】

1.一种基于存算一体架构的目标检测方法,其特征在于,所述存算一体架构至少包括主控制器和q个存算单元,在所述方法中:

2.根据权利要求1所述的一种基于存算一体架构的目标检测方法,其特征在于,在所述步骤s1中:

3.根据权利要求2所述的一种基于存算一体架构的目标检测方法,其特征在于,在所述步骤s1中,确定所述目标检测网络的网络分段参数包括:

4.根据权利要求3所述的一种基于存算一体架构的目标检测方法,其特征在于,在所述步骤s1中,确定所述目标图像的特征图切分参数包括:

5.根据权利要求4所述的一种基于存算一体架构的目标检测方法,其特征在于,在所述步骤s1中,确定每个网络分段的段内分组参数包括:

6.一种基于存算一体架构的...

【专利技术属性】
技术研发人员:陈华龚勇朱赛克黄晓倩吴文豪赵毅
申请(专利权)人:中国电子科技南湖研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1