基于神经架构搜索的跨尺度自适应目标检测方法、设备和介质技术

技术编号:38202307 阅读:8 留言:0更新日期:2023-07-21 16:46
本发明专利技术公开了一种基于神经架构搜索的跨尺度自适应目标检测方法、设备和介质,获取全场景数据集,并将全场景数据集划分成八个子类数据集;将实现各个检测任务的功能模块单元嵌入到已有的目标检测模型中,并利用对应的子类数据集和损失函数对嵌入后的目标检测模型进行训练,获得八个与子类数据集一一对应的最佳目标检测模型;对新输入的图像进行判断,将新输入的图像划归到某个子类数据集,根据子类数据集选取对应的最佳目标检测模型,输出目标检测结果。本发明专利技术能够避免由于场景数据分布变化而依靠单一固有检测网络造成的性能下降,解决神经架构搜索方法难以扩展至目标检测领域的不足,从而实现多场景、全尺度、高精度目标检测任务的达成。任务的达成。任务的达成。

【技术实现步骤摘要】
基于神经架构搜索的跨尺度自适应目标检测方法、设备和介质


[0001]本专利技术涉及一种基于神经架构搜索的跨尺度自适应目标检测方法、设备和介质,属于计算机视觉


技术介绍

[0002]神经架构搜索(Neural Architecture Search,NAS)是一种通过机器自动搜索构建神经网络架构的技术。NAS早期主要应用于分类问题,而近两年在图片目标检测领域的相关研究越来越多,鉴于一般检测模型结构都有四个部分构成(输入端input部分、特征提取backbone部分、特征融合neck部分和检测头head部分),而为了能够获得丰富有效的图像特征和确定精准恰当的空间位置,研究人员主要探索对目标检测中的后三个部分进行NAS搜索。
[0003]已刊出的文献方面,DeNAS通过将权重训练和结构搜索解耦来进行检测模型Backbone的搜索。NAS

FPN讨论了检测模型的neck如何自动地进行特征分层连接,从而取得精度和速度的权衡。AutoFPN的创新集中在Neck和Head网络中,Neck是针对backbone的特征先做Auto

fusion操作,而Auto

head使用NAS搜索得到一个网络用于分类和回归。NAS

FCOS和Auto

FPN相似,搜索的是neck和head部分,不同的是采用强化学习的方法进行搜索,搜索空间也略有不同,它是将FCOS(a fully convolutional one
/>stage object detector)视作编码解码架构,backbone表示编码器,FPN与head表示解码器。SpineNet提出了一种叫做尺度重排(scale

permuted)的元结构模型,使中间特征图的空间分辨率能够随时增加或减少,以便模型能够随着深度的增加而保留空间信息,其次特征图之间的联系能够跨特征尺度,以促进多尺度特征融合。Hit

Detector是第一个可以同时搜索检测模型的backbone、neck和head的NAS,并设计一种分级方法在不同的子搜索空间中搜索不同的结构。
[0004]然而,现有的NAS技术都是面对特定对象进行神经网络构建的,如:通用的目标检测数据集MS COCO采用平摄的方式采集数据,而无人机航拍目标检测数据集采用俯拍的方式采集数据,不同的拍摄采集方式会造成目标尺度分布的变化和疏密程度的改变,前者中目标尺度变化不大,个体便于区分,后者目标呈现多尺度特性,边缘重叠现象严重。再比如,气象、光照等因素影响,在不同环境场景采集的图像数据中前景、背景对比度也会有所不同,对比度的高低决定着从复杂背景中辨别出前景目标的难易程度。
[0005]因此,如何针对不同数据集中数据分布存在巨大差异对于目标检测的影响,是本领域技术人员急需要解决的技术问题。

技术实现思路

[0006]目的:为了克服现有技术中存在的不足,本专利技术提供一种基于神经架构搜索的跨尺度自适应目标检测方法、设备和介质,能够解决现有技术中神经架构搜索方法的不足,能够适应多种场景目标检测任务,并在固有检测模型基础上通过自动搜索嵌入不同功能模块
单元到基础检测模型中,完成全场景目标检测任务。为达到上述目的,本专利技术是采用下述技术方案实现的:
[0007]技术方案:为解决上述技术问题,本专利技术采用的技术方案为:
[0008]第一方面,一种基于神经架构搜索的跨尺度自适应目标检测方法,包括如下步骤:
[0009]步骤1:获取全场景数据集,并将全场景数据集划分成八个子类数据集。
[0010]步骤2:将八个子类数据集中各个子类数据集作为训练集,利用神经架构搜索获得实现各个检测任务的功能模块单元。
[0011]步骤3:将实现各个检测任务的功能模块单元嵌入到已有的目标检测模型中,得到嵌入后的目标检测模型,并利用对应的子类数据集和损失函数对嵌入后的目标检测模型进行训练,获得八个与子类数据集一一对应的最佳目标检测模型。
[0012]步骤4:对新输入的图像进行判断,将新输入的图像划归到某个子类数据集,根据子类数据集选取对应的最佳目标检测模型,将新输入的图像输入最佳目标检测模型,输出目标检测结果。
[0013]进一步的,所述全场景数据集包括:
[0014]选用多个可开源获取的目标检测数据集。
[0015]采用多种摄像设备在不同时段、不同角度及不同气象条件下摄取并标注得到。
[0016]采用搜索引擎从互联网搜索下载并标注得到。
[0017]进一步的,所述将全场景数据集划分成八个子类数据集,包括:
[0018]设定图像中关于目标的三个维度,分别是:疏集程度、尺度大小和与背景对比度。
[0019]每个维度设定两个标准,分别是:疏集程度为稠密、稀疏,尺度大小为大尺度、小尺度,与背景对比度为明亮、阴暗。
[0020]根据三个维度和各维度的两个标准,将全场景数据集划分成八个子类数据集,分别是:稠密、小尺度目标的阴暗图像,稠密、小尺度目标的明亮图像,稠密、大尺度目标的阴暗图像,稠密、大尺度目标的明亮图像,稀疏、小尺度目标的阴暗图像,稀疏、小尺度目标的明亮图像,稀疏、大尺度目标的阴暗图像和稀疏、大尺度目标的明亮图像的八个子类数据集。
[0021]进一步的,所述神经架构搜索采用DARTS。
[0022]进一步的,所述将实现各个检测任务的功能模块单元嵌入到已有的目标检测模型中,得到嵌入后的目标检测模型,包括:
[0023]选取YOLO系列的一阶段检测模型作为已有的目标检测模型。
[0024]以网络性能最优路径为目标,将实现各个检测任务的功能模块单元嵌入到已有的目标检测模型的backbone和neck结构中,得到嵌入后的目标检测模型。
[0025]进一步的,所述损失函数L
CE
,包括:
[0026][0027]式中,λ表示loss和lat(θ)之间的权重,loss表示真实标签与搜索预测之间的损失函数,y表示真实标签值,x
l
表示第l层特征输入,p(x
l
;W,θ)表示第l层预测的输出,函数lat(θ)表示网络延迟函数,n代表特征提取层的数量,W表示权重参数集合,θ表示训练最优参数。
[0028]进一步的,所述训练网络的权重参数W和训练最优参数θ采用批量随机梯度下降算法训练,其中参数更新规则如下:
[0029][0030][0031]式中,w
t+1
为第t+1次迭代时的参数值,w
t
为第t次迭代时的参数值,为目标损失对参数w
t
的偏导数,θ
t+1
为第t+1次迭代时的参数值,θ
t
为第t次迭代时的参数值,为目标损失对参数θ
t
的偏导数,η
t
为学习率。
[0032]进一步本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于神经架构搜索的跨尺度自适应目标检测方法,其特征在于:包括如下步骤:步骤1:获取全场景数据集,并将全场景数据集划分成八个子类数据集;步骤2:将八个子类数据集中各个子类数据集作为训练集,利用神经架构搜索获得实现各个检测任务的功能模块单元;步骤3:将实现各个检测任务的功能模块单元嵌入到已有的目标检测模型中,得到嵌入后的目标检测模型,并利用对应的子类数据集和损失函数对嵌入后的目标检测模型进行训练,获得八个与子类数据集一一对应的最佳目标检测模型;步骤4:对新输入的图像进行判断,将新输入的图像划归到某个子类数据集,根据子类数据集选取对应的最佳目标检测模型,将新输入的图像输入最佳目标检测模型,输出目标检测结果。2.根据权利要求1所述的基于神经架构搜索的跨尺度自适应目标检测方法,其特征在于:所述全场景数据集包括:选用多个可开源获取的目标检测数据集;采用多种摄像设备在不同时段、不同角度及不同气象条件下摄取并标注得到;采用搜索引擎从互联网搜索下载并标注得到。3.根据权利要求1所述的基于神经架构搜索的跨尺度自适应目标检测方法,其特征在于:所述将全场景数据集划分成八个子类数据集,包括:设定图像中关于目标的三个维度,分别是:疏集程度、尺度大小和与背景对比度;每个维度设定两个标准,分别是:疏集程度为稠密、稀疏,尺度大小为大尺度、小尺度,与背景对比度为明亮、阴暗;根据三个维度和各维度的两个标准,将全场景数据集划分成八个子类数据集,分别是:稠密、小尺度目标的阴暗图像,稠密、小尺度目标的明亮图像,稠密、大尺度目标的阴暗图像,稠密、大尺度目标的明亮图像,稀疏、小尺度目标的阴暗图像,稀疏、小尺度目标的明亮图像,稀疏、大尺度目标的阴暗图像和稀疏、大尺度目标的明亮图像的八个子类数据集。4.根据权利要求1所述的基于神经架构搜索的跨尺度自适应目标检测方法,其特征在于:所述神经架构搜索采用DARTS。5.根据权利要求1所述的基于神经架构搜索的跨尺度自适应目标检测方法,其特征在于:所述将实现各个检测任务的功能模块单元嵌入到已有的目标检测模型中,得到嵌入后的目标检测模型,包括:选取YOLO系列的一阶段检测模型作为已有的目标检测模型;以网络性能最优路径为目标,将实现各个检测任务的功能模块单元嵌入到已有的目标检测模型的backbone和...

【专利技术属性】
技术研发人员:苗壮杨利王家宝李阳张睿余沛毅李允臣齐宁
申请(专利权)人:中国人民解放军陆军工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1