基于级联组合网络的大地背景小目标识别方法技术

技术编号：37042349 阅读：13 留言：0更新日期：2023-03-29 19:21

本发明专利技术公开了一种基于级联组合网络的大地背景小目标识别方法，主要解决现有技术在对地观测动态和复杂大地背景下不易实现与小目标区域粗分割和小目标识别的问题。其方案是：构建、增强、标注、转换和划分大地背景小目标可见光图片数据集；基于现有的语义分割模型，通过引入注意力机制、多尺度小目标特征融合结构、残差网络构建大地背景小目标分割模型，并对其进行训练实现对背景和小目标的区域粗分割；对现有的小目标检测模型进行训练得到大地背景下小目标识别模型，使用该模型完成对粗分割后且经预处理后图片的再识别。本发明专利技术提高了空对地观测复杂、多变大地背景与小目标间的区域粗分割和识别精度，可用于遥感图像、交通监控、自动驾驶多种场景。自动驾驶多种场景。自动驾驶多种场景。

全部详细技术资料下载

【技术实现步骤摘要】
基于级联组合网络的大地背景小目标识别方法

[0001]本专利技术属于目标检测
，特别涉及一种大地背景小目标识别方法，可用军工航空、遥感图像、土地和房屋测量规划、交通监控、自动驾驶的多样化场景。

技术介绍

[0002]近年来，随着目标检测领域的技术发展，小目标识别逐渐成为目标检测领域中的热点和难点，而对于大地背景下的小目标识别也已逐渐成为目标检测领域中极具挑战的任务之一，语义分割技术是实现对大地背景和小目标间区域粗分割的关键技术，而目标识别模型则是对于基于分割结果的进一步识别的有效方式，最终可进一步提高大地背景下的小目标的识别效果。此专利技术在军工航空、遥感图像、土地和房屋测量规划、交通监控、自动驾驶等未来多样化的场景领域中有着重要的研究意义和越来越广泛的应用价值。
[0003]针对在复杂、多变大地背景下的小目标存在分辨率低、灰暗、不易被定位且难以看见、大地背景和小目标难以区分的问题。现有技术主要采用目标检测模型或语义分割进行目标识别，其中目标检测模型是用矩形框来标注和预测图像中的小目标，且存在只会标出目标的大致位置的问题；语义分割是对像素级别进行分类，即告诉图片中某一块像素的label具体是什么，比如会告诉这个像素是某个目标，例如：car的像素，但是对于更小的目标存在分割覆盖率不高且边缘分割效果还有优化空间。因而对于同类不同形态小目标识别、不同建筑物的小识别，使用单一的语义分割或目标识别模型无法实现对大地背景的小目标进行准确的分割和识别。
[0004]申请号为：CN202210296396.3的

【技术保护点】

【技术特征摘要】
1.一种基于级联组合网络的大地背景小目标识别方法，其特征在于，包括以下步骤：(1)构建语义分割模型和yolov5
‑
s小目标检测网络模型的大地背景小目标图片数据集：1a)对大地背景下的小目标可见光图像数据集进行图像增强和软件标注的预处理；1b)将预处理后数据集按照8：2的比例划分为语义分割模型的训练集和验证集；1c)将预处理后的数据集按照8：1：1的比例划分为yolov5
‑
s小目标检测网络模型的训练集、验证集和测试集；(2)对现有的Deeplabv3plus语义分割模型进行改进，构建大地背景小目标分割模型：2a)对语义分割网络模型的主干网络中1个浅层高分辨率特征层和2个深层低分辨率特征层，引用注意力机制进行处理，得到更深层的特征层；2b)在语义分割模型中的小目标特征融合ASPP特征融合结构的基础上增加一个新的小目标特征融合分支，并调整其内部空洞卷积的空洞率参数为4、8、12、16，形成多尺度小目标特征融合ASPP
‑
6结构,用于以加强融合后的第一个深层低分辨率特征层；2c)利用语义分割网络模型中的主干网络提取适合小目标分割的浅层高分辨率特征层，使用1x1卷积对通道数进行调整处理，并将该通道数调整后的浅层高分辨率特征层与2b)中加强融合后的低分辨率特征层引用concat函数进行堆叠处理，形成残差网络结构；2d)将步骤2a)通过注意力机制处理后的主干网络、步骤2b)形成的多尺度小目标特征融合ASPP
‑
6结构、步骤2c)形成的残差网络结构依次级联，构成大地背景小目标分割模型；(3)对大地背景小目标分割模型进行训练：(3a)利用现有的Pascal VOC2007公开数据集的训练集，采用先前向传播、再反向传播的训练方式对大地背景小目标分割模型进行预训练，得到预训练后的大地背景小目标分割模型；3b)利用语义分割模型的训练集，使用先冻结骨干网络、再解冻骨干网络的两阶段训练方式，对预训练后的大地背景小目标分割模型再进行训练,得到训练好的大地背景小目标语义分割模型，并生成经由语义分割模型的训练集训练的模型权重文件。(4)基于语义分割模型的验证集，对训练好的大地背景小目标语义分割模型，使用大地背景小目标分割模型的预测脚本文件进行验证，实现大地背景和小目标的区域粗分割；(5)基于1c)中的yolov5
‑
s小目标检测网络模型的训练集，使用混合精度训练方法对yolov5
‑
s小目标检测网络模型进行训练，获得训练好的大地背景下小目标识别模型，并生成经由小目标检测网络模型的训练集训练的模型权重文件。(6)使用训练好的大地背景下小目标识别模型对大地背景小目标语义分割模型粗分割后的图片数据集进行检测，检测出图片数据集中大地背景下小目标的位置和类别，即在大地背景和小目标的区域粗分割的基础上再对大地背景下小目标的识别，实现背景分割和目标识别的级联组合检测。2.根据权利要求1所述的方法，其特征在于，步骤1a)中对大地背景下的小目标可见光图像数据集进行图像增强和软件标注的预处理，实现如下：1a1)引用OpenCv库的中值滤波函数，使用中值滤波的滤波核与待处理图片中的每一个像素进行卷积操作，并增加各类小目标在图片中的数量，随机对于一些图片中的小目标进行翻转和缩放，实现对数据集的图像增强处理：
1a2)用Labelme软件标注是用线条勾画出每一个小目标的轮廓，即用矩形框框出待检测的小目标，并为每一类小目标设置一种类别，生成地背景小目标检测模型的图像标注数据集。3.根据权利要求1所述的方法，其特征在于，步骤2a)中引用注意力机制对浅层高分辨率特征层的处理，采用通道注意力机制进行，具体实现如下：2a1)对浅层高分辨率特征层先进行全局平均池化，再进行两次全连接的处理；2a2)引用sigmoid函数计算经3a1)处理后特征层每一个特征点的权值w，并将该权值与输入的浅层高分辨率特征层相乘，完成对浅层高分辨率特征层的注意力机制处理，其中w取值在0
‑
1之间。4.根据权利要求1所述的方法，其特征在于，步骤2a)中引用注意力机制对2个深层低分辨率特征层的处理，采用通道注意力机制与空间注意力机制进行，具体实现如下：2a3)对2个深层低分辨率特征层的通道注意力机制处理：所述通道注意力机制的处理分为2条支路，每个深层低分辨率特征层先通过第一条支路依次进行全局平均池化、第一全连接层、relu激活函数、第二全连接层的处理；再通过第二条支路依次进行最大池化、第一全连接层、relu激活函数、第二个全连接层的处理；之后，将两条支路的处理结果进行相加，并经过sigmoid函数计算每个输入深层低分辨率特征层的每一...

【专利技术属性】
技术研发人员：张维光，苏鹏创，冀文欢，
申请(专利权)人：西安工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人