当前位置: 首页 > 专利查询>之江实验室专利>正文

一种多阶段遥感图像目标检测方法、装置、设备和介质制造方法及图纸

技术编号:39195187 阅读:8 留言:0更新日期:2023-10-27 08:42
本申请涉及一种多阶段遥感图像目标检测方法、装置、计算机设备和计算机可读存储介质,其中,多阶段遥感图像目标检测方法包括:将遥感图像输入至预先训练的第一目标检测网络,输出多个预测框及对应的预测信息;在所述预测框对应的置信度大于第二阈值的情况下,获得第一目标检测结果;在所述预测框对应的置信度介于第一阈值和所述第二阈值之间的情况下,根据所述预测框的位置信息对所述遥感图像进行剪切、旋转、缩放处理后输入至预先训练的第二目标检测网络,获得第二目标检测结果;基于所述第一目标检测结果和所述第二目标检测结果,得到最终目标检测结果。解决了遥感图像目标检测结果精度低的问题,提高了遥感图像目标检测结果的准确性。准确性。准确性。

【技术实现步骤摘要】
一种多阶段遥感图像目标检测方法、装置、设备和介质


[0001]本申请涉及信息处理
,特别是涉及一种多阶段遥感图像目标检测方法、装置、计算机设备和计算机可读存储介质。

技术介绍

[0002]目标检测是计算机视觉领域最重要也是最具有挑战性的分支之一。它在人们生活中得到了广泛的应用,如监控安全、自动驾驶等。目标检测的任务是定位某一类语义对象的实例。
[0003]遥感图像目标检测在高科技军事对抗中用以获得及时准确的战场信息、捕捉战略打击目标、提供精确的定性定位信息等。在资源探测、环境监测、城市规划等民用领域,也起着举足轻重的作用。通过对卫星、航空或者航天飞行器获得的遥感图像进行目标识别,能够了解所拍摄地区的地形、装备、部队调用等情况信息。
[0004]区别于一般地面图像,遥感图像是俯拍,且由于卫星、航天飞行器的在飞行过程中的姿态、高度都在变化,导致获取的目标存在多角度、多尺度的问题。例如,船舰可能朝向上、下、左、右任意方向,且分辨率可能为1m每像素或5m每像素。当前地面目标检测算法大都是针对单一角度,例如监控摄像头下的行人检测、车辆检测,目标物为直立的人与车辆,目标角度相近,行人或车辆都垂直于水平轴线。且当前的目标回归框大都为水平矩形框,将水平矩形框预测应用于遥感图像目标检测中,会导致不同角度下的目标物框内特征变化大。
[0005]基于算法实时性,Yolo算法已经广泛应用于工业界。Yolo为典型的单阶段目标检测算法,其原理为通过多尺度(一般为三个尺度)的特征层,分别负责检测不同大小目标物,每个特征点负责检测中心点在其位置的物体,每个特征点都会输出相应的预测结果。
[0006]对于目标检测算法来说,需在模型后处理阶段进行置信度阈值筛选,由于深度学习数据集的分布并非完全均匀,导致在实际使用时每个场景的目标检测结果置信度分布不均匀。例如噪声图像的置信度整体偏低,且各个目标检测结果的置信度分布较为集中。而高清图像可以很好地检测出目标,故有目标结果置信度高,无目标结果置信度低,置信度分布较为分散。为了使检测结果的准确率保持高标准,通常会设置偏高的置信度筛选阈值,这会导致目标的召回率很低。另外,由于遥感图像目标物的多角度、多尺度特性,导致数据分布范围广,用单一的模型很难兼顾大目标与小目标。
[0007]针对相关技术中,遥感图像目标检测结果精度低的问题,目前尚未提出有效的解决方案。

技术实现思路

[0008]基于此,有必要针对上述技术问题,提供一种多阶段遥感图像目标检测方法、装置、计算机设备和计算机可读存储介质。
[0009]第一方面,本申请实施例提供了一种多阶段遥感图像目标检测方法,所述方法包括:
[0010]将遥感图像输入至预先训练的第一目标检测网络,输出多个预测框及对应的预测信息;所述预测信息包括置信度、分类概率以及所述预测框的位置信息;
[0011]在所述预测框对应的置信度大于第二阈值的情况下,获得第一目标检测结果;
[0012]在所述预测框对应的置信度介于第一阈值和所述第二阈值之间的情况下,根据所述预测框的位置信息对所述遥感图像进行剪切,获得至少一个第一遥感图像,并对各所述第一遥感图像进行旋转、缩放处理后输入至预先训练的第二目标检测网络,获得第二目标检测结果;其中,所述第一阈值小于所述第二阈值;
[0013]基于所述第一目标检测结果和所述第二目标检测结果,得到最终目标检测结果。
[0014]在其中一个实施例中,所述位置信息包括所述预测框的长度、宽度、所述预测框长边在直角坐标系中与x轴正方向的夹角以及所述预测框的中心坐标;其中,所述直角坐标系以所述遥感图像左上角顶点为原点,以水平向右为x轴正方向,以竖直向下为y轴正方向建立。
[0015]在其中一个实施例中,所述对各所述第一遥感图像进行旋转、缩放处理包括:
[0016]对各所述第一遥感图像进行旋转,使得各所述第一遥感图像的长边与x轴方向的夹角为零,并按照相同的预设尺寸对各所述第一遥感图像进行缩放。
[0017]在其中一个实施例中,所述对各所述第一遥感图像进行旋转、缩放处理后输入至预先训练的第二目标检测网络,获得第二目标检测结果包括:
[0018]以各所述第一遥感图像的缩放比例为像素值,以所述预设尺寸为大小,生成对应的缩放信息图;
[0019]分别将缩放后的第一遥感图像和对应的所述缩放信息图进行拼接处理,获得至少一个第二遥感图像;
[0020]将至少一个所述第二遥感图像输入至预先训练的第二目标检测网络,获得第二目标检测结果。
[0021]在其中一个实施例中,所述将至少一个所述第二遥感图像输入至预先训练的第二目标检测网络,获得第二目标检测结果包括:
[0022]将至少一个所述第二遥感图像输入至预先训练的第二目标检测网络,输出至少一个预测框及对应的预测信息;
[0023]在所述预测框对应的置信度大于第三阈值的情况下,获得第二目标检测结果。
[0024]在其中一个实施例中,所述将遥感图像输入至预先训练的第一目标检测网络之前包括:
[0025]获取第一训练样本,所述第一训练样本为通过旋转、剪切、拼接、亮度对比变化、模糊、缩放后进行数据增广的遥感图像;
[0026]将所述第一训练样本输入至卷积神经网络,利用特征提取网络提取特征图,进一步使用金字塔网络结构融合多尺度特征,获得最终特征图,并基于所述特征图,获取检测结果;
[0027]基于所述检测结果与真实结果计算损失函数;
[0028]基于所述损失函数更新所述卷积神经网络的参数,获得所述预先训练的第一目标检测网络。
[0029]在其中一个实施例中,所述对各所述第一遥感图像进行旋转、缩放处理后输入至
预先训练的第二目标检测网络之前包括:
[0030]获取第二训练样本,所述第二训练样本包括经过剪切后有目标物的遥感图像以及无目标物的遥感图像,并对剪切后的遥感图像进行旋转、缩放处理;
[0031]将所述第二训练样本输入至卷积神经网络提取特征图,并基于所述特征图,获取检测结果;
[0032]基于所述检测结果与真实结果计算损失函数;
[0033]基于所述损失函数更新所述卷积神经网络的参数,获得所述预先训练的第二目标检测网络。
[0034]在其中一个实施例中,所述对所述遥感图像进行旋转、缩放处理之前包括:
[0035]对所述遥感图像进行扰动,所述扰动包括中心位置扰动、长宽扰动、角度扰动中的至少一种。
[0036]第二方面,本申请实施例还提供了一种多阶段遥感图像目标检测装置,所述装置包括:
[0037]输入模块,用于将遥感图像输入至预先训练的第一目标检测网络,输出多个预测框及对应的预测信息;所述预测信息包括置信度、分类概率以及所述预测框的位置信息;
[0038]第一目标检测模块,用于在所述预测框对应的置信度大于第二阈值的情况下,获得第一目标检测结果;
[0039]第二目标检测模块,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多阶段遥感图像目标检测方法,其特征在于,所述方法包括:将遥感图像输入至预先训练的第一目标检测网络,输出多个预测框及对应的预测信息;所述预测信息包括置信度、分类概率以及所述预测框的位置信息;在所述预测框对应的置信度大于第二阈值的情况下,获得第一目标检测结果;在所述预测框对应的置信度介于第一阈值和所述第二阈值之间的情况下,根据所述预测框的位置信息对所述遥感图像进行剪切,获得至少一个第一遥感图像,并对各所述第一遥感图像进行旋转、缩放处理后输入至预先训练的第二目标检测网络,获得第二目标检测结果;其中,所述第一阈值小于所述第二阈值;基于所述第一目标检测结果和所述第二目标检测结果,得到最终目标检测结果。2.根据权利要求1所述的方法,其特征在于,所述位置信息包括所述预测框的长度、宽度、所述预测框长边在直角坐标系中与x轴正方向的夹角以及所述预测框的中心坐标;其中,所述直角坐标系以所述遥感图像左上角顶点为原点,以水平向右为x轴正方向,以竖直向下为y轴正方向建立。3.根据权利要求1所述的方法,其特征在于,所述对各所述第一遥感图像进行旋转、缩放处理包括:对各所述第一遥感图像进行旋转,使得各所述第一遥感图像的长边与x轴方向的夹角为零,并按照相同的预设尺寸对各所述第一遥感图像进行缩放。4.根据权利要求3所述的方法,其特征在于,所述对各所述第一遥感图像进行旋转、缩放处理后输入至预先训练的第二目标检测网络,获得第二目标检测结果包括:以各所述第一遥感图像的缩放比例为像素值,以所述预设尺寸为大小,生成对应的缩放信息图;分别将缩放后的第一遥感图像和对应的所述缩放信息图进行拼接处理,获得至少一个第二遥感图像;将至少一个所述第二遥感图像输入至预先训练的第二目标检测网络,获得第二目标检测结果。5.根据权利要求4所述的方法,其特征在于,所述将至少一个所述第二遥感图像输入至预先训练的第二目标检测网络,获得第二目标检测结果包括:将至少一个所述第二遥感图像输入至预先训练的第二目标检测网络,输出至少一个预测框及对应的预测信息;在所述预测框对应的置信度大于第三阈值的情况下,获得第二目标检测结果。6.根据权利要求1所述的方法,其特征在于,所述将遥感图像输入至预先训练的第一目标检测网络之前包括:获取第一训练...

【专利技术属性】
技术研发人员:许婷婷邱吉冰王颖王原原毛旷
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1