一种基于旋转区域生成网络的遥感图像目标检测方法技术

技术编号：27452654 阅读：32 留言：0更新日期：2021-02-25 04:41

本发明专利技术公开一种基于旋转区域生成网络的遥感图像目标检测方法，使用该方法进行旋转目标检测的流程包含以下步骤：获取遥感图像数据集，按照一定比例选取构成训练集与测试集，并使用五元组的旋转边界框标记训练集；搭建深度学习网络框架，设计网络损失函数用于网络训练；使用训练集图像对网络框架进行训练；利用训练好的模型测试测试集得到带有旋转角度信息的目标检测结果。利用该方法可以有效解决提取具有旋转不变性的特征描述目标的不同朝向的问题，在保证效率的同时提高了网络检测旋转目标的鲁棒性，并在公开数据集上验证了检测网络的有效性。该方法可被广泛应用于存在多方向性目标的目标检测任务中。性目标的目标检测任务中。性目标的目标检测任务中。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于旋转区域生成网络的遥感图像目标检测方法

[0001]本专利技术涉及模式识别、图像处理领域，具体涉及一种基于旋转区域生成网络的遥感图像目标检测方法。

技术介绍

[0002]遥感图像目标检测应用中另一个重要问题是对旋转目标的检测。在普通图像中目标都是水平视角，由于重力作用，待检目标一般都具有一定的方向先验知识，例如树都是竖直生长的，汽车的轮子一般是朝下的而不会上下颠倒等等。然而由于视角的原因，遥感图像中的视角基本都是高空俯视，目标的方向都是不确定的，可以呈现不同的方向。因此，如何提取具有旋转不变性的特征描述目标的不同朝向成为一个重要的问题。在通用目标检测任务中，一般采用{8
×
8，16
×
16，32
×
32}
×
{1∶1，1∶2，2∶1}设置的锚框即可覆盖自然场景下的大多数常见目标。然而对于一些特殊场景的目标检测任务，例如文本行检测和遥感目标检测，这种与坐标轴对齐的锚框设置的鲁棒性较差。

技术实现思路

[0003]专利技术目的：针对以上问题，本专利技术提出一种基于旋转区域生成网络的遥感图像目标检测方法，通过设计包含旋转目标候选区域的预测、旋转ROI池化以及斜框NMS的后处理模块的旋转区域生成网络以解决遥感图像中多方向性目标的检测问题。
[0004]技术方案：为实现本专利技术的目的，本专利技术提出一种基于旋转区域生成网络的遥感图像目标检测方法，具体包括以下步骤：
[0005]步骤1：获取遥感图像数据集，按照一定比

【技术保护点】

【技术特征摘要】
1.一种基于旋转区域生成网络的遥感图像目标检测方法，其特征在于，该方法包括以下步骤：步骤1：获取遥感图像数据集，按照一定比例选取构成训练集与测试集，并使用五元组的旋转边界框标记训练集；步骤2：搭建深度学习网络框架，设计网络损失函数用于网络训练；步骤3：使用训练集图像对网络框架进行训练；步骤4：利用训练好的模型测试测试集得到带有旋转角度信息的目标检测结果。2.根据权利要求1所述的一种基于旋转区域生成网络的遥感图像目标检测方法，其特征在于，所述步骤1，获取遥感图像数据集，按照一定比例选取构成训练集与测试集，并使用五元组的旋转边界框标记训练集，方法如下：获取遥感图像数据集，按照一定比例将其分成训练集与测试集，对于训练集，将每张图像上需要检测的每一个目标使用一个五元组(x，y，w，h，θ)来编码旋转边界框确定其在原图像中的位置信息，即真实边界框；其中，(x，y)表示该目标的真实边界框中心点在原图中的坐标，(w，h)表示该目标的真实边界框的宽度和高度，θ表示该目标的真实边界框与原图像水平x轴正方向的夹角，并规定θ属于[0，π)区间内，将训练集中每张图片的每个包含五元组信息的真实边界框以及其对应的目标类别信息记录到文本文件中生成标注文件，完成对训练集的标注；测试集中的图像按照上述方法处理，但是测试集图像不需要进行标注。3.根据权利要求1或2所述的一种基于旋转区域生成网络的遥感图像目标检测方法，其特征在于，所述步骤2，搭建深度学习网络框架，设计网络损失函数用于网络训练，方法如下：搭建深度学习网络框架，将训练集中的图像输入ResNet网络中生成特征图；在ResNet网络后面增加旋转候选区域生成网络，用于在特征图上预测区分前景和背景，旋转候选区域生成网络的输入为特征图，输出为该特征图上预测生成的带有旋转角度信息的目标候选区域，即预测框，目标候选区域包括(x，y，w，h，θ)这5个参数，旋转候选区域生成网络在传统RPN网络基础上增加了θ角度参数，即在生成预测框参数时从原来的(x，y，w，h)4参数增加为(x，y，w，h，θ)5参数；旋转候选区域生成网络采用多任务损失函数，其中分类损失为：L
cls
(p，u)＝-log pu其中，u定义为旋转边界框的样本类别标签，当u＝1表示旋转边界框包含目标，即前景；当u＝0表示旋转边界框不包含目标，即背景，不参与计算；p为预测框通过Softmax函数计算得到的分类概率，即旋转候选区域生成网络生成的预测框是前景的概率；回归损失为：其中，v＝(v
x
，v
y
，v
w
，v
h
，v
θ
)表示候选区域的预测框的5个预测参数，v
*
＝(v
x*
，v
y*
，v
w*
，v
h*
，v
θ*
)表示真实值的5个参数，其中，函数定义为：
为了实现尺度不变性，还需要对v和v
*
进行...

【专利技术属性】
技术研发人员：段连元，
申请(专利权)人：南京泓图人工智能技术研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人