一种基于样本重加权的遥感图像多类目标检测方法技术

技术编号:27468136 阅读:27 留言:0更新日期:2021-03-02 17:32
本发明专利技术提供了一种基于样本重加权的遥感图像多类目标检测方法。首先,进行图像数据增广处理和尺度缩放预处理;然后,构建目标检测网络,包括特征提取模块、特征增强模块和检测头部模块,为了实现特征的显著性表达,针对部分特征层级进行特征增强操作;接着,进行网络端到端的训练过程,采用样本重加权策略来引导训练网络更多关注纵横比差异大的目标样本,以此来优化训练模型;最后,实现目标检测过程,将待检测遥感图像输入到训练好的目标检测网络中,得到每个先验框的类别预测值和其坐标偏移量,再使用非极大值抑制来过滤掉针对同一目标的重叠率较高的检测结果。本发明专利技术具有较高的遥感图像目标检测精度和速度。感图像目标检测精度和速度。感图像目标检测精度和速度。

【技术实现步骤摘要】
一种基于样本重加权的遥感图像多类目标检测方法


[0001]本专利技术属遥感图像处理
,具体涉及一种基于样本重加权的遥感图像多类目标检测方法,可以用于提升遥感图像数据集中纵横比差异较大的目标类别的检测效果。

技术介绍

[0002]遥感图像目标检测,是遥感大数据信息应用领域中的一项关键技术,高分辨率遥感图像数据和地理信息系统紧密结合,在未来的城市道路规划、工程项目评估以及可再生资源的监测评估等方面将有广阔的发展前景。随着大数据时代的到来以及计算机硬件性能的大幅提高,基于深度学习技术的目标检测算法突破了以往基于手工特征的目标检测技术瓶颈,成为现阶段光学图像目标检测任务的主流方法,并且受到了领域内学者和专家们的广泛关注。
[0003]基于深度学习的主流目标检测方法按照anchor(锚框)的产生方式主要分为两大类,一类是以Anchor-Based为核心的通用目标检测算法,最具有代表性的工作是由Kaiming He等人在《Conference and Workshop on Neural Information Processing Syst本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于样本重加权的遥感图像多类目标检测方法,其特征在于步骤如下:步骤1,图像数据预处理:首先,对原始遥感图像数据集中的图像进行数据增广处理,然后,对处理后的图像进行尺度缩放,使所有输入图像具有相同的尺寸;步骤2,构建目标检测网络,包括特征提取模块、特征增强模块和检测头部模块,其中,特征提取模块采用修改后的VGG16网络,即将VGG16的全连接层FC6替换为卷积核为3
×
3、卷积步长为1、卷积增补为6、空洞卷积率为6的卷积层,将全连接层FC7替换为卷积核为1
×
1、卷积步长为1的卷积层,输入图像经过特征提取模块得到长宽尺寸依次递减的多尺度特征图{C
A1
,C
A2
,C
A3
,C
A4
,C
A5
,C
A6
,C
A7
};特征增强模块对{C
A1
,C
A2
,C
A3
,C
A4
}这4组特征图进行处理,针对特征图{C
A1
}分别采用3
×
3和5
×
5的卷积核进行卷积操作得到{C
A13
,C
A15
},并将原特征图{C
A1
}与卷积后的特征图{C
A13
,C
A15
}的对应元素相加,得到融合后的特征图{C'
A1
},针对特征图{C
A2
}采用与上述相同的操作得到融合后的特征图{C'
A2
};同时,针对特征图{C
A3
}分别采用1
×
1和3
×
3的卷积核进行卷积操作得到{C
A31
,C
A33
},并将原特征图{C
A3
}与卷积后的特征图{C
A31
,C
A33
}的对应元素相加,得到融合后的特征图{C'
A3
},针对特征图{C
A4
}采用与上述相同的操作得到融合后的特征图{C'
A4
};经过特征增强模块获得新的特征图组{C'
A1
,C'
A2
,C'
A3
,C'
A4
},最终多尺度特征图表示为{C'
A1
,C'
A2
,C'
A3
,C'
A4
,C
A5
,C
A6
,C
A7
},它们的长宽尺度依次递减;检测头部模块包括分类分支和回归分支,分类分支为卷积核为3x3、卷积步长为1、卷积增补为1的网络,将多尺度特征图输入到分类分支,输出为该特征图中每个先验框的类别预测值;回归分支为卷积核为3x3、卷积步长为1、卷积增补为1的网络,将多尺度特征图输入到回归分支,输出为该特征图中每个先验框的坐标偏移量;针对特征图上每个像素点,添加不同尺度和长宽比的先验框,具体如下:对于特征图C'
A1
,其先验框尺度设置为input_size
×
4/100,input_size表示输入图像的尺寸;对于其他特征图,其先验框尺度按以下公式计算得到:其中,m指除C'
A1
外特征图的个数,这里m=6,s
k
表示第k个特征图中的先验框的尺度,k=2、3、4、5、6、7依次表示特征图C'
A2
、C'
A3
、C'
A4
、C
A5
、C
A6
、C
A7
,s
min
表示比例的最小值,本发明中为s
min
=0.1,s
max
表示比例的最大值,本发明中为s
max
=0.9;针对特征图{C'
A1
,C'
A2
,C
A7
}的每个像素点,分别设置4个先验框,其中3个框的长宽比依次设定为1:1、2:1、1:2,另外,在每一组特征图上设置一组尺度信息为且长宽比为1:1的先验框,k=1、2、7,其中,s8=input_szie
×
106/100;针对特征图{C'
A3
,C'
A4
,C
A5
,C
A6
}的每个像素点,分别设置6个先验框,其中5个框的长宽比依次设定为1:1、2:1、1:2、1:3、3:1,另外,在每一组特征图上额外设置一组尺度信息为且长宽比为1:1的先验框,k=3、4、5、6;将所有先验框按照像素点位置映射到输入图像上;步骤3,对网络进行端到端的训练:将步骤1预处理后的图片输入到步骤2构建的目标检测网络进行训练,当达到设定的训练总次数时,停止训练,得到训练好的目标检测网络;其
中,网络训练参数分别设定为:训练总次数设置为24个epoch,初始学习率为2.5e-4
,一个批次...

【专利技术属性】
技术研发人员:程塨司永洁姚西文韩军伟郭雷
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1