当前位置: 首页 > 专利查询>济南大学专利>正文

一种基于自解码的特征增强网络优化方法及系统技术方案

技术编号:34849913 阅读:18 留言:0更新日期:2022-09-08 07:49
本发明专利技术公开了一种基于自解码的特征增强网络优化方法及系统,包括以下步骤:S1、构建自解码器模块;S2、将自解码器模块引入到一般的基于卷积神经网络的物体检测模型中,将构建好的自解码器模块引入到物体检测模型的骨干网络;S3、划分物体检测数据集;S4、对数据集中的图像进行预测处理;S5、使用训练数据用物体检测模型和解码器进行协同训练;S6、将自解码器移除;S7、将验证数据送入到检测模型进行检测;S8、得到检测结果,将S7得到检测结果映射到原图的相应位置并标注预测的类别信息。本发明专利技术具有将强的嵌入型,且不增加预测时长,而且和更深的骨干网络的预测结果相比也不逊色。深的骨干网络的预测结果相比也不逊色。深的骨干网络的预测结果相比也不逊色。

【技术实现步骤摘要】
一种基于自解码的特征增强网络优化方法及系统


[0001]本专利技术涉及遥感图像建筑检测
,具体为一种基于自解码的特征增强网络优化方法及系统。

技术介绍

[0002]随着高分卫星的快速发展,从遥感图像中获得有用的目标检测结果,从而对卫星影像进行理解变得重要,且成为当前遥感领域的研究热点。其中建筑物检测对与城市规划、灾害检测、生态环境管理和军事都有重要的意义。由于卷积神经网络强大的特征提取能力,目前基于深度卷积神经网络的目标检测算法在建筑物检测的领域比较流行。但是,相比于普通场景的图像,卫星影像的建筑物检测面临着以下挑战:建筑物图像的场景复杂性更高,不同时相和不同分辨率的图像差异大。这导致了在对于建筑物图像检测面临着巨大的挑战。、
[0003]Girshick等人在2014年发表论文“Rich feature hierarchies foraccurate object detection and semantic segmentation”(In Proceedingsof the IEEE conference on computer vision and pattern recognition),成功将深度学习方法应用到目标检测上,它使用传统的selective search算法对图像进行裁剪,然后通过神经网络进行特征提取,最后通过SVM进行分类。但是由于其需要将裁剪后的图像送入网络2000次,大大增加了网络的开销,检测速度较慢。
[0004]2015年,Girshick借鉴了SPPNet的思想发表论文“Fast r

cnn”(InProceedings of the IEEE international conference on computer vision),采用映射的方式对R

CNN进行改进提出了Fast R

CNN,首先拿到一张图片,使用selective search选取建议框,然后将原始图片输入卷积神经网络之中,获取特征图,对每个建议框,从特征图中找到对应位置(按照比例寻找即可),截取出特征框(深度保持不变)将每个特征框划分为(7x7)个网格,然后对每个矩阵拉长为一个向量,分别作为之后的全连接层的输入,全连接层的输出有两个,计算分类得分和bounding box回归,最后对输出的得分矩阵使用非极大抑制方法选出少数框。该方法不仅提高了检测速度,而且同时提高了检测精度。但是没有解决端到端的问题,检测速度仍然比较慢。
[0005]Shaoqing Ren和Kaiming He等人发表论文“Faster r

cnn:Towardsreal

time object detection with region proposal networks”(Advancesin neural information processing systems),在Fast R

CNN的基础上继续改进,他们在Fast R

CNN的基础上引入了一个区域建议网络(RPN),通过RPN 网络对提取的特征生成建议框,然后将生成的建议框和特征图送到 ROIpooling中进行裁剪,然后送到Fast R

CNN预测头中进行预测。改方法使得Fast R

CNN成为一个端到端的目标检测网络,在保持检测精度的同时,显著的提高检测速度。
[0006]但是,相比于普通场景的图像,由于遥感图像存在着场景复杂度较高,实相和分辨率的差异,使得一般的基于卷积神经网络的检测模型在特征提取阶段,提取的特征不完善,
以至于接下来的检测精度不理想。

技术实现思路

[0007]本专利技术的目的在于针对现有技术不足,提出一种基于自解码的特征增强网络优化方法,解决了由于遥感图像场景复杂性较高等一系列原因导致的特征提取不完整,检测精度低的问题。
[0008]为实现上述目的,本专利技术提供如下技术方案:
[0009]一种基于自解码的特征增强网络优化方法及系统,包括以下步骤:
[0010]S1、构建自解码器模块:构建一个由四个上采样模块和一个上采样操作组成的解码器;
[0011]S2、将自解码器模块引入到一般的基于卷积神经网络的物体检测模型中,将构建好的自解码器模块引入到物体检测模型的骨干网络;
[0012]S3、划分物体检测数据集;
[0013]S4、对数据集中的图像进行预测处理;
[0014]S5、使用训练数据用物体检测模型和解码器进行协同训练;
[0015]S6、将自解码器移除,检测时,不使用自解码器,移除自解码器,只使用原检测模型进行结果的预测;
[0016]S7、将验证数据送入到检测模型进行检测;
[0017]S8、得到检测结果,将S7得到检测结果映射到原图的相应位置并标注预测的类别信息。
[0018]优选的,S1中上采样模块的结构依次为:上采样

第一残差块

第二残差块

融合层;其中每个残差块的结构为:输入层
→1×
1卷积
→3×
3卷积
→1×
1卷积;融合层是对输入到每个上采样模块的特征图做个1
×
1卷积和上采样后生成的特征图和最后一个残差块生成的特征图融合,其中残差块不会改变特征图的大小,每个1
×
1卷积的卷积核个数为输入通道的1/4,在每个卷积后面跟bn层和激活函数,最后一个上采样操作后跟一个sigmoid函数。
[0019]优选的,S3中选取一些标注好的光学遥感图像,图像长宽不限,每个batch 会对图像做预处理,将batch内图像缩放,然后填补成统一大小的图像,如果数据集类别多难训练则需要的图像要多,简单的数据集可以用1000+图像即可,然后将67%的图像组成训练集,将33%的图像组成验证集和测试集。
[0020]优选的,S4中对每个mini

batch中的数据进行50%的概率的水平翻转,然后对每个mini

batch中的图像固定长宽的比例,对长进行缩放至400

600 大小32的整数倍,然后将宽填补至400

600大小32的整数倍。
[0021]优选的,S5中协同训练包括以下步骤:
[0022]S51、将预处理的数据输入到骨干网络(resnet50或resnet101等)中进行特征提取,生成特征图C5;
[0023]S52、将特征图C5送入到物体检测的检测头(YOLO检测头或Fast R

CNN 检测头等)进行类别和边界框的预测,然后和真实标签计算交叉熵损失和边界框损失;
[0024]S53、将第一步生成的特征图C5送入到自解码器器模块进行四个上采样模块、一个
上采样操作和si本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自解码的特征增强网络优化方法及系统,其特征在于,包括以下步骤:S1、构建自解码器模块:构建一个由四个上采样模块和一个上采样操作组成的解码器;S2、将自解码器模块引入到一般的基于卷积神经网络的物体检测模型中,将构建好的自解码器模块引入到物体检测模型的骨干网络;S3、划分物体检测数据集;S4、对数据集中的图像进行预测处理;S5、使用训练数据用物体检测模型和解码器进行协同训练;S6、将自解码器移除,检测时,不使用自解码器,移除自解码器,只使用原检测模型进行结果的预测;S7、将验证数据送入到检测模型进行检测;S8、得到检测结果,将S7得到检测结果映射到原图的相应位置并标注预测的类别信息。2.根据权利要求1所述的一种基于自解码的特征增强网络优化方法及系统,其特征在于:S1中上采样模块的结构依次为:上采样

第一残差块

第二残差块

融合层;其中每个残差块的结构为:输入层
→1×
1卷积
→3×
3卷积
→1×
1卷积;融合层是对输入到每个上采样模块的特征图做个1
×
1卷积和上采样后生成的特征图和最后一个残差块生成的特征图融合,其中残差块不会改变特征图的大小,每个1
×
1卷积的卷积核个数为输入通道的1/4,在每个卷积后面跟bn层和激活函数,最后一个上采样操作后跟一个sigmoid函数。3.根据权利要求1所述的一种基于自解码的特征增强网络优化方法及系统,其特征在于:S3中选取一些标注好的光学遥感图像,图像长宽不限,每个batch会对图像做预处理,将batch内图像缩放,然后填补成统一大小的图像,如果数据集类别多难训练则需要的图像要多,简单的数据集可以用1000+图像即可,然后将67%的图像组成训练集,将33%的图像组成验证集和测试集。4....

【专利技术属性】
技术研发人员:徐涛路丘董吉文
申请(专利权)人:济南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1