遥感图像地物语义分割方法技术

技术编号:27879894 阅读:10 留言:0更新日期:2021-03-31 01:12
本发明专利技术公开的一种遥感图像地物语义分割方法,旨在提高遥感图像地物分割精准度,解决边缘识别不够精细的问题。本发明专利技术通过下述技术方案实现:构建金字塔场景解析网络,把具备较强图像特征挖掘能力的网络模型从相关领域中迁移至语义分割网络模型,从通道维度挖掘遥感影像所包含的信息;结合通道注意力机制挖掘遥感影像所包含的光谱信息和数据相关型上采样模块对不同空间尺度的特征图上采样至原始特征图大小并与原始特征图进行拼接;采用损失函数塔有效地降低梯度消失和梯度爆炸风险,采用基于IoU的损失函数进一步提升图像边缘的预测效果;用标注后的训练数据训练网络模型,将测试集数据输入优化后的语义分割网络模型,识别影像中的不同地物。

【技术实现步骤摘要】
遥感图像地物语义分割方法
本专利技术属于遥感图像语义分割
,特别是涉及一种基于深度神经网络的遥感图像地物语义分割方法。
技术介绍
遥感技术的发展推动遥感图像数据爆发式增长,并呈现出更高分辨率、更大幅宽的趋势。所谓遥感,是从远距离感知目标物,也即从远距离探测目标物的物性。“遥”具有空间概念,从近地空间,外层空间乃至宇宙空间来获取目标物的空间信息。“感”系指信息系统,包括信息获取和传输、信息加工处理、信息分析和可视化系统等。遥感(Remote),是从远处探测、感知物体或事物的技术。即不直接接触物体本身,从远处通过各种传感器探测和接收来自目标物体的信息,经过信息的传输及其处理分析,来识别物体的属性及其分布等特征的综合技术。狭义遥感是指不与目标物接触,从远处用探测器接收来自目标物的电磁波信息,通过对信息的处理和分析研究,确定目标的属性及目标物的相互间的关系。语义分割网络在自然场景图像中展现了强大的特征提取能力。遥感所收集的信息是由目标物反射或发射的电磁波信息。遥感之所以能够根据收集到电磁波信息来解析地面目标物和现象,是由于不同的物体种类及其所处环境具有完全不同的电磁波的反射或发射辐射的特性。遥感卫星为卫星遥感活动的主体,包括气象卫星、资源卫星、海洋卫星和雷达卫星,统称为环境卫星系列。语义分割网络在自然场景图像中展现了强大的特征提取能力。卫星遥感图像反映地物目标电磁辐射特性的空间分布状况,广泛应用于环境监测、城市建设等领域。卫星遥感图像区别于普通三通道图像(RGB图像),它含有包含丰富的地物信息和光谱信息,处理过程复杂,如何实现遥感图像的智能解译一直是学术界和工业界面临的难题。传统的无监督聚类方法和机器学习方法很难充分利用影像的空间特征,无法实现高精度的地物分割。普通的像元分类方法,如支持向量机(SVM)和随机森林(RF)等,只能提取出像元统计特征和植被指数特征,无法得到遥感影像中丰富的空间信息,特征表达能力有限,得到的分割结果边缘较为粗糙,识别精度不高。并且通过统计机器学习方法得到的像元分类结果,还需要进行结果拼接才能生成地物分割结果影像,时间成本相对较高。从高分辨遥感影像上提取与识别地物的位置、形状、类别是后续高层处理的关键步骤,因此,高分辨率遥感影像分割,尤其是语义分割已经成为该领域重要的问题之一。现有的语义标注方法对遥感场景中复杂背景引入的噪声敏感,对多尺度地物要素的语义感知能力差。通常使用空洞卷积来提升卷积神经网络的特征感受野,然而目前多尺度带孔结构包含感受野大小和种类有限,仍然无法标注高分辨率遥感场景中复杂的地物要素,难以在多尺度要素造成大类间差异的情况下进行语义信息的获取。现有方法通常直接对多模态图像或特征直接进行合并或相加,其特征学习完全依赖卷积神经网络的性能,忽略了不同模态固有的数据结构、特征复杂程度的差异,容易引入冗余的特征,造成标注性能降低,网络规模和参数量冗余。这些方法在解决特定目标的划分或者对特定的数据集可以达到较高的准确率,但在不同物体不同数据集上不具备很好的适用性。从高分辨遥感影像上提取与识别地物的位置、形状、类别是后续高层处理的关键步骤,因此,高分辨率遥感影像分割,尤其是语义分割已经成为该领域重要的问题之一。随着遥感影像空间分辨率的提高,地物纹理细节更加丰富,海量的遥感影像数据也随之到来。由于地物类别在遥感图像上分布不平衡,不同分割目标边缘易重叠,个别分割目标尺度较小,纹理细节难以分辨。高分辨率遥感影像中包含不同尺度的地物,需要综合不同大小感受野下的特征才能满足高分辨率遥感影像各类地物被精准地分割。然而基于普通图像的语义分割方法在遥感图像中性能不高。由于遥感数据量大,遥感图像又具有种类多、纹理复杂等特点,传统的方法越来越难以适应海量数据,并且传统方法依赖人工设计的特征,这是非常耗时的。传统分割方法应用受到极大限制。图像分割就是根据某种均匀性(或一致性)原则将图像分成若干个有意义的部分,使得每一部分都符合这种一致性要求,而任意两个相邻区域的合并都会破坏这种不一致性原则。随着遥感技术的飞速发展,遥感数据的价值逐步体现,无论是国防军事,还是商业应用,对遥感影像信息自动提取均有迫切需求。语义分割是通过机器自动识别图像中内容的技术,它是遥感影像信息提取的重要前提,在此基础上能够进行广泛的研究与应用。面对含有多个通道的遥感影像:传统遥感图像分析领域大多使用光学上的各种指数通过阈值法进行分割,这样虽然可以利用地物的光谱反射率作为分割的判断依据,但却忽略了大量的空间信息;深度学习语义分割领域,大多仅使用红、绿、蓝、近红外四通道作为网络输入,着重学习地物的空间纹理特征,却又忽略了地物的光谱信息。Encoder-Decoder模型在语义分割模型中是常用的框架之一,其主要的流程是使用卷积操作对图像进行特征学习,但是学习到的特征往往是原始图像大小的1/16,或者1/32。因此在解码端需要将这个特征表示上采样到原始图像大小,作为最终的预测结果。在之前的工作中大都选择双线性插值的方法来进行上采样,虽然这种方法取得了一些不错的效果,但是这种过于简单且与数据无关的双线性上采样可能会导致次优结果。在深度学习领域,工业上现有的算法大多基于ResNet+FCN结构或以UNet为基础的结构对图像进行语义分割,这些模型结构在解决特定目标的划分或者对特定的数据集可以达到较高的准确率,但是由于忽略了地物光谱信息,导致其在不同的数据集上不具备很好的适用性。
技术实现思路
本专利技术针对复杂场景的高分辨率遥感图像,旨在提高遥感图像地物分割精准度,解决边缘识别不够精细的问题,提出了一种基于深度神经网络的遥感图像地物语义分割方法。为达到上述目的,本专利技术采用的技术方案是:一种遥感图像地物语义分割方法,包括步骤:下载卫星遥感影像数据,对影像数据中的地物类别进行像素级标注,将多通道的遥感影像直接作为神经网络的输入,以金字塔场景解析网络PSPNet为主干网络挖掘遥感影像空间信息,并以通挖掘遥感影像通道信息的语义分割网络模型,把具备较强图像特征挖掘能力的网络模型从相关领域中迁移至语义分割网络模型,作为主干网BackBone的知识结构;用金字塔场景解析模块提取不同空间尺度的空间特征,挖掘遥感影像的空间信息,通道注意力模块FC-Attention辅助结构从通道维度进一步挖掘遥感影像所包含的通道信息;然后采用数据相关型的上采样模块DUpSample,对不同空间尺度融合后的特征图上采样至原始特征图大小,并与原始特征图进行拼接,用针对性更强的损失函数LovaszLoss优化网络模型,利用反向传播,在每一个小批量梯度下降训练时更新各模块的权值,使用标注后的训练数据,对上述语义分割网络模型进行优化训练;通过辅助损失函数构建损失函数塔,共同对语义分割网络模型进行优化,有效地降低梯度消失和梯度爆炸风险后,使用标注后的训练数据训练网络模型,将测试集数据输入优化后的语义分割网络模型,识别影像中的不同地物,验证模型效果。本专利技术相比于现有技术具有如下有益效果:本专利技术将多通道的遥感影像直接作为神经网络的输入,将具备较强图像特征挖掘能力的本文档来自技高网
...

【技术保护点】
1.一种遥感图像地物语义分割方法,包括步骤:下载卫星遥感影像数据,对影像数据中的地物类别进行像素级标注,将多通道的遥感影像直接作为神经网络的输入,以金字塔场景解析网络PSPNet为主干网络挖掘遥感影像空间信息,并以[l1]通道注意力模块FC-Attention为辅助结构,挖掘遥感影像通道信息的语义分割网络模型,把具备较强图像特征挖掘能力的网络模型从相关领域中迁移至语义分割网络模型,作为主干网BackBone的知识结构;用金字塔场景解析模块提取不同空间尺度的空间特征,挖掘遥感影像的空间信息,通道注意力模块FC-Attention辅助结构从通道维度进一步挖掘遥感影像所包含的通道[l2]信息;然后采用数据相关型的上采样模块DUpSample,对不同空间尺度融合后的特征图上采样至原始特征图大小,并与原始特征图进行拼接,用针对性更强的损失函数Lovasz Loss优化网络模型,利用反向传播,在每一个小批量梯度下降训练时更新各模块的权值,使用标注后的训练数据,对上述语义分割网络模型进行优化训练;通过辅助损失函数构建损失函数塔,共同对语义分割网络模型进行优化,有效地降低梯度消失和梯度爆炸风险后,使用标注后的训练数据训练网络模型,将测试集数据输入优化后的语义分割网络模型,识别影像中的不同地物,验证模型效果。/n...

【技术特征摘要】
1.一种遥感图像地物语义分割方法,包括步骤:下载卫星遥感影像数据,对影像数据中的地物类别进行像素级标注,将多通道的遥感影像直接作为神经网络的输入,以金字塔场景解析网络PSPNet为主干网络挖掘遥感影像空间信息,并以[l1]通道注意力模块FC-Attention为辅助结构,挖掘遥感影像通道信息的语义分割网络模型,把具备较强图像特征挖掘能力的网络模型从相关领域中迁移至语义分割网络模型,作为主干网BackBone的知识结构;用金字塔场景解析模块提取不同空间尺度的空间特征,挖掘遥感影像的空间信息,通道注意力模块FC-Attention辅助结构从通道维度进一步挖掘遥感影像所包含的通道[l2]信息;然后采用数据相关型的上采样模块DUpSample,对不同空间尺度融合后的特征图上采样至原始特征图大小,并与原始特征图进行拼接,用针对性更强的损失函数LovaszLoss优化网络模型,利用反向传播,在每一个小批量梯度下降训练时更新各模块的权值,使用标注后的训练数据,对上述语义分割网络模型进行优化训练;通过辅助损失函数构建损失函数塔,共同对语义分割网络模型进行优化,有效地降低梯度消失和梯度爆炸风险后,使用标注后的训练数据训练网络模型,将测试集数据输入优化后的语义分割网络模型,识别影像中的不同地物,验证模型效果。


2.如权利要求1所述的遥感图像地物语义分割方法,其特征在于:数据相关型上采样模块DUpSample将H*W*C的特征上采样到2H*2W*C,其中,H,W,C分别代表图像的长、宽和通道数。


3.如权利要求2所述的遥感图像地物语义分割方法,其特征在:数据相关型上采样模块利用语义分割的标签空间中的冗余,在上采样层中,将卷积神经网络CNN的低分辨率输出恢复到原始图像像素相同的样子。


4.如权利要求1所述的遥感图像地物语义分割方法,其特征在于:语义分割网络模型的分割结果表示为是由几个上采样组成的解码器的输出,表示人工标注掩码图的Y∈[0,1,2,...,C]H×W为解码器对应的输入图像,并且Y∈[0,1]H×W×C,F通常比Y小16或32倍,需将上采样F至与Y同样的尺寸,计算损失函数。其中,C表示分割的类别,表示终输出的通道数,表示矩阵中的值均为实值,H和W表示掩码图的长和宽,和表示语义分割结果的长和宽。


5.如权利要求1所述的遥感图像地物语义分割方法,其特征在于:数据相关型上采样模块给定表示上采样率的r=OutStride,将人工标注的掩码图Y分为Y分为个r*r的网格形式,将人工标注的掩码...

【专利技术属性】
技术研发人员:庄旭袁鑫贾莹尹可鑫张乾君
申请(专利权)人:西南电子技术研究所中国电子科技集团公司第十研究所
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1