基于拓扑感知神经网络的遥感图像道路分割方法技术

技术编号:37258733 阅读:13 留言:0更新日期:2023-04-20 23:34
本发明专利技术属于遥感图像语义分割方法技术领域,具体是一种基于拓扑感知神经网络的遥感图像道路分割方法。包括以下步骤:1)对高分辨遥感数据集划分为训练集和测试集,并对训练集和测试集中的遥感图像分别进行预处理;2)搭建图像语义分割网络模型;3)将训练集输入语义分割网络,首先对语义分割网络进行初始化,然后对模型中参数进行更新,优化损失函数直至收敛;4)将测试集数据输入训练好的生成器模块,得到高精度语义分割结果。本发明专利技术解决了现有遥感图像道路自动提取技术中存在的特征表达能力不足、无法准确感知道路的拓扑结构、上下文信息局限于单个训练样本、语义分割的过程中边缘和细节信息损失较大、训练所需样本量大等问题。细节信息损失较大、训练所需样本量大等问题。细节信息损失较大、训练所需样本量大等问题。

【技术实现步骤摘要】
基于拓扑感知神经网络的遥感图像道路分割方法


[0001]本专利技术属于遥感图像语义分割方法
,具体是一种基于拓扑感知神经网络的遥感图像道路分割方法。

技术介绍

[0002]随着高分辨率遥感卫星不断发射升空、无人机技术的日益广泛应用、遥感图像的空间分辨率不断提升,对地观测技术已经进入高分辨率遥感大数据时代。高分辨率遥感大数据中,路网信息不仅直观反映了一个国家或地区的经济和社会发展水平,而且交通管理、城市规划、自动导航等领域均有重要的应用价值。
[0003]传统高分辨率遥感图像道路分割主要依靠人工标注,不仅费时、费力而且结果还具有很强的主观性。为了提高检测效率,各种基于对象的语义分割方法被不断提出,并取得了一定应用成果。但是这些技术严重依赖基于纹理、几何形状和边缘等人工设计的低级语义特征,无法很好地应用到高分辨率遥感图像这种复杂场景、因而泛化性能差而且容易受各种噪声干扰影响。
[0004]基于深度学习的全卷积神经网络通过多层网络结构和非线性变换能够自动地从遥感图像中获取高级语义特征。此外,全卷积神经网络端到端、像素到像素式的实现方式,能够提供像素级道路的识别、定位,是目前最具潜力的是遥感图像道路提取方法。但目前用于遥感图像道路提取的全卷积神经网络主要专注于像素分类精度,无法准确感知道路的拓扑结构而且语义分割的过程中边缘和细节信息损失较大、容易受到遮挡或阴影的影响,严重影响了结果的精度和完整性。此外,全卷积模型往往依赖海量的高精度训练样本或由日常场景海量样本训练所得的预训练模型。然而,遥感图像的像素级标注却往往费时、费力。同时,由于日常场景图像与遥感图像差异较大,因而由日常场景图像训练得到的预训练模型分割精度经常差强人意。此外,这些复杂的模型参数量巨大对存储和计算设备均提出了较高要求,训练和应用模型也均非常耗时。这些缺陷极大的限制了这些方法的实际应用。

技术实现思路

[0005]本专利技术为了综合解决现有高分辨遥感图像道路分割方法无法准确感知拓扑结构、语义分割的过程中边缘和细节信息损失较大、容易受到遮挡和阴影的干扰、模型效率低下和训练困难等问题。提供一种基于拓扑感知神经网络的遥感图像道路分割方法。
[0006]本专利技术采取以下技术方案:一种高分辨率遥感图像语义分割网络,包括下采样路径、空间上下文模块和上采样路径,所述下采样路径包括可变形卷积层以及5个连续的下采样单元,输入数据首先通过可变形卷积层,得到语义特征图,随后通过5个连续的下采样单元进行特征提取和下采样,最后输出一个特征图;所述上采样路径依次由5个连续的上采样单元、一个A聚合操作、一个卷积层以及Softmax层组成,最后生成分割预测图;所述5个下采样单元和5上采样单元之间一一对应,并采用经过通道注意力模块的注意力调整的跳跃连接相连;所述空间上下文模块对下采样路径输出的特征图进行分割融合后并输出给上采样
路径。
[0007]在一些实施例中,可变形卷积层是一个卷积核大小为3
×
3、步长为1的可变形卷积,该操作对3
×
3卷积核中每个采样点的位置都增加了一个可学习的偏移变量和权重系数。
[0008]在一些实施例中,下采样单元包括一次聚合模块、聚合操作和下转换模块,其中一次聚合模块负责提取特征,然后聚合操作将一次聚合模块的输入和输出聚合,再将结果特征图分别传输至下转换模块和通道注意力模块,其中通道注意力模块的输出与输入进行对应元素相乘,得到经过通道注意力调整的跳跃连接特征并输入至上采样路径对应部分。
[0009]在一些实施例中,上采样单元由一组上转换模块、B聚合操作和一次聚合模块,其中上转换模块负责通过上采样恢复特征图的空间分辨率,B聚合操作负责将通道注意力模块调整过的跳跃连接特征图和上转换模块所得特征图进行聚合,一次聚合模块负责从B聚合操作的结果中提取特征。
[0010]在一些实施例中,一次聚合模块的结构如下:特征图输入至一次聚合模块后,首先经过个卷积模块,得到个新特征图,其中前两个卷积模块为可变形卷积模块;然后将所得个特征图进行通道堆叠操作,得到通道堆叠后的特征图;所述卷积模块,由批归一化层、ReLU激活函数层、33卷积层和随机失活层依次组成;所述可变形卷积模块,由批归一化层、ReLU激活函数层、33可变形卷积层和随机失活层依次组成。
[0011]在一些实施例中,通道注意力模块的结构为:大小为的输入特征分别经过全局最大池化和全局平均池化得到两个的特征图;接着将它们分别送入一个共享多层感知器:第一层神经元个数为,r为减少率,r=16,激活函数为Relu,第二层神经元个数为;输出的两个特征进行相加,再经过Sigmoid激活操作,生成最终的通道注意力;通道注意力和输入特征做对应元素乘法操作。
[0012]在一些实施例中,空间上下文模块包括“高度方向”和“宽度方向”两条路径;其中“高度方向”路径来自下采样路径的特征图,大小为,其中C代表通道数目,H代表特征图高度,W代表特征图宽度,在垂直方向被分为H个切片:,对每个切片,,使用大小为卷积操作进行线性投影得到,然后将输入第一个线性层,得到注意力,再对注意力依次在特征图尺寸和通道维度分别使用Softmax和L1正则化,随后将正则化后的注意力输入第二个线性层,得到新的切片,最后将所有新切片沿“高度方向”聚合为大小为的特征图;其中“宽度方向”路径,来自下采样路径的特征图沿“宽度”方向被分为W个切片,切片按照同样的方式更新并聚合为特征图;
来自“高度方向”和“宽度方向”两条路径、大小均为的特征图通过加法运算进行融合。
[0013]一种基于拓扑感知神经网络的遥感图像道路分割方法,包括以下步骤,S100:将高分辨率遥感数据集划分为训练集和测试集,并对训练集和测试集中的图像分别进行预处理;S200:搭建高分辨率遥感图像语义分割网络;S300:将S100中经过预处理的训练集图像输入至S200中的高分辨遥感图像语义分割网络进行训练,首先使用He Uniform方法对高分辨遥感图像分割网络进行初始化,然后对模型中参数进行更新,优化损失函数直至收敛;S400:将经过预处理的测试集遥感图像输入到S200中训练好的分割网络,输出分高分辨率遥感图像语义分割结果。
[0014]步骤S100中,所述预处理包括图像人工标注、图像裁剪和数据增强;所述的图像人工标注具体为:在ArcGIS软件中人工对高分辨率图像中的道路进行像素级语义标注得到带标签的表面裂纹图像;所述的图像裁剪具体为:将带标签的高分辨率遥感图像随机裁剪为512像素
×
512像素的子图像;所述数据增强包括:将子图像进行尺度随机变换、随机角度图像旋转、图像垂直与水平翻转得到的高分辨率遥感图像。
[0015]所述步骤S300中,损失函数采用Dice Loss,具体为:其中X代表预测图中所有像素对应预测值的集合,Y代表标签图像所有像素对应值的集合,代表X和Y的交集,和代表X和Y中元素的个数。
[0016]与现有技术相比,本专利技术具有以下有益效果:1)本专利技术采用空间本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种高分辨率遥感图像语义分割网络,其特征在于:包括下采样路径、空间上下文模块和上采样路径,所述下采样路径包括可变形卷积层以及5个连续的下采样单元,输入数据首先通过可变形卷积层,得到语义特征图,随后通过5个连续的下采样单元进行特征提取和下采样,最后输出一个特征图;所述上采样路径依次由5个连续的上采样单元、一个A聚合操作、一个卷积层以及Softmax层组成,最后生成分割预测图;所述5个下采样单元和5上采样单元之间一一对应,并采用经过通道注意力模块的注意力调整的跳跃连接相连;所述空间上下文模块对下采样路径输出的特征图进行分割融合后并输出给上采样路径。2.根据权利要求1所述的高分辨率遥感图像语义分割网络,其特征在于:所述可变形卷积层是一个卷积核大小为3
×
3、步长为1的可变形卷积,该操作对3
×
3卷积核中每个采样点的位置都增加一个可学习的偏移变量和权重系数。3.根据权利要求2所述的高分辨率遥感图像语义分割网络,其特征在于:所述下采样单元包括一次聚合模块、聚合操作和下转换模块,其中一次聚合模块负责提取特征,然后聚合操作将一次聚合模块的输入和输出聚合,再将结果特征图分别传输至下转换模块和通道注意力模块,其中通道注意力模块的输出与输入进行对应元素相乘,得到经过通道注意力调整的跳跃连接特征并输入至上采样路径对应部分。4.根据权利要求1所述的高分辨率遥感图像语义分割网络,其特征在于:所述上采样单元由一组上转换模块、B聚合操作和一次聚合模块,其中上转换模块负责通过上采样恢复特征图的空间分辨率,B聚合操作负责将通道注意力模块调整过的跳跃连接特征图和上转换模块所得特征图进行聚合,一次聚合模块负责从B聚合操作的结果中提取特征。5.根据权利要求3或4所述的高分辨率遥感图像语义分割网络,其特征在于:所述一次聚合模块的结构如下:特征图输入至一次聚合模块后,首先经过个卷积模块,得到个新特征图,其中前两个卷积模块为可变形卷积模块;然后将所得个特征图进行通道堆叠操作,得到通道堆叠后的特征图;所述卷积模块,由批归一化层、ReLU激活函数层、33卷积层和随机失活层依次组成;所述可变形卷积模块,由批归一化层、ReLU激活函数层、33可变形卷积层和随机失活层依次组成。6.根据权利要求5所述的高分辨率遥感图像语义分割网络,其特征在于:所述通道注意力模块的结构为:大小为的输入特征分别经过全局最大池化和全局平均池化得到两个的特征图;接着将它们分别送入一个共享多层感知器:第一层神经元个数为,r为减少率,r=16,激活函数为Relu,第二层...

【专利技术属性】
技术研发人员:郭学俊周瑞森刘伟琳李龙
申请(专利权)人:太原理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1