一种面向电力巡检机制的卫星遥感图像边界感知语义分割模型制造技术

技术编号:38605559 阅读:10 留言:0更新日期:2023-08-26 23:37
本发明专利技术涉及基于深度学习的遥感影像识别技术领域,具体涉及一种面向电力巡检机制的卫星遥感图像边界感知语义分割模型,包括:基于原始图像,通过主干网络Convnext,获取多尺度特征图;基于主干网络返回的多尺度特征图,通过改进集成逐次扩张模块,聚合不同尺度上下文信息,获得具有多尺度、多感受野和高语义信息的特征图;基于前两步生成的多尺度特征图,利用解码器获得不同尺度恢复的分割图;为了细化分割图中的区域和边界缺陷,在解码器后,添加了残差细化模块,训练时使用混合损失函数和深监督策略,提高模型识别精度,有效地解决了电力巡检中卫星遥感图像因多拍摄于山地丘陵地区,目标较小、乡村道路居多、建筑样式及颜色复杂而导致的难以识别问题。杂而导致的难以识别问题。杂而导致的难以识别问题。

【技术实现步骤摘要】
一种面向电力巡检机制的卫星遥感图像边界感知语义分割模型


[0001]属于基于深度学习的遥感影像识别
,更具体的说是涉及一种面向电力巡检机制的卫星遥感图像边界感知语义分割模型。

技术介绍

[0002]近几年,随着航天技术发展,搭载各类探测器的遥感卫星相继升空,高分辨率卫星影像技术逐渐成熟,民用、商业卫星分辨率进入亚米级,分辨率最高可达0.31m,为发现输电线路隐患提供了新的技术手段。在输电线路隐患排查中,主要利用语义分割模型来识别沿线的拆迁房屋等地理要素,由于在电力巡检中主要使用的遥感影像覆盖区域为山地丘陵地区,其中道路多为农村道路,而且建筑样式及颜色复杂多变,传统的语义分割模型难以准确有效地识别此类环境特征。因此,研究一种面向电力巡检机制的卫星遥感图像边界感知语义分割模型是十分必要的。

技术实现思路

[0003]提供了一种面向电力巡检机制的卫星遥感图像边界感知语义分割模型,有效解决了电力巡检中的卫星遥感图像因多拍摄于山地丘陵地区,道路较窄,建筑样式多变且颜色复杂,导致难以准确识别的问题。该模型挑选已有模型中贴近本应用需求的模块进行组合,组成本模型特有的语义分割模块,能很好地检测高压线线路通道环境内的建筑、道路等,并且提高了分割的边界质量,有效的降低误识率,提高识别的准确率,为线路通道的环境特征识别提供了新的技术手段。“边界感知语义分割网络模型”由预测模块和细化模块组成,如图3所示。预测模块是一个类似Unet的编码器

解码器结构,编码器的主干网络采用ConvNext网络,可以提取更深层次的特征,提升网络精度,使用残差结构还能够防止网络退化,进一步加强了网络适应遥感影像数据集的能力。细化模块是一个高分辨残差细化模块(RRM),利用分割掩码来生成一个细化的分割,对预测模块得到的分割图进行细化。
[0004]为了实现上述目的,本专利技术采用如下技术方案:
[0005]一种面向电力巡检机制的卫星遥感图像边界感知语义分割模型,包括如下步骤:
[0006]S1:基于原始图像,通过主干网络Convnext,获取多尺度特征图;
[0007]S2:基于主干网络返回的多尺度特征图中的深层特征图,通过改进集成逐次扩张模块,聚合不同尺度上下文信息,获得具有多尺度、多感受野和高语义信息的特征图;
[0008]S3:基于S1、S2中生成的多尺度特征图,利用解码器获得不同尺度恢复的分割图;
[0009]S4:基于S3生成的不同尺度恢复的分割图,通过高分辨率网络(HRNet)扩展为残差细化模块进行分割预测和分割图细化。
[0010]进一步,所述的基于原始图像,通过主干网络Convnext,获取多尺度特征图,包括:
[0011]ConvNext吸取Transformers的参数设置,在Resnet50的基础上,对参数、过程进行改进,具体改进为:
[0012]改进一:改进了每个阶段残差卷积块的比率,对Resnet50的每个阶段的残差卷积块数从(3:4:6:3)调整为(3:3:9:3);
[0013]改进二:convnext采取Transformers的思想,在最初的下采样使用卷积核大小为4*4步距为4的卷积层,对高和宽进行4倍的下采样;
[0014]改进三:吸取ResNext的思想,Convnext将ResNext的分组卷积换为深度可分离卷积,将网络宽度从64增加到96,大大提升其精度;
[0015]改进四:与Resnet的瓶颈结构和MobileNetV2反瓶颈结构对比,Convnext的反瓶颈结构中,将3*3卷积核向上移动,如附图4所示;
[0016]改进五:Convnext将深度可分离卷积的3*3大小的卷积核转换为7*7大小的卷积核;
[0017]改进六:Convnext减少了归一化层和激活函数的使用,将激活函数ReLU换为GELU,将卷积网络经常用的归一化函数BN转为Transformers的层归一化函数LN;
[0018]层归一化函数LN的计算公式为:
[0019][0020]其中,γ、β代表缩放和平移的参数向量,和z
(l)
维数相同,∈是一个很小的正值,z
(l)
为第l层神经的净输入,
µ
(l)
为均值,σ
(l)
为方差;
[0021]其中,均值公式为:
[0022][0023]方差公式为:
[0024][0025]激活函数GELU的计算公式为:
[0026][0027]其中Φ(x)是标准正态分布的累积分布函数,即:
[0028][0029]改进七:为了稳定训练,Convnext在下采样前使用LN进行归一化,之后使用2*2大小步距为2的卷积进行下采样。
[0030]进一步,基于主干网络返回的多尺度特征图中的深层特征图,通过改进集成逐次扩张模块,聚合不同尺度上下文信息,获得具有多尺度、多感受野和高语义信息的特征图,改进集成逐次扩张模块结构和操作如下:
[0031]针对遥感影像的尺度变化大和场景复杂的特点,结合Jinming Su所提出的集成逐次扩张模和ASPP模块提出了改进集成逐次扩张模块,该模块通过多个空洞卷积扩大特征图的感受野,有效地聚合一系列尺度的上下文信息,增强特征的不变性;改进的集成逐次扩张模块,第三层采用卷积核大小为1
×
1的卷积层来集成不同膨胀率的特征图。该模块是将各个分支的特征层进行求和,利用通道维度上拼接,并添加一个残差连接来帮助网络更好地学习特征表示。残差连接是在神经网络中添加一条从输入层直接连接到输出层的捷径,在
神经网络中,残差连接可以表示为:
[0032][0033]其中,input是输入特征图,F是残差块的表示函数,output是输出特征图。残差连接能有效提高模型的表达能力和泛化能力,第四层放到拼接操作之后,依然采用卷积核大小为1
×
1的卷积层,其对通道维数恢复到输入时的数量,如附图6所示。
[0034]进一步,基于S1、S2中生成的多尺度特征图,利用解码器获得不同尺度恢复的分割图:
[0035]Convnext共输出5个不同尺度的特征图,只对最深层的特征图Res4进行改进的集成逐次扩张模块增强特征,然后再上采样恢复到原始图像的大小,为第一个分割图。
[0036]首先,基于特征增强后的Res4生成的特征图进行2倍上采样,并于Res3生成的特征图进行通道维数的拼接,然后利用卷积核大小为1的卷积层恢复到该阶段拼接前的通道维数,最后利用Convnext中的反瓶颈卷积块对特征图进行卷积减少上采样混叠效应。
[0037]将上面的结果进行上采样恢复到与原始图像大小,得到第二个分割图。然后其进行2倍上采样与Res2进行拼接和卷积操作,重复上面操作。直到与Res1进行拼接,并恢复与原图像一样大小,共获得4个分割图。
[0038]进一步,基于S3生成的不同尺度恢复的分割图,基于高分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向电力巡检机制的卫星遥感图像边界感知语义分割模型,其特征在于,包括步骤如下:S1:基于原始图像,通过主干网络Convnext,获取多尺度特征图;S2:基于主干网络返回的多尺度特征图中的深层特征图,通过改进集成逐次扩张模块,聚合不同尺度上下文信息,获得具有多尺度、多感受野和高语义信息的特征图;S3:基于S1、S2中生成的多尺度特征图,利用解码器获得不同尺度恢复的分割图;S4:基于S3生成的不同尺度恢复的分割图,通过简化高分辨率网络(HRNet)的残差细化模块(RRM)进行分割预测和分割图细化。2.根据权利要求1所述的方法,其特征在于,所述的基于原始图像,通过主干网络Convnext,获得多尺度的特征图包括:ConvNext吸取Transformers的参数设置,在Resnet50的基础上,对残差卷积块数、卷积层、高、宽、激化函数、顺序等进行如下改进:改进一:改进了每个阶段残差卷积块的比率,对Resnet50的每个阶段的残差卷积块数从(3:4:6:3)调整为(3:3:9:3);改进二:Convnext采取Transformers的思想,在最初的下采样使用卷积核大小为4*4步距为4的卷积层,对高和宽进行4倍的下采样;改进三:吸取ResNext的思想,Convnext将ResNext的分组卷积换为深度可分离卷积,将网络宽度从64增加到96,大大提升其精度;改进四:与Resnet的瓶颈结构和MobileNetV2反瓶颈结构对比,Convnext的反瓶颈结构中,将3*3卷积核向上移动;改进五:Convnext将深度可分离卷积的3*3大小的卷积核转换为7*7大小的卷积核;改进六:Convnext减少了归一化层和激活函数的使用,将激活函数ReLU换为GELU,将卷积网络经常用的归一化函数BN转为Transformers的层归一化函数LN;层归一化函数LN的计算公式为:;其中,γ、β代表缩放和平移的参数向量,和z
(l)
维数相同,∈是一个很小的正值,z
(l)
为第l层神经的净输入,
µ
(l)
为均值,σ
(l)
为方差;其中,均值公式为:;方差公式为:;其中,n
(l)
为第l层神经元的数量;激活函数GELU的计算公式为:;其中,Φ(x)是标准正态分布的累积分布函数,即:
;改进七:为了稳定训练,Convnext在下采样前使用LN进行归一化,之后使用2*2大小步距为2的卷积进行下采样。3.根据权利要求1所述的方法,其特征在于,所述的基于主干网络返回的多尺度特征图中的深层次特征,通过改进集成逐次扩张模块,聚合不同尺度上下文信息,获得具有多尺度、多感受野和高语义信息的特征图包括:改进集成逐次扩张模块是将深层特征图首先经过1*...

【专利技术属性】
技术研发人员:张常兴杨景王大鹏武剑灵翟春雨陈少宏白翔宇赵玉妹张玉鹏陈顺华张国君蒋海龙于小川张竟超张猛赵少华郭瑞华翟欣欣
申请(专利权)人:内蒙古电力集团有限责任公司内蒙古超高压供电分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1