【技术实现步骤摘要】
基于轻量化语义分割网络的遥感图像地物分类方法
本专利技术属于图像处理
,特别涉及一种地物分类方法,可用于土地利用分析、环境保护以及城市规划。
技术介绍
遥感图像地物分类,旨在取代繁琐的人工作业,利用地物分类方法,得到输入遥感图像的地物和背景的分类结果图。通过地物分类结果,可以进行土地利用分析、环境保护以及城市规划等多种应用。目前的地物分类方法大致可以分为两类:第一类是基于传统机器学习的方法,通常采用由特征提取器和分类器组成的双层结构。特征提取器旨在从图像的局部提取空间和纹理特征,将像素的空间排列编码为高维表示。学界已经提出了一些功能强大的特征提取方法,如方向梯度直方图HOG、尺度不变特征变换SIFT和加速鲁棒特征SURF。而分类器根据提取的特征对图像中的每个像素进行预测。通常使用支持矢量机、随机森林和K-均值聚类方法。第二类是基于深度学习的机器学习方法,通常使用卷积与反卷积操作对输入图片进行特征提取与分辨率恢复,并实现像素级的地物分类。上述两类方法中前者由于图像中光照的巨大变化以及形状和 ...
【技术保护点】
1.一种基于轻量化语义分割网络的遥感图像地物分类方法,其特征在于,包括如下:/n(1)将输入的遥感图像划分为训练样本和测试样本:/n对输入的遥感数据集进行可交叠地切图,划分为N个大小为H×H的图像块,并从N个图像块中随机选取80%的图像块作为训练样本,其余的图像块作为测试样本,N≥60,H≥500;/n(2)构建引入可拓宽通道分解空洞卷积的轻量化遥感图像地物分类模型:/n(2a)将输入遥感图像经过多个下采样和多个可拓宽通道分解空洞卷积,得到编码器特征F;/n(2b)用注意力金字塔网络APN作为解码器网络,将编码器特征F输入到该解码器网络中,得到三路特征图F1、F2、F3;/ ...
【技术特征摘要】
1.一种基于轻量化语义分割网络的遥感图像地物分类方法,其特征在于,包括如下:
(1)将输入的遥感图像划分为训练样本和测试样本:
对输入的遥感数据集进行可交叠地切图,划分为N个大小为H×H的图像块,并从N个图像块中随机选取80%的图像块作为训练样本,其余的图像块作为测试样本,N≥60,H≥500;
(2)构建引入可拓宽通道分解空洞卷积的轻量化遥感图像地物分类模型:
(2a)将输入遥感图像经过多个下采样和多个可拓宽通道分解空洞卷积,得到编码器特征F;
(2b)用注意力金字塔网络APN作为解码器网络,将编码器特征F输入到该解码器网络中,得到三路特征图F1、F2、F3;
(2c)根据三路特征图F1、F2、F3得到预测图Q;
(3)针对标签图地物边缘标记模糊的特点,设计轻量化语义分割网络的损失函数L:
(3a)将原标签图进行标签平滑和高斯滤波处理得到新的标签图P;
(3b)根据标签图P和预测图Q的信息熵差值,构造损失函数L;
(4)对(2)构建的轻量化遥感图像地物分类模型进行训练:
(4a)设初始学习率baselr为0.0005,当前学习率计算公式为:lr=baselr×(1-iter/maxiter)0.9,其中lr是当前的学习率,iter是当前迭代轮数,maxiter是最大迭代轮数。优化器使用Adam,最大迭代轮数设为300,随机初始化模型参数;
(4b)将训练样本输入到构建的轻量化遥感图像地物分类模型中,使用优化器Adam优化(3b)中的损失函数L,更新轻量化遥感图像地物分类模型的权重参数,当训练轮数达到300时,得到训练好的轻量化遥感图像地物分类模型;
(5)将测试样本输入到训练好的轻量化遥感图像地物分类模型中,预测输出测试样本中各像素所属的地物种类,得到遥感图像的地物分类结果。
2.根据权利要求1所述的方法,其特征在于,(2a)中所述的将输入遥感图像经过多个下采样和多个可拓宽通道分解空洞卷积得到编码器特征F,其实现如下:
(2a1)输入图像I经过第一个下采样层D1执行步长均为2的3×3卷积和2×2最大池化操作,并将这两个操作得到的特征图进行通道维度上的拼接,得到通道维度为C>30的第一个特征图T1;
(2a2)第一个特征图T1依次经过K1~K3这三个可拓宽通道分解空洞卷积,得到通道维度为C的第二个特征图T2;
(2a3)第二个特征图T2经过第二个下采样层D2执行步长均为2的3×3卷积和2×2最大池化操作,并将这两个操作得到的特征图进行通道维度上的拼接,得到通道维度为2C的第三个特征图T3;
(2a4)第三个特征图T3依次经过K4、K5这两个可拓宽通道分解空洞卷积,得到通道维度为2C的第四个特征图T4;
(2a5)第四个特征图T4经过第三个下采样层D3执行步长均为2的3×3卷积和2×2最大池化操作,并将这两个操作得到的特征图进行通道维度上的拼接,得到通道维度为4C的第五个特征图T5;
(2a6)第五个特征图T5依次经过K6~K13这八个可拓宽通道分解空洞卷积,得到通道维度为4C的第六个特征图T6,T6即为编码器特征F。
3.根据权利要求2所述的方法,其特征在于,其中所述K1~K5这五个可拓宽通道分解空洞卷积的结构相同,每个可拓宽通道分解空洞卷积均将其输入参数在通道维度上均分成两个分支,第一个分支依次经过3×1卷积、1×3卷积、空洞率为1的3×1空洞卷积、空洞率为1的1×3空洞卷积,得到一个卷积特征;第二个分支依次经过1×3卷积、3×1卷积、空洞率为1的1×3空洞卷积、空洞率为1的3×1空洞卷积,得到另一个卷积特征,将这两个卷积特征在通道维度上进行拼接并与输入参数求和,输出中间特征或特征图,其中K1、K2输出通道维度为C的中间特征,K3输出通道维度为C的特征图;K4输出通道维度为2C的中间特征,K5输出通道维度为2C的特征图。
4.根据权利要求2所述的方法,其特征在于,其中所述K6~K11这六个可拓宽通道分解空洞卷积的结构相似,其均将输入参数在通道维度上均分成十个分支,第一个分支依次经过3×1卷积、1×3卷积、空洞率为d的3×1空洞卷积、空洞率为d的1×3空洞卷积,得到一个卷积特征;第二个分支依次经过1×3卷积、3×1卷积、空洞率为d的1×3空洞卷积、空洞率为d的3×1空洞卷积,得到另一个卷积特征;第3~10个分支均依次经过3×3卷积和空洞率为d的3×3空洞卷积得到其他八个卷积特征,将这八个卷积特征求和并与前两个卷积特征在通道维度上进行拼接,再与输入参数进行求和,输出通道维度为4C的中间特征,其中K6的空洞率为1,K7的空洞率为2,K8的空洞率为5,K9的空洞率为9,K10的空洞率为2,K11的空洞率为5。
5.根据权利要求2所述的方法,其特征在于,其中所述K12~K13这两个可拓宽通道分解空洞卷积的结构与K1相似,仅空洞率有所不同,其中K12的空洞率为9,输出通道维度为4C的中间特征,K13的空洞率为17,输出通道维度为4C的特征图,该特征图即为编码器特征F。
6.根据权利要求2所述的方法,其特征在于,(2a2)中第一个特征图T1依次经过K1~K3这三个可拓宽通道分解空洞卷积,得到通道维度为C的第二个特征图T2,其实现如下:
(2a2.1)第一个特征图T1通过第一个可拓宽通道分解空洞卷积K1,在其两个分支上分别得到第一个卷积特征A1和第二个卷积特征A2,将A1和A2这两个卷积特征在通道维度上进行拼接并与T1求和,输出通道维度为C的第一中间特征Z1;
(2a2.2)K1输出的中间特征Z1经过第二个可拓宽通道分解空洞卷积K2,在其两个分支上分别输出第三个卷积特征A3和第四个卷积特征A4,将这两个卷积特征A3和A4在通道维度上进行拼接并与第一中间特征Z1求和,输出通道维度为C的第二中间特征Z2;
(2a2.3)K2输出的中间特征Z2经过第三个可拓宽通道分解空洞卷积K3,在其两个分支上分别输出第五个卷积特征A5和第六个卷积特征A6,将这两个卷积特征A5和A6在通道维度上进行拼接并与第二中间特征Z2求和,输出通道维度为C的第二个特征图T2。
7.根据权利要求2所述的方法,其特征在于,(2a4)中第三个特征图T3依次经过K4、K5这两个可拓宽通道分解空洞卷积,得到通道维度为2C的第四个特征图T4,其实现如下:
(2a4.1)第三个特征图T3经过第四个可拓宽通道分解空洞卷积K4,在其两个分支上分别输出第七个卷积特征A7和第八个卷积特征A8,将这两个卷积特征A7和A8在通道维度上进行拼接并与T3求和,输出通道维度为2C的第三中间特征Z3;
(2a4.2)K4输出的中间特征Z3经过第五个可拓宽通道分解空洞卷积K5,在其两个分支上分别输出第九个卷积特征A9和第十个卷积特征A10,将这两个卷积特征A9和A10在通道维度上进行拼接并与Z3求和,输出通道维度为2C的第四...
【专利技术属性】
技术研发人员:张向荣,王昕,焦李成,李辰,唐旭,周挥宇,陈璞花,古晶,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。