【技术实现步骤摘要】
基于区域描述自注意力机制的遥感图像语义分割方法
本专利技术涉及遥感和计算机视觉
,更具体的说是涉及基于区域描述自注意力机制的遥感图像语义分割。
技术介绍
将语义分割技术应用在遥感领域,可以达到输入一张遥感图像,输出遥感图像中每个像素类别标签的效果,对理解遥感图像有着很大的帮助。例如在国土规划方面,若能将卫星图像上每个像素的地表覆盖类型(城市、道路、森林、耕地、河流等)识别出来,便能清楚的了解到他们的分布情况以及占用面积,有利于进行全局规划;再比如对建筑进行智能识别,不仅可以很快的发现是否有违规建筑,而且可以大大减少人力的消耗。目前大部分利用深度学习做语义分割的工作都是全卷积网络FCN的衍生品,FCN将上述知名的分类网络转化为全卷积网络,具体做法为将全连接层替换为卷积层,并且通过将深层特征经反卷积操作与浅层特征相融合,兼顾高级语义特征与低级位置特征,增加了模型的准确性。但FCN仍然无法适用于所有场景,最主要的原因在于卷积的局部特性导致感受野较小,从而无法考虑到更大范围的上下文信息。为解决上述问题,在FCN的基础上 ...
【技术保护点】
1.基于区域描述自注意力机制的遥感图像语义分割方法,其特征在于,包括:/n步骤1:将可见光遥感图像输入至编码器中,提取高级语义特征,得到不同层级的特征图:/n步骤2:基于不同层级的所述特征图分别进行全局场景提取和基于自注意力模块的本质特征提取,对应得到场景引导特征图和无噪声特征图;/n步骤3:将所述场景引导特征图和所述无噪声特征图输入至解码器中上采样回所述可见光遥感图像大小,并进行逐像素分类,得到遥感图像语义分割结果。/n
【技术特征摘要】
1.基于区域描述自注意力机制的遥感图像语义分割方法,其特征在于,包括:
步骤1:将可见光遥感图像输入至编码器中,提取高级语义特征,得到不同层级的特征图:
步骤2:基于不同层级的所述特征图分别进行全局场景提取和基于自注意力模块的本质特征提取,对应得到场景引导特征图和无噪声特征图;
步骤3:将所述场景引导特征图和所述无噪声特征图输入至解码器中上采样回所述可见光遥感图像大小,并进行逐像素分类,得到遥感图像语义分割结果。
2.根据权利要求1所述的基于区域描述自注意力机制的遥感图像语义分割方法,其特征在于,所述编码器包括特征提取网络ResNet-101。
3.根据权利要求2所述的基于区域描述自注意力机制的遥感图像语义分割方法,其特征在于,将所述可见光遥感图像I输入至所述特征提取网络ResNet-101中,第四层输出特征图F4,第五层输出特征图F5。
4.根据权利要求3所述的基于区域描述自注意力机制的遥感图像语义分割方法,其特征在于,步骤2中生成无噪声特征图的具体步骤为:
步骤21:根据groundtruth将所述特征图F4划分为K个软区域N={M1,M2,…MK},其中,每个所述软区域Mk属于第k个类别,N表示软区域集合;
步骤22:将每个所述软区域内的像素值加权聚合得到当前区域的粗区域描述子,计算公式为:
式中,fk表示粗区域描述子,xi表示特征图F4中像素pi的特征,表示像素pi属于第k个软区域的概率,I表示特征图F4中取到的像素点;
将所述粗区域描述子经1x1卷积变换得到最终的T个区域描述子rt;
步骤23:计算所述特征图F5经降维后,每个像素与所述区域描述子之间的关系,得到每个像素相对于所述区域描述子的自注意力权值:
式中,T表示软区域个数,rt表示区域描述子,Wit表示自注意力权值;
步骤24:基于所述自注意力权值,计算点与区域的关联度:
式中,rt表示第t个区域描述子,Wit表示特征图F5经降维后的特征图中第i个像素与第t个区域描述子的自注意力权值,δ(·)和ρ(·)是两个变换函数,yi表示点与区域的关联度;
步骤25:基于所述点与区域的关联度以及所述区域描述子,得到所述无噪声特征图;
式中,g(·)是一个变换函数,包括1x1卷积、批归一化层和ReLU激活函数,xi表示特征图F...
【专利技术属性】
技术研发人员:赵丹培,王晨旭,史振威,姜志国,张浩鹏,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。