基于区域描述自注意力机制的遥感图像语义分割方法技术

技术编号：26344228 阅读：55 留言：0更新日期：2020-11-13 20:55

本发明专利技术公开了一种基于区域描述自注意力机制的遥感图像语义分割方法，包括将可见光遥感图像输入至编码器中，提取可见光遥感图像的高级语义特征，得到不同层级的特征图：基于不同层级的特征图分别进行全局场景提取和基于自注意力模块的本质特征提取，对应得到场景引导特征图和无噪声特征图；将场景引导特征图和无噪声特征图输入至解码器中上采样回原图大小，并进行逐像素分类，得到遥感图像语义分割结果。本发明专利技术通过提取语义特征的编码器，用于增加图像内部联系的自注意力模块，用于将注意力加权后的语义特征映射回原空间以便进行逐像素分类的解码器，提高了模型的感受野，能够适应数据的尺度变化且能够解决类别不平衡问题。

Remote sensing image semantic segmentation method based on self attention mechanism of region description

全部详细技术资料下载

【技术实现步骤摘要】
基于区域描述自注意力机制的遥感图像语义分割方法
本专利技术涉及遥感和计算机视觉
，更具体的说是涉及基于区域描述自注意力机制的遥感图像语义分割。
技术介绍
将语义分割技术应用在遥感领域，可以达到输入一张遥感图像，输出遥感图像中每个像素类别标签的效果，对理解遥感图像有着很大的帮助。例如在国土规划方面，若能将卫星图像上每个像素的地表覆盖类型(城市、道路、森林、耕地、河流等)识别出来，便能清楚的了解到他们的分布情况以及占用面积，有利于进行全局规划；再比如对建筑进行智能识别，不仅可以很快的发现是否有违规建筑，而且可以大大减少人力的消耗。目前大部分利用深度学习做语义分割的工作都是全卷积网络FCN的衍生品，FCN将上述知名的分类网络转化为全卷积网络，具体做法为将全连接层替换为卷积层，并且通过将深层特征经反卷积操作与浅层特征相融合，兼顾高级语义特征与低级位置特征，增加了模型的准确性。但FCN仍然无法适用于所有场景，最主要的原因在于卷积的局部特性导致感受野较小，从而无法考虑到更大范围的上下文信息。为解决上述问题，在FCN的基础上...

【技术保护点】
1.基于区域描述自注意力机制的遥感图像语义分割方法，其特征在于，包括：/n步骤1：将可见光遥感图像输入至编码器中，提取高级语义特征，得到不同层级的特征图：/n步骤2：基于不同层级的所述特征图分别进行全局场景提取和基于自注意力模块的本质特征提取，对应得到场景引导特征图和无噪声特征图；/n步骤3：将所述场景引导特征图和所述无噪声特征图输入至解码器中上采样回所述可见光遥感图像大小，并进行逐像素分类，得到遥感图像语义分割结果。/n

【技术特征摘要】
1.基于区域描述自注意力机制的遥感图像语义分割方法，其特征在于，包括：
步骤1：将可见光遥感图像输入至编码器中，提取高级语义特征，得到不同层级的特征图：
步骤2：基于不同层级的所述特征图分别进行全局场景提取和基于自注意力模块的本质特征提取，对应得到场景引导特征图和无噪声特征图；
步骤3：将所述场景引导特征图和所述无噪声特征图输入至解码器中上采样回所述可见光遥感图像大小，并进行逐像素分类，得到遥感图像语义分割结果。

2.根据权利要求1所述的基于区域描述自注意力机制的遥感图像语义分割方法，其特征在于，所述编码器包括特征提取网络ResNet-101。

3.根据权利要求2所述的基于区域描述自注意力机制的遥感图像语义分割方法，其特征在于，将所述可见光遥感图像I输入至所述特征提取网络ResNet-101中，第四层输出特征图F4，第五层输出特征图F5。

4.根据权利要求3所述的基于区域描述自注意力机制的遥感图像语义分割方法，其特征在于，步骤2中生成无噪声特征图的具体步骤为：
步骤21：根据groundtruth将所述特征图F4划分为K个软区域N＝{M1,M2,…MK}，其中，每个所述软区域Mk属于第k个类别，N表示软区域集合；
步骤22：将每个所述软区域内的像素值加权聚合得到当前区域的粗区域描述子，计算公式为：

式中，fk表示粗区域描述子，xi表示特征图F4中像素pi的特征，表示像素pi属于第k个软区域的概率，I表示特征图F4中取到的像素点；
将所述粗区域描述子经1x1卷积变换得到最终的T个区域描述子rt；
步骤23：计算所述特征图F5经降维后，每个像素与所述区域描述子之间的关系，得到每个像素相对于所述区域描述子的自注意力权值：

式中，T表示软区域个数，rt表示区域描述子，Wit表示自注意力权值；
步骤24：基于所述自注意力权值，计算点与区域的关联度：

式中，rt表示第t个区域描述子，Wit表示特征图F5经降维后的特征图中第i个像素与第t个区域描述子的自注意力权值，δ(·)和ρ(·)是两个变换函数，yi表示点与区域的关联度；
步骤25：基于所述点与区域的关联度以及所述区域描述子，得到所述无噪声特征图；

式中，g(·)是一个变换函数，包括1x1卷积、批归一化层和ReLU激活函数，xi表示特征图F...

【专利技术属性】
技术研发人员：赵丹培，王晨旭，史振威，姜志国，张浩鹏，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人