【技术实现步骤摘要】
本申请涉及计算机视觉领域,尤其涉及一种基于多源遥感影像的视觉大模型构建方法、相应的装置、电子设备及计算机可读存储介质。
技术介绍
1、当前遥感影像解译领域主要采用针对单一传感器数据的专用模型,例如光学影像的卷积神经网络、sar影像的极化分解算法、红外影像的温度特征分类器等。现有技术通常针对特定传感器类型(如光学、sar或红外)独立设计模型架构,通过大量标注数据训练单一场景下的目标识别或地物分类模型。部分改进技术尝试通过迁移学习或数据增强提升模型的跨源适应能力,但核心方法仍以单一传感器数据为输入,未突破多源数据协同建模的局限性。现有技术体系下,不同传感器模型之间参数不共享、特征表达不兼容,导致跨源影像解译时需重新训练或微调模型。
2、现有技术的工作流程分为数据预处理、特征提取与分类识别三个阶段。对于光学影像,采用基于rgb通道的卷积神经网络提取空间光谱特征;sar影像处理依赖相干斑噪声抑制模块与极化散射特征提取器,通过后向散射强度建模目标特性;红外影像则通过温度阈值分割与热辐射特征分析实现目标检测。在模型结构上,现有技术通常采
...【技术保护点】
1.一种基于多源遥感影像的视觉大模型构建方法,其特征在于,包括:
2.根据权利要求1所述的基于多源遥感影像的视觉大模型构建方法,其特征在于,获取包含各个目标对象的雷达遥感影像以及其相对应的红外遥感影像、光学遥感影像的步骤,包括:
3.根据权利要求1所述的基于多源遥感影像的视觉大模型构建方法,其特征在于,基于Swin Transformer模型采用局部窗口自注意力机制根据所述光学遥感影像的随机遮蔽影像相对应的编码数据,捕捉所述光学遥感影像中的各个目标对象相对应的局部细节特征的步骤,包括:
4.根据权利要求1所述的基于多源遥感影像的视觉
...【技术特征摘要】
1.一种基于多源遥感影像的视觉大模型构建方法,其特征在于,包括:
2.根据权利要求1所述的基于多源遥感影像的视觉大模型构建方法,其特征在于,获取包含各个目标对象的雷达遥感影像以及其相对应的红外遥感影像、光学遥感影像的步骤,包括:
3.根据权利要求1所述的基于多源遥感影像的视觉大模型构建方法,其特征在于,基于swin transformer模型采用局部窗口自注意力机制根据所述光学遥感影像的随机遮蔽影像相对应的编码数据,捕捉所述光学遥感影像中的各个目标对象相对应的局部细节特征的步骤,包括:
4.根据权利要求1所述的基于多源遥感影像的视觉大模型构建方法,其特征在于,采用门控交叉注意力机制将所述各个目标对象相对应的局部细节特征与所述目标对象相对应的全局语义信息进行特征融合,以确定所述各个目标对象相对应的多源融合特征的步骤,包括:
5.根据权利要求1所述的基于多源遥感影像的视觉大模型构建方法,其特征在于,将预训练好的编码器添加具体的任务头进行微调...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。