一种融合扩散模型与转换器的遥感图像语义分割方法技术

技术编号:42840272 阅读:30 留言:0更新日期:2024-09-27 17:12
本发明专利技术属于深度学习语义分割技术领域,具体涉及一种融合扩散模型与转换器的遥感图像语义分割方法,步骤包括获取卫星图像数据集和盆地地区数据集;构建去噪扩散概率模型;构建视觉变压器ViT;基于多头交叉注意力设计多个融合模块,并采用轻量级的多层感知机结构来设置解码器,获得精细化语义分割网络;对精细化语义分割网络进行训练;通过去噪扩散概率模型获取图像的多尺度语义特征,通过ViT获取图像的粒度特征,最终通过精细化语义分割网络对去噪扩散概率模型输出和ViT输出进行融合。本发明专利技术能够利用去噪扩散概率模型架构获得高度精细的多尺度语义特征,并将其用于土地利用与覆盖分类分割,显著提高了土地利用与覆盖分类分割性能。

【技术实现步骤摘要】

本专利技术属于深度学习语义分割,具体涉及一种融合扩散模型与转换器的遥感图像语义分割方法


技术介绍

1、与传统的语义分割方法相比,基于深度学习的遥感图像特征自动识别更加复杂和具有挑战性。遥感影像往往涉及幅员辽阔的地理区域,其中的地物复杂多样,尺寸较大,导致地物种类高度异质性和复杂性。这种分类的复杂性往往会导致样本分类在分割过程中出现不平衡。同时,遥感影像中地物的形状、纹理和尺度变化具有高度的多样性和复杂性,给自动语义分割的准确实现带来了困难。基于遥感影像的土地利用与土地覆盖自动分割研究尤为重要,因为该领域对生态保护、城市规划、灾害风险评估和经济发展具有深远意义。

2、在深度生成模型领域,生成对抗网络、变分自编码器、自回归模型和概率扩散模型在图像合成、超分辨率增强、文本到图像和图像到图像转换等各种应用中显示出巨大的潜力。这些模型的图像生成过程涉及两个核心目标:创建高度逼真的目标图像,捕获和概括数据中的关键模式。生成模型可以在图像创建过程中提取图像的关键特征并学习图像的核心语义。特别是,扩散生成模型在使用马尔可夫链和朗之万动力学来学习复杂数据分布方本文档来自技高网...

【技术保护点】

1.一种融合扩散模型与转换器的遥感图像语义分割方法,其特征在于包括以下步骤:

2.根据权利要求1所述的一种融合扩散模型与转换器的遥感图像语义分割方法,其特征在于:所述的S1中,基于LoveDA数据集,获取城市乡村场景下的土地利用与土地覆盖的0.3米高分辨率卫星图像,其中涵盖了七类内容,即建筑物、道路、水体、荒地、森林、农田以及背景;按照6:2:2的比例将卫星图像数据集划分为训练集、验证集和测试集,卫星图像数据集中每张图像的分辨率为512×512。

3.根据权利要求1所述的一种融合扩散模型与转换器的遥感图像语义分割方法,其特征在于:所述的S2中,首先采集盆地地区的高...

【技术特征摘要】

1.一种融合扩散模型与转换器的遥感图像语义分割方法,其特征在于包括以下步骤:

2.根据权利要求1所述的一种融合扩散模型与转换器的遥感图像语义分割方法,其特征在于:所述的s1中,基于loveda数据集,获取城市乡村场景下的土地利用与土地覆盖的0.3米高分辨率卫星图像,其中涵盖了七类内容,即建筑物、道路、水体、荒地、森林、农田以及背景;按照6:2:2的比例将卫星图像数据集划分为训练集、验证集和测试集,卫星图像数据集中每张图像的分辨率为512×512。

3.根据权利要求1所述的一种融合扩散模型与转换器的遥感图像语义分割方法,其特征在于:所述的s2中,首先采集盆地地区的高分辨率遥感图像,获得盆地地区的0.59米高分辨率遥感图像;随后基于盆地地区的高分辨率遥感图像,利用人工目视解译技术绘制典型地貌特征,进行盆地地区数据集的制作,盆地地区数据集中包括六种典型地貌类型:戈壁、农田、水体、荒地、城市裸地和森林植被;最后将盆地地区数据集划分为训练集、验证集和测试集,比例为6:2:2,盆地地区数据集中每张图像的分辨率为256×256。

4.根据权利要求1所述的一种融合扩散模型与转换器的遥感图像语义分割方法,其特征在于:所述的s3中,获取图像的多尺度语义特征的过程为:

5.根据权利要求4所述的一种融合扩散模型与转换器的遥感图像语义分割方法,其特征在于:所述的s3中,...

【专利技术属性】
技术研发人员:范俊甫李宽时宗闻李萍杜玉洁
申请(专利权)人:山东理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1