【技术实现步骤摘要】
一种基于CNN和Transformer的SAR图像分类方法
[0001]本专利技术属于图像处理
,具体涉及一种基于
CNN
和
Transformer
的
SAR
图像分类方法
。
技术介绍
[0002]合成孔径雷达(
Synthetic Aperture Radar
,
SAR
)是一种广泛应用于地面目标识别和监测的无源雷达技术
。SAR
利用雷达波束合成高分辨率的图像,具有独特的优势,如对天气和光照条件不敏感
、
可穿透云层和雾霾
、
全天候监测能力等
。SAR
图像分类是一项重要的任务,可应用于军事情报
、
灾害监测
、
土地利用等领域,但由于其成像机制的特殊性,会包含大量的散斑噪声,导致人工分类费时费力,因此
SAR
图像自动分类方法取得快速发展
。
传统的
SAR
图像分类方法主要 ...
【技术保护点】
【技术特征摘要】
1.
一种基于
CNN
和
Transformer
的
SAR
图像分类方法,其特征在于,包括:获取合成孔径雷达
SAR
图像,输入基于
CNN
和
Transformer
的融合模型;通过
CNN
模块提取图像局部特征,通过基于注意力机制的
Transformer
模块提取图像全局特征;通过并行网络结构进行分层特征融合,所述并行网络结构包括多层输出不同尺度特征所述的
CNN
模块和所述
Transformer
模块;每一层还包括一个
CTF
模块自适应地融合该层的局部特征
、
全局特征以及前一层融合后的特征;将并行网络结构最终融合的特征输入到全局平均池化和层归一化的线性分类器中进行分类结果输出,实现成孔径雷达图像分类
。2.
根据权利要求1所述的方法,其特征在于,所述
CNN
模块提取图像局部特征的方法包括:利用
Transformer
中的层归一化和
GELU
激活函数,通过线性层进行跨通道信息交互,
CNN
模块的公式为:其中表示本层
CNN
模块的输出特征,为上一层
CNN
模块输出特征,是卷积核大小为3×3的深度卷积运算,
LN
是层归一化运算,是卷积核大小为1×1的卷积运算和
GELU
激活函数
。3.
根据权利要求1所述的方法,其特征在于,所述
Transformer
模块提取图像全局特征的方法包括:在
Transformer
模块中引入窗口多头自注意力模块
W
‑
MSA
,特征图经过层归一化层进入
W
‑
MSA
,在
W
‑
MSA
中,首先将特征图划分到
M
×
M
大小的窗口内,然后在每个窗口单独进行常用的自注意力计算方式,最后通过带有
GELU
激活函数的线性层,与输入特征叠加后输出,
Transformer
模块的公式如下:其中,表示
Transformer
模块的
W
‑
MSA
的输出特征,为输入
Transformer
分支中上一个
Transformer
模块的输出特征,也是当前
Transformer
模块的
W
‑
MSA
的输入特征,
1≤i≤n
,
n
为
Transformer
分支中
Transformer
模块的个数;是卷积核大小为1×1的卷积运算和
GELU
激活函数,
LN
是层归一化运算
。4.
根据权利要求1所述的方法,其特征在于,所述并行网络结构包括:相同层次的
CNN
分支和
T...
【专利技术属性】
技术研发人员:李俊杰,刘威,付彩玲,
申请(专利权)人:山东军地信息技术集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。