【技术实现步骤摘要】
基于注意力机制的无监督彩色地质图像分割方法及系统
[0001]本专利技术涉及计算机应用
及图像分割
,涉及一种无监督彩色图像分割方法及系统,具体涉及一种基于图聚类算法及注意力机制的无监督彩色地质图像分割方法及系统
。
技术介绍
[0002]随着技术的不断发展,图像分割在计算机视觉领域的重要性日益凸显
。
图像分割是指将一幅图像划分为多个子区域或像素集合的过程,使得每个子区域内的像素具有相似的特征或语义信息,其主要目的是提取图像中的语义信息,并将图像分割为具有独立语义的区域,从而实现对图像的理解和解释
。
图像分割在许多应用领域发挥着重要的作用,其中包括自动驾驶
、
医学图像分析等,通过图像分割,可以实现对图像中的对象
、
边界和结构的准确提取和定位,为后续的图像处理和分析任务提供基础
。
[0003]目前图像分割方法可以分为基于规则
、
机器学习
、
深度学习三类方法
。
基于规则的方法使用预定义的规则和模式匹配进行图像分割,通常依赖于人工设计的规则和阈值,将像素分为不同的区域
。
机器学习方法可以自动学习图像分割的模式和特征,依靠训练数据进行学习,再根据学到的模型对新的图像进行分割
。
深度学习方法利用深度神经网络从图像的原始像素级别上学习到更高层次的特征表示,从而实现更准确的分割效果
。
[0004]在图像分割领域,大量 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种基于注意力机制的无监督彩色地质图像分割方法,其特征在于,包括以下步骤:步骤1:将彩色地质图像进行数学形态学预处理,获得预处理图像;步骤2:将预处理图像分别利用
SE
‑
UNet
神经网络和
Felz
聚类算法,获取粗分割图像和超像素分割图;所述
SE
‑
UNet
神经网络,由编码器
、
解码器以及跳跃连接构成;所述编码器,由顺序连接的卷积层
、ReLU
修正线性单元及池化层组成;所述卷积层,通过卷积核对输入源图像的不同区域应用滑动窗口,提取出图像局部的特征矩阵;所述
ReLU
修正线性单元,通过对卷积层提取到的特征进行非线性映射,使特征更易于区分;所述池化层,将
ReLU
修正线性单元处理后的输出特征按照指定的池化大小进行分块;所述跳跃连接,将编码器中的特征图与对应解码器中的特征图按通道进行拼接,作为解码器的输入;其中,在跳跃连接中加入
SE
注意力机制;所述解码器,由顺序连接的卷积层
、ReLU
修正线性单元及转置卷积构成;所述转置卷积,通过上采样特征图恢复图像的位置信息,同时与编码器相对应的低层级特征结合,输出分割结果;步骤3:将超像素分割图作为“伪标签”,基于超像素分割图对粗分割图像进行优化,前向传播输出预测分割结果,实现无标签的彩色地质图像分割
。2.
根据权利要求1所述的基于注意力机制的无监督彩色地质图像分割方法,其特征在于:步骤1中所述数学形态学预处理,首先对彩色地质图像进行膨胀操作,再进行腐蚀操作得到预处理后的预处理图像
x
;所述膨胀操作,将输入源图像记为
A
,结构元记为
B
;结构元
B
对输入源图像
A
进行膨胀操作的表达式为:其中,表示膨胀运算,表示结构元
B
关于原点的映射,表示平移
σ
个位移;所述腐蚀操作,结构元
B
对输入源图像
A
进行腐蚀操作的表达式为:其中,表示腐蚀运算,
()
σ
表示结构元
B
平移
σ
个位移
。3.
根据权利要求1所述的基于注意力机制的无监督彩色地质图像分割方法,其特征在于:步骤2中,所述
SE
‑
UNet
神经网络,由多层编码器模块
、
多层解码器模块以及注意力机制
‑
跳跃连接模块构成;所述多层编码器模块,包含串联设置的四个编码器块,每个编码器块由卷积层
、
批归一化层及
ReLU
层构成,所述编码器块之间均使用下采样层连接,其中下采样层特指最大池化操作;输入图像首先进入第一个编码器块,通过两次卷积
、
批归一化和
ReLU
操作,得到编码器块输出特征
F1
,再对特征
F1
进行最大池化操作得到下采样输出特征
G1
;所述编码器模块的第二个编码器块的输入是所述编码器模块第一个编码器块输出特征
F1
经下采样层得到的特征
G1
,对应的编码器块输出特征为
F2
;后续第三
、
四个编码器的输入均是上一个相邻编码器块的输出特征经下采样操作得到,则得出第三
、
四个编码器的输入特征分别为
G2
和
G3
,对应的编码器块输出为
F3
和
F4
;所述注意力机制
‑
跳跃连接模块,用于对所述多层编码器模块中前三个编码器块输出
特征
F1、F2、F3
,通过对编码器块输出特征
F1、F2、F3
在空间维度上进行全局平均池化,得到通道维度特征
C1、C2、C3
;所述通道维度特征
C1、C2、C3
输入到两个全连接层中获取通道注意力权重
W1、W2、W3
,其中第一个全连接层之后加入
ReLU
非线性激活函数,第二个全连接层之后加入
Sigmoid
非线性激活函数,之后通道注意力权重
W1、W2、W3
分别与编码器块输出特征
F1、F2、F3
进行逐通道相乘,获得注意力融合特征
S1、S2、S3
;所述多层解码器模块,由三个解码器块构成,每个解码器块由卷积层
、
批归一化层及
ReLU
层构成,所述解码器块之间均使用上采样层连接,其中上采样层特指转置卷积,用于对所述编码器模块底层编码器块输出特征以及所述解码器模块各解码器块输出特征进行上采样操作;所述多层解码器模块第一个解码器块的输入是所述多层编码器模块第四个编码器块的输出特征
F4
的转置卷积值与注意力融合特征
S3
进行拼接操作的多尺度特征
T1
,其中拼接操作是将所述编码器块特征
F4
的转置卷积值与所述注意力融合特征
S3
在通道维度上进行拼接,得到的多尺度特征
T1
的通道数为注意力融合特征
S3
通道数的2倍,大小与
S3
一致;所述多层解码器模块第二个解码器块的输入是上一个解码器模块的多尺度输入特征
T1
,通过第一个解码器块的处理,再经过转置卷积的输出特征和所述注意力机制
‑
跳跃模块的注意融合特征
S2
在空间通道上的拼接,得到多尺度输入特征为
T2
,其中特征
T2
的通道数为注意力融合特征
S2
通道数的2倍,大小与
S2
一致;所述多层解码器模块第三个解码器块的输入是上一个解码器块的多尺度输入特征
T2
,通过第二个解码器块的处理,再经过转置卷积的输出特征与所述注意力机制
‑
跳跃模块的注意融合特征
S1
在空间通道上的拼接,得到多尺度输入特征
T3
,其中特征
T3
的通道数为注意力融合特征
S1
通道数的2倍,大小与
S1
一致;所述第三个解码器块的输出特征
M
,经过一个空间通道调整卷积层获得粗分割特征图
。4.
根据权利要求1所述的基于注意力机制的无监督彩色地质图像分割方法,其特征在于:步骤2中,所述
SE
注意力机制由
Squeeze
操作
、Excitation
操作
、Reweight
操作构成;所述
Squeeze
操作,通过全局平均池化将每个通道上的空间信息压缩编码成全局特征
z
c
;其中,
F
sq
()
表示
Squeeze
操作定义,
C,G,W
分别表示特征图的通道数
、
高
、
宽,
l
c
表示第
c
个通道的特征图,
i,j
表示像素位置;所述
Excitation
操作,将
Squeeze
操作得到的全局特征传入两个全连接层,通过赋值操作,赋予两个全连接层各自一个权重,构建不同通道互相之间的依赖性
s
;
s
=
D
ex
(z,W)
=
φ
[g(z,W)]
=
φ
[W2ρ
(W1,z)]
;其中,
F
ex
()
为
Excitation
操作定义,
z
为
Squeeze
操作输出,
W1和
W2为通道权重,
φ
()
为
Sigmoid
归一化函数,
ρ
()
为
ReLU
激活函数;所述
Reweight
操作,将
Excitation
操作得到的权重
s
加权到原输入特征上,得到输出并作为下一级的输入;其中,
F
scale
()
为
Reweight
操作定义,
s
c
为
Excitation
操作的输出矩阵通道权重值
。5.
根据权利要求1所述的基于注意力机制的无监督彩色地质图像分割方法,其特征在
于:步骤2中所述
Felz
聚类算法,具体实现包括以下子步骤:步骤
2.1
:构建无向图;使用无向图
G
抽象化表示地质图像,其中
G
=
(V,E)
,由顶点集
V
和边集
E
组成,
v
i
∈V
,
(v
i
,v
j
)∈E
表示相邻顶点
(v
i
,v
j
)
之间连接的边,
ω
ij
=
(v
i
,v
j
)
表示每条相连的边
(v
i
,v
j
)
具有的权值,
R
技术研发人员:邱芹军,马凯,刘俊杰,杨盈,段雨希,谢忠,陶留锋,郑帅,田苗,
申请(专利权)人:三峡大学深圳市规划和自然资源数据管理中心深圳市空间地理信息中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。