基于注意力机制的无监督彩色地质图像分割方法及系统技术方案

技术编号:39662298 阅读:8 留言:0更新日期:2023-12-11 18:25
本发明专利技术公开了一种基于注意力机制的无监督彩色地质图像分割方法及系统,首先将彩色地质图像进行数学形态学预处理,获得预处理图像;然后将预处理图像分别利用

【技术实现步骤摘要】
基于注意力机制的无监督彩色地质图像分割方法及系统


[0001]本专利技术涉及计算机应用
及图像分割
,涉及一种无监督彩色图像分割方法及系统,具体涉及一种基于图聚类算法及注意力机制的无监督彩色地质图像分割方法及系统


技术介绍

[0002]随着技术的不断发展,图像分割在计算机视觉领域的重要性日益凸显

图像分割是指将一幅图像划分为多个子区域或像素集合的过程,使得每个子区域内的像素具有相似的特征或语义信息,其主要目的是提取图像中的语义信息,并将图像分割为具有独立语义的区域,从而实现对图像的理解和解释

图像分割在许多应用领域发挥着重要的作用,其中包括自动驾驶

医学图像分析等,通过图像分割,可以实现对图像中的对象

边界和结构的准确提取和定位,为后续的图像处理和分析任务提供基础

[0003]目前图像分割方法可以分为基于规则

机器学习

深度学习三类方法

基于规则的方法使用预定义的规则和模式匹配进行图像分割,通常依赖于人工设计的规则和阈值,将像素分为不同的区域

机器学习方法可以自动学习图像分割的模式和特征,依靠训练数据进行学习,再根据学到的模型对新的图像进行分割

深度学习方法利用深度神经网络从图像的原始像素级别上学习到更高层次的特征表示,从而实现更准确的分割效果

[0004]在图像分割领域,大量的研究致力于从非结构化图像中提取信息

虽然这些努力取得了一定的成果,但现有的图像分割方法在地质图像领域中仍然存在局限性

基于规则的分割方法往往需要人工干预,使用人工标注的特征规则进行分割,利用图像的纹理

颜色等视觉表面特征和外部结构特征进行处理,特征的性能及鲁棒性受到限制

由于地质图像的复杂性和多样性,监督式的机器学习和深度学习算法并不适用于地质图像分割场景

基于半监督和无监督的深度学习分割方法在从高度异构和复杂的地质图像中提取信息仍然存在一定的局限性


技术实现思路

[0005]为解决上述技术问题,本专利技术提供了一种基于图聚类算法及注意力机制的无监督彩色地质图像分割方法及系统

[0006]本专利技术的方法所采用的技术方案是:一种基于注意力机制的无监督彩色地质图像分割方法,包括以下步骤:
[0007]步骤1:将彩色地质图像进行数学形态学预处理,获得预处理图像;
[0008]步骤2:将预处理图像分别利用
SE

UNet
神经网络和
Felz
聚类算法,获取粗分割图像和超像素分割图;
[0009]所述
SE

UNet
神经网络,由编码器

解码器以及跳跃连接构成;
[0010]所述编码器,由顺序连接的卷积层
、ReLU
修正线性单元及池化层组成;所述卷积层,通过卷积核对输入源图像的不同区域应用滑动窗口,提取出图像局部的特征矩阵;所述
ReLU
修正线性单元,通过对卷积层提取到的特征进行非线性映射,使特征更易于区分;所述池化层,将
ReLU
修正线性单元处理后的输出特征按照指定的池化大小进行分块;
[0011]所述跳跃连接,将编码器中的特征图与对应解码器中的特征图按通道进行拼接,作为解码器的输入;其中,在跳跃连接中加入
SE
注意力机制;
[0012]所述解码器,由顺序连接的卷积层
、ReLU
修正线性单元及转置卷积构成;所述转置卷积,通过上采样特征图恢复图像的位置信息,同时与编码器相对应的低层级特征结合,输出分割结果;
[0013]步骤3:将超像素分割图作为“伪标签”,基于超像素分割图对粗分割图像进行优化,前向传播输出预测分割结果,实现无标签的彩色地质图像分割

[0014]本专利技术的系统所采用的技术方案是:一种基于注意力机制的无监督彩色地质图像分割系统,包括:
[0015]一个或多个处理器;
[0016]存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现所述的基于注意力机制的无监督彩色地质图像分割方法

[0017]本专利技术具有以下有益效果:
[0018]1、
本专利技术对待分割的图像进行了数学形态学预处理,减少了噪声等无关因素对分割的影响,更好地保留图像的结构信息及边缘信息,提升地质图像的质量和可分割性

[0019]2、
本专利技术采用
Felz
聚类算法,对图像中像素的相似性判定部分采用颜色相似度及纹理相似度的加权求和得出边权值,增强算法对彩色地质图像的聚类特征信息判断能力

[0020]3、
本专利技术提出了
SE

UNet
多模态信息提取模块,将
SE
注意力机制嵌入
UNet
的编码器和解码器的跳跃连接部分,使
SE
注意力机制能够自适应地学习并调整地质图像中的特征权重,有效地提取和强化重要的地质特征,提高图像分割的感知能力和表征能力

[0021]4、
本专利技术提出基于图的聚类算法及注意力机制的分割模型对彩色地质图像进行分割,无需任何人工标注,自动分割能力强

附图说明
[0022]下面使用实施例,以及具体实施方式作进一步说明本文的技术方案

另外,在说明技术方案的过程中,也使用了一些附图

对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图以及本专利技术的意图

[0023]图1是本专利技术实施例的方法流程图

[0024]图2是本专利技术实施例的彩色地质图像示意图

[0025]图3是本专利技术实施例的彩色地质图像预处理示意图

[0026]图4是本专利技术实施例的
SE

UNet
神经网络结构图

[0027]图5是本专利技术实施例的超像素分割结果示意图

[0028]图6是本专利技术实施例最终得到的分割结果示意图

具体实施方式
[0029]为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本发
明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术

[0030]请见图1,本专利技术提供的一种基于注意力机制的无监督彩色地质图像分割方法,包括以下步骤:本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于注意力机制的无监督彩色地质图像分割方法,其特征在于,包括以下步骤:步骤1:将彩色地质图像进行数学形态学预处理,获得预处理图像;步骤2:将预处理图像分别利用
SE

UNet
神经网络和
Felz
聚类算法,获取粗分割图像和超像素分割图;所述
SE

UNet
神经网络,由编码器

解码器以及跳跃连接构成;所述编码器,由顺序连接的卷积层
、ReLU
修正线性单元及池化层组成;所述卷积层,通过卷积核对输入源图像的不同区域应用滑动窗口,提取出图像局部的特征矩阵;所述
ReLU
修正线性单元,通过对卷积层提取到的特征进行非线性映射,使特征更易于区分;所述池化层,将
ReLU
修正线性单元处理后的输出特征按照指定的池化大小进行分块;所述跳跃连接,将编码器中的特征图与对应解码器中的特征图按通道进行拼接,作为解码器的输入;其中,在跳跃连接中加入
SE
注意力机制;所述解码器,由顺序连接的卷积层
、ReLU
修正线性单元及转置卷积构成;所述转置卷积,通过上采样特征图恢复图像的位置信息,同时与编码器相对应的低层级特征结合,输出分割结果;步骤3:将超像素分割图作为“伪标签”,基于超像素分割图对粗分割图像进行优化,前向传播输出预测分割结果,实现无标签的彩色地质图像分割
。2.
根据权利要求1所述的基于注意力机制的无监督彩色地质图像分割方法,其特征在于:步骤1中所述数学形态学预处理,首先对彩色地质图像进行膨胀操作,再进行腐蚀操作得到预处理后的预处理图像
x
;所述膨胀操作,将输入源图像记为
A
,结构元记为
B
;结构元
B
对输入源图像
A
进行膨胀操作的表达式为:其中,表示膨胀运算,表示结构元
B
关于原点的映射,表示平移
σ
个位移;所述腐蚀操作,结构元
B
对输入源图像
A
进行腐蚀操作的表达式为:其中,表示腐蚀运算,
()
σ
表示结构元
B
平移
σ
个位移
。3.
根据权利要求1所述的基于注意力机制的无监督彩色地质图像分割方法,其特征在于:步骤2中,所述
SE

UNet
神经网络,由多层编码器模块

多层解码器模块以及注意力机制

跳跃连接模块构成;所述多层编码器模块,包含串联设置的四个编码器块,每个编码器块由卷积层

批归一化层及
ReLU
层构成,所述编码器块之间均使用下采样层连接,其中下采样层特指最大池化操作;输入图像首先进入第一个编码器块,通过两次卷积

批归一化和
ReLU
操作,得到编码器块输出特征
F1
,再对特征
F1
进行最大池化操作得到下采样输出特征
G1
;所述编码器模块的第二个编码器块的输入是所述编码器模块第一个编码器块输出特征
F1
经下采样层得到的特征
G1
,对应的编码器块输出特征为
F2
;后续第三

四个编码器的输入均是上一个相邻编码器块的输出特征经下采样操作得到,则得出第三

四个编码器的输入特征分别为
G2

G3
,对应的编码器块输出为
F3

F4
;所述注意力机制

跳跃连接模块,用于对所述多层编码器模块中前三个编码器块输出
特征
F1、F2、F3
,通过对编码器块输出特征
F1、F2、F3
在空间维度上进行全局平均池化,得到通道维度特征
C1、C2、C3
;所述通道维度特征
C1、C2、C3
输入到两个全连接层中获取通道注意力权重
W1、W2、W3
,其中第一个全连接层之后加入
ReLU
非线性激活函数,第二个全连接层之后加入
Sigmoid
非线性激活函数,之后通道注意力权重
W1、W2、W3
分别与编码器块输出特征
F1、F2、F3
进行逐通道相乘,获得注意力融合特征
S1、S2、S3
;所述多层解码器模块,由三个解码器块构成,每个解码器块由卷积层

批归一化层及
ReLU
层构成,所述解码器块之间均使用上采样层连接,其中上采样层特指转置卷积,用于对所述编码器模块底层编码器块输出特征以及所述解码器模块各解码器块输出特征进行上采样操作;所述多层解码器模块第一个解码器块的输入是所述多层编码器模块第四个编码器块的输出特征
F4
的转置卷积值与注意力融合特征
S3
进行拼接操作的多尺度特征
T1
,其中拼接操作是将所述编码器块特征
F4
的转置卷积值与所述注意力融合特征
S3
在通道维度上进行拼接,得到的多尺度特征
T1
的通道数为注意力融合特征
S3
通道数的2倍,大小与
S3
一致;所述多层解码器模块第二个解码器块的输入是上一个解码器模块的多尺度输入特征
T1
,通过第一个解码器块的处理,再经过转置卷积的输出特征和所述注意力机制

跳跃模块的注意融合特征
S2
在空间通道上的拼接,得到多尺度输入特征为
T2
,其中特征
T2
的通道数为注意力融合特征
S2
通道数的2倍,大小与
S2
一致;所述多层解码器模块第三个解码器块的输入是上一个解码器块的多尺度输入特征
T2
,通过第二个解码器块的处理,再经过转置卷积的输出特征与所述注意力机制

跳跃模块的注意融合特征
S1
在空间通道上的拼接,得到多尺度输入特征
T3
,其中特征
T3
的通道数为注意力融合特征
S1
通道数的2倍,大小与
S1
一致;所述第三个解码器块的输出特征
M
,经过一个空间通道调整卷积层获得粗分割特征图
。4.
根据权利要求1所述的基于注意力机制的无监督彩色地质图像分割方法,其特征在于:步骤2中,所述
SE
注意力机制由
Squeeze
操作
、Excitation
操作
、Reweight
操作构成;所述
Squeeze
操作,通过全局平均池化将每个通道上的空间信息压缩编码成全局特征
z
c
;其中,
F
sq
()
表示
Squeeze
操作定义,
C,G,W
分别表示特征图的通道数



宽,
l
c
表示第
c
个通道的特征图,
i,j
表示像素位置;所述
Excitation
操作,将
Squeeze
操作得到的全局特征传入两个全连接层,通过赋值操作,赋予两个全连接层各自一个权重,构建不同通道互相之间的依赖性
s

s

D
ex
(z,W)

φ
[g(z,W)]

φ
[W2ρ
(W1,z)]
;其中,
F
ex
()

Excitation
操作定义,
z

Squeeze
操作输出,
W1和
W2为通道权重,
φ
()

Sigmoid
归一化函数,
ρ
()

ReLU
激活函数;所述
Reweight
操作,将
Excitation
操作得到的权重
s
加权到原输入特征上,得到输出并作为下一级的输入;其中,
F
scale
()

Reweight
操作定义,
s
c

Excitation
操作的输出矩阵通道权重值
。5.
根据权利要求1所述的基于注意力机制的无监督彩色地质图像分割方法,其特征在
于:步骤2中所述
Felz
聚类算法,具体实现包括以下子步骤:步骤
2.1
:构建无向图;使用无向图
G
抽象化表示地质图像,其中
G

(V,E)
,由顶点集
V
和边集
E
组成,
v
i
∈V

(v
i
,v
j
)∈E
表示相邻顶点
(v
i
,v
j
)
之间连接的边,
ω
ij

(v
i
,v
j
)
表示每条相连的边
(v
i
,v
j
)
具有的权值,
R

【专利技术属性】
技术研发人员:邱芹军马凯刘俊杰杨盈段雨希谢忠陶留锋郑帅田苗
申请(专利权)人:三峡大学深圳市规划和自然资源数据管理中心深圳市空间地理信息中心
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1