基于交叉注意引导特征对齐网络的道路裂缝检测方法和系统技术方案

技术编号：39753761 阅读：6 留言：0更新日期：2023-12-17 23:52

本发明专利技术公开了基于交叉注意引导特征对齐网络的道路裂缝检测方法和系统

全部详细技术资料下载

【技术实现步骤摘要】
基于交叉注意引导特征对齐网络的道路裂缝检测方法和系统

[0001]本专利技术属于道路裂缝检测领域，更具体地，涉及一种用于道路裂缝的检测方法
。

技术介绍

[0002]道路在经济繁荣和扩张中发挥着至关重要的作用，它们具有显著的社会效益
。
道路网络促进交通和互联互通，它们为人们提供了方便的就业
、
社会
、
卫生和教育服务
。
因此，道路基础设施被认为是所有公共资产中最重要的部分之一
。
但是，由于位置
、
交通量
、
天气
、
施工材料等各种因素的影响，路面会随着时间的推移而逐渐磨损变质，造成交通事故
。
在许多国家，道路养护里程已占道路总里程的
99
％
。
因此，道路裂缝检测是道路基础设施领域的一项重要任务，涉及道路裂缝的定位和分类
。
它可以识别需要维护的道路，以减少潜在的安全隐患，对于有效
、
经济的道路养护和交通安全尤为重要
。
[0003]传统方法中，道路裂缝区域通常使用阈值法进行检测
。
这些算法可以通过设置不同的阈值来快速检测输入图像的结果
。
由于道路裂缝区域吸收的光线较多，因此通常在图像中呈现为较暗的区域
。
然而，当存在一定程度的噪声时，低于损伤像素强度的像素严重降低了整体检测性能
。
这些方法缺乏全局信...

【技术保护点】

【技术特征摘要】
1.
一种基于交叉注意引导特征对齐网络的道路裂缝检测方法，其特征在于，包括以下步骤：步骤1，采集道路裂缝图像作为数据集，并划分为训练集和测试集；步骤2，构建由编码器和解码器组成的裂缝自动化检测模型，所述编码器包括权重共享的协同网络模块
encoder1
和
encoder2
，以及跨层交互模块，所述解码器包括多尺度特征融合以及特征对齐模块；所述权重共享的协同网络
encoder1
和
encoder2
分别都拥有
k
个阶段，每个阶段包括多尺度图像块嵌入层和多头卷积自注意力层，输入裂缝图像，分别获取
k
个阶段的不同尺度特征图；所述跨层交互模块首先对
encoder1
和
encoder2
中同一阶段的不同尺度特征图进行重塑和维度交换操作，然后对得到的张量进行归一化和全局平均池化的操作，最后利用自注意力机制提取更全面的裂缝特征语义信息；所述多尺度特征融合模块采用重建与上采样块的双重渐进式融合策略，将提取到的含有丰富多尺度语义信息的特征进行融合；所述特征对齐模块结合图像中的上下文信息，对多尺度特征融合模块的输出图像进行特征对齐操作，确保不同层级或分支特征之间的尺度和语义一致性；步骤3，利用步骤1中的训练集对步骤2中的裂缝自动化检测模型进行训练，利用训练好的模型实现道路裂缝检测
。2.
根据权利要求1所述的方法，其特征在于，步骤1包括：
11)
采用车载高清摄像头采集到的道路裂缝图像作为数据集，根据数据集中的裂缝图像来制作二值化标签图像，其中，标签图像中的每个像素代表一种类别，为裂缝或背景；
12)
将道路裂缝图像以及其对应的二值化标签图像组成道路裂缝自动化检测图像数据集，在该数据集中按照一定的比例划分训练集和测试集
。3.
根据权利要求1所述的方法，其特征在于：步骤2中权重共享的协同网络的处理过程具体实现包含以下子步骤；
211)
给定输入的原始图像
F1
，首先采用由两个卷积层组成的主干块，调整图像的大小和通道数，得到第一阶段中的多尺度图像块嵌入层的输入特征；
212)
将输入特征分别同时进入
encoder1
和
encoder2
中进行特征提取操作，每个阶段中包含多尺度图像块嵌入层和多头卷积自注意力层，来提取裂缝信息；
213)
多尺度图像块嵌入层在同一特征级别上利用细粒度和粗粒度的视觉标记，使用带有重叠补丁的卷积操作；具体而言，对于来自前一阶段的
2D
重塑输出特征图作为第
i
阶段的输入，首先学习一个函数
F
k
×
k
(
·
)
，将
X
i
映射为具有通道大小
C
i
的新标记
F
k
×
k
(X
i
)
，其中
F(
·
)
是核大小即补丁大小为
k
×
k
，步幅为
s
，填充为
p
的
2D
卷积操作；输出的
2D
标记图具有以下高度和宽度：具有以下高度和宽度：通过多尺度图像块嵌入层通过更改步幅和填充来调整标记的序列长度的方式，输出具有不同标记大小的相同分辨率大小的特征；
214)
将多尺度图像块嵌入层得到的不同尺度的标记特征图分别输入到多头卷积自注意力层的每个自注意力层中，得到不同尺度的全局特征图；多尺度图像块嵌入层输出的特
征中的最后一个尺度的特征输入到了卷积局部特征块得到局部特征图；最后，利用多尺度特征交互块，将局部特征和全局特征聚合起来，并通过一个卷积操作得到第一阶段的输出特征图；
215)
每一阶段都按步骤
213)
‑
215)
进行处理，
encoder1
和
encoder2
分别输出多个不同尺度的特征图
。4.
根据权利要求3所述的方法，其特征在于：主干块中的第一个卷积层的通道数为
C1/2
，第二个卷积层的通道数为
C1
，两个卷积操作生成特征图的大小为
H/4
×
W/4
×
C1
，其中
C1
为第一阶段的通道大小，每个卷积之后是
Batch Normalization
和
Hardswish
激活函数
。5.
根据权利要求3所述的方法，其特征在于：多头卷积自注意力层的处理过程为：输入首先经过
Layer Norm
进行归一化，然后通过
Factorized MHSA
进行自注意力计算，接着通过残差连接将原始输入与注意力输出相加，再进行
Layer Norm
归一化，之后，通过
FFN
进行非线性变换，再次通过残差连接，最后再进行
Layer Norm
归一化；卷积局部特征块采用由1×1卷积
、3
×3深度卷积和1×1卷积组成的残差瓶颈块实现
。6.
根据权利要求1所述的方法，其特征在于：步骤2中的跨层交互模块的具体实现包含以下子步骤；
221)
将特征形状分别为
[B,C,H,W]、[B,2C,H,W]
的输入特征矩阵分别进行形状调整操作，将它们从
4D
张量变成
3D
张量，并交换它们各自的第二和第三个维度，分别得到张量
e
，
r
；
[B,C,H,W]
代表的是
encoder1
中每一个阶段得到的特征图的统称，
[B,2C,H,W]
代表的是
encoder2
中每一个阶段得到的特征图的统称，
encoder1
和
encoder
相同阶段的特征图之间通道数之间是2倍的关系；
222)
对张量
e
和
r
同时进行归一化和全局平均池化的操作，得到长度均为1的特征向量，记为
e_t、r_t
；
223)
将
e_t
和

【专利技术属性】
技术研发人员：徐川，张琪，常秀丰，梅礼晔，孙少华，杨威，王颖，阳威，叶昭毅，张依铭，
申请(专利权)人：湖北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人