【技术实现步骤摘要】
基于多头注意力的多尺度融合沥青路面裂缝识别方法
[0001]本专利技术涉及图像分类
,更具体的说,涉及基于多头注意力的多尺度融合沥青路面裂缝识别方法。
技术介绍
[0002]目前的路面裂缝图像多分类工作中,通过CNN方法存在局部感受野局限的问题,过多的堆叠层数容易导致有用信息特征的丢失,同时CNN获取的特征主要关注了局部区域,难以从整体视野进行特征的捕获。通常,采集车采集的路面裂缝图像中的裂缝类别较多,需要考虑到图像的全局特征以及局部特征进行样本的特征学习,并实现基于全局空间特征的图像多类型裂缝识别,能够有效提升路面检测和维修的智能化水平。
技术实现思路
[0003]在路面裂缝检测中,如何对路面裂缝图像进行智能化的准确检测,对于道路交通安全具有重要的价值。路面裂缝具有阴影、裂缝退化、纹理等特点,同时伴随有横向、纵向、斜向、交叉、网状裂缝等类型。多尺度的图像块可以自动获取高质量的特征,同时通过注意力机制可以获取裂缝的增强特征,基于多头注意力的多尺度特征能够获取图像的局部和全局信息,显著提升图像分类常识别的 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.基于多头注意力的多尺度融合沥青路面裂缝识别方法,其特征在于,包括以下步骤:S1,采用手机和检测车采集沥青路面的包含多类型裂缝的图像,分别包括“有裂缝”和“无裂缝”两种类别,并人工标注横向裂缝、纵向裂缝和网状裂缝标签;S2,基于锐化、双边滤波和灰度变换中的至少一种进行裂缝图像的数据预处理和数据增强;S3,将数据增强后的沥青路面裂缝图像数据集分为训练集、验证集和测试集;S4,将训练集的输入图像分成多个图像块,设计多尺度融合的卷积网络在每个图像块上进行特征抽取;S5,针对每个图像块,将多尺度融合后的图像块特征与位置编码向量进行拼接,输入transformer编码器,图像块采用多头注意力机制进行图像特征提取,利用多层感知器进行类别概率计算;S6,在采集的沥青路面裂缝图像集上,为每个图像进行分类,计算交叉熵损失函数,并采用梯度反传优化方法,降低损失函数值,最终得到分类模型;S7,对于新的图像,重复步骤S2
‑
S5利用分类模型学习的参数进行裂缝识别。2.根据权利要求1所述的基于多头注意力的多尺度融合沥青路面裂缝识别方法,其特征在于,所述步骤S2中,基于锐化、双边滤波和灰度变换中的至少一种进行裂缝图像的数据预处理和数据增强的方法如下:S2.1,对沥青路面的图像进行亮度变化,高斯噪声模糊和椒盐噪声叠加中的至少一种图像操作;S2.2,对图像进行翻转、平移和旋转中的至少一种实现数据增强变换。3.根据权利要求2所述的基于多头注意力的多尺度融合沥青路面裂缝识别方法,其特征在于,所述步骤S4中,将训练集的输入图像分成多个图像块,设计多尺度融合的卷积网络在每个图像块上进行特征抽取的方法如下:S4.1,将输入图像分割成s个图像块,在第一块上进行卷积,获取第一块的特征f1;S4.2,将第i块的输入与第i
‑
技术研发人员:郝晨先,贾皓杰,牛彦峰,侯宇,王国忠,武文婕,张敏,李承峰,沙晓鹏,降慧,
申请(专利权)人:山西省交通建设工程质量检测中心有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。