【技术实现步骤摘要】
基于深度学习和自注意力机制的道路缺陷检测方法
[0001]本专利技术属于计算机视觉的应用领域,具体涉及一种基于深度学习和自注意力机制的道路缺陷检测方法。
技术介绍
[0002]目前,城市道路日常巡检主要靠巡查员在路上巡视,针对发现的道路缺陷,通过填报纸质表格等人工操作方式进行上报,效率较低。并且该方式存在较强的主观性,不同巡检员对同一缺陷的程度的认知难以保持一致。此外,巡检员每天巡查的道路长度一般在30
‑
40km之间,里程较短。因此,使用计算机技术手段对道路路面缺陷进行智能分析,具有重要的现实意义。现有的技术手段通常使用配备有许多传感器的道路勘测车辆来进行路面状况调查,以评估路面状况和恶化情况。然而,这些车辆通常采用激光线扫描相机和三维(3D)相机,这种安装在专用车辆上的成像设备价格昂贵,对于预算有限的机构来说往往是负担不起的,相比之下基于深度学习的2D视觉作为车载平台上的低成本方案更为合适。
[0003]基于深度卷积神经网络的检测方法,可以在背景信息多样的,有干扰的照片中识别不同类别的目标,符合 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习和自注意力机制的道路缺陷检测方法,包括如下步骤:步骤A:选取包含纵向裂纹、横向裂纹、网状裂纹、坑陷的公开道路缺陷数据集,将数据集划分为训练集、验证集和测试集;步骤B:搭建道路缺陷检测神经网络模型,网络最终输出为图像上预测的缺陷类别以及位置;步骤C:使用步骤A得到的训练集训练道路缺陷检测神经网络模型,得到适用于道路缺陷检测任务的道路缺陷检测模型;步骤D:将车载摄像机拍摄的道路图像输入步骤C中得到的道路缺陷检测模型中,进行多次检测,然后对检测出的多个道路缺陷检测结果使用非极大值抑制的方法将重复的检测结果删除,得到更准确的道路缺陷检测结果。2.根据权利要求1所述的一种基于深度学习和自注意力机制的道路缺陷检测方法,其特征在于:所述步骤B的具体步骤如下:步骤B01:道路缺陷检测神经网络模型使用DarkNet53网络作为骨干网络,并在骨干网络后添加金字塔网络与检测网络;将骨干网络的第四、第十四、第十层中的特征图X1、X2、X3,分别送入金字塔网络的第十七、第二十层、第二十三层中,其中,X1、X2、X3具有不同的尺度,分别是4倍下采样,8倍下采样,16倍下采样,与之对应的金字塔网络的第十七、第二十层、第二十三层中的特征图也具有不同的尺度,分别是8倍下采样,16倍下采样,32倍下采样;步骤B02:将步骤B01中送入特征金字塔的特征图X1、X2、X3,与金字塔网络第十三层、第十七层、第二十层中原本的特征图Y1、Y2、Y3进行融合;先采用自顶向下的融合方式,将X1、X2、X3作为上级特征图,统称为X,将Y1、Y2、Y3作为下级特征图,统称为Y,后续步骤中上级特征图X与下级特征图Y的计算都看做是X1与Y1、X2与Y2、X3与Y3的计算;假设X的尺寸为B*2C*1/2H*1/2W,Y的尺寸为B*C*H*W,其中B、C、H、W分别为批次大小、通道数、特征图长、特征图宽;首先将X通过1*1卷积将通道数从C扩展到C*4,再通过亚像素卷积对X进行2倍上采样,使X尺寸变为与Y同样的B*C*H*W,再通过3*3的可形变卷积层对X提取特征,提取特征后的特征图依然记作X;步骤B03:对步骤B02中提取特征后的特征图X与Y通过1*1卷积拟合线性关系后,展开成两个大小为(H*W)*C的矩阵,分别记作q、k;其中q矩阵与k矩阵的长为H*W,宽为C,并同时为q矩阵额外保留独立的副本,记作v;将q与k进行矩阵相乘,得到长为H*W,宽...
【专利技术属性】
技术研发人员:张雪涛,郑博涵,聂明显,张奇,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。