基于改进YOLOv3的自然场景下路面裂缝检测和分类方法技术

技术编号：37409100 阅读：13 留言：0更新日期：2023-04-30 09:34

本发明专利技术公开了一种基于改进YOLOv3的自然场景下路面裂缝检测和分类方法。该方法采用聚类算法对实例进行分析获取新的最佳先验尺寸，并在YOLOv3特征提取网络后加入SPP模块，融合局部和全局特征，更好地捕获低层细粒度特征的信息，提高了小目标检测能力，有效减少裂缝目标过小造成的漏检问题；选取CIoU作为改进的边界框损失函数，在考虑预测框与真实框重叠面积的同时，还考虑到锚框的中心点距离和长宽比，对裂缝的定位准确度有所提升；对于正负样本不均衡问题，以Focal Loss取代交叉熵作为改进的置信度损失函数，进一步提高裂缝检测和分类的性能，达到了最优的检测效果。与原YOLOv3方法对比，本方法的检测精度和速度更高。本方法的检测精度和速度更高。本方法的检测精度和速度更高。

全部详细技术资料下载

【技术实现步骤摘要】
基于改进YOLOv3的自然场景下路面裂缝检测和分类方法

[0001]本专利技术属于目标识别领域，特别涉及一种基于改进YOLOv3的自然场景下路面裂缝检测和分类方法。

技术介绍

[0002]路面裂缝检测一直是视觉研究的一个活跃领域。因气候、年久老化等因素，道路常常会产生裂缝，这不仅会降低路面性能，还会威胁到路面安全，政府每年都需要在道路维修上投入大量资金。因此，高效准确地检测路面裂缝具有重要的现实意义。
[0003]然而，在实际生活中，当道路管理人员需要修复某类裂缝时，要先清楚地了解裂缝的类型才能采取有效的行动。因此，裂缝检测任务在两个方面具有挑战性：首先，需要一种鲁棒的裂缝检测算法来定位不同天气或光照条件下的特定裂缝；其次，该算法能够区分不同类型的重叠的裂缝。
[0004]早期，研究人员通常采用传统的裂缝检测方法，如阈值法、边缘检测法、形态学方法等，其主要问题是容易受到噪声等因素的干扰，不能满足不同条件下的检测需要，鲁棒性较差。近年来，基于机器学习的裂缝检测方法越来越受到重视，包括支持向量机、随机森林等，而随着深度卷积神经网络(Convolutional Neural Network,CNN)的出现，许多基于CNN的目标检测算法开始发展，可根据其设计原理分为两种类型：一是以区域卷积网络(Region Convolutional Neural Network,R
‑
CNN)系列为代表的两阶段目标检测模型，但由于CNN的重复评估，速度缓慢，不适合实时应用；另一种是以YOLO系列和SSD(...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv3的自然场景下路面裂缝检测和分类方法，其特征在于，所述方法包括以下步骤：步骤1，对自然场景下的路面裂缝数据集进行处理，划分训练集和测试集，并对训练集进行数据增强；步骤2，构建改进的YOLOv3网络模型；步骤3，训练改进的YOLOv3网络模型；步骤4，利用训练好的改进的YOLOv3网络模型，对测试集进行路面裂缝检测和分类。2.根据权利要求1所述的基于改进YOLOv3的自然场景下路面裂缝检测和分类方法，其特征在于，步骤1所述对自然场景下的路面裂缝数据集进行处理，划分训练集和测试集，并对训练集进行数据增强，具体包括：步骤1
‑
1，针对路面裂缝数据集的所有样本，将80％的样本作为训练集，其余20％的样本作为测试集；数据集中样本的标注信息包括裂缝区域的坐标以及裂缝类型；步骤1
‑
2，统计训练集中各裂缝类型的样本实例数，按照实例数的比例进行图像增强以实现裂缝类型数量均衡。3.根据权利要求2所述的基于改进YOLOv3的自然场景下路面裂缝检测和分类方法，其特征在于，步骤1
‑
2中所述图像增强的方法采用对比度调整和或亮度调整和或高斯模糊。4.根据权利要求3所述的基于改进YOLOv3的自然场景下路面裂缝检测和分类方法，其特征在于，步骤2所述构建改进的YOLOv3网络模型，具体包括：步骤2
‑
1，对训练集进行k
‑
means聚类，获取锚框的几何先验知识，以候选框与真实框的交并比IoU作为评价标准，对IoU大于预设阈值的候选框进行降序排列，之后从中选取前9个先验框；步骤2
‑
2，采用Darknet
‑
53网络的前52层作为改进的YOLOv3网络中的特征提取网络；步骤2
‑
3，在特征提取网络之后引入空间金字塔池化模块即SPP模块，该模块包括四个并行分支，分别为卷积核为5
×
5,9
×
9,13
×
13的最大池化层和一个跳跃连接，该跳跃连接为SPP模块的输入直接与3个池化层的输出连接。5.根据权利要求4所述的基于改进YOLOv3的自然场景下路面裂缝检测和分类方法，其特征在于，步骤3所述训练改进的YOLOv3网络模型，具体包括：步骤3
‑
1，初始化改进的YOLOv3网络参数及迭代次数；步骤3
‑
2，确定损失函数；步骤3
‑
3，将训练集中的图像压缩至改进的YOLOv3网络所要求的输入图像尺寸，之后输入至改进的YOLOv3网络模型的特征提取网络；步骤3
‑
4，采用上采样和融合方式，将步骤3
‑
3输入的图像按所述特征提取网络输出的特征图尺度大小划分为S
×
S个网格；步骤3
‑
5，对每个网格使用3个先验框进行裂缝边界预测，具体为：对每个网格中的边界框进行预测：b
x
＝σ(t
x
)+c
x
，b
y
＝σ(t
y
)+c
y
式中，(b
x
,b
y
)表示预测边界框的中心坐标；b
w
、b
...

【专利技术属性】
技术研发人员：朱纤纤，王琴，丁军娣，
申请(专利权)人：南京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人