当前位置: 首页 > 专利查询>淮阴工学院专利>正文

基于K-means聚类改进YOLOv5算法的安全帽佩戴检测方法技术

技术编号:36957981 阅读:17 留言:0更新日期:2023-03-22 19:18
本发明专利技术公开了一种基于改进YOLOv5算法的安全帽佩戴检测方法,该方法融合了K

【技术实现步骤摘要】
基于K

means聚类改进YOLOv5算法的安全帽佩戴检测方法


[0001]本专利技术属于计算机视觉目标检测领域,尤其涉及一种基于K

means聚类改进 YOLOv5算法的安全帽佩戴检测方法。

技术介绍

[0002][0003]化工、冶金、矿山、电力以及建筑等行业是国家工业发展的基础,同时也是国民经济与民生经济的重要支撑。目前,这些高危产业依然需要大量劳动力在生产现场或施工现场作业。这些作业现场环境复杂、危险因素众多,规范佩戴安全帽可以对作业人员头部进行有效保护,有效降低高空坠物或者施工现场坍塌对头部造成的危害。安全帽作为一种重要防护设备,对安全生产极其重要。因此,对生产现场或者施工现场作业人员的安全帽佩戴的监管也越来越被重视。
[0004]早期安全帽的检测往往依赖于人工,监管人员对现场巡查或者监控盯审,耗时耗力且效力较低。随着人工智能的发展与成熟,深度学习也被广泛应用于计算机视觉领域。与卷积神经网络的融合,为目标检测技术开启了新的天地。目前主流的目标检测算法有两类:一类是以R

CNN为典型的两阶段的算法,一类是以 YOLO、SSD为代表单阶段算法。单阶段目标检测算法的优点是速度较快,其中 YOLO算法有出色的表现。目前YOLOv5能同时兼顾速度与精度,检测效果极好。本文将K

means聚类算法与YOLOv5算法结合,进一步的提升目标检测的精度。
[0005]将人工智能与传统产业深度融合,助力传统产业转型升级,有助于推动主导产业高端化、智能化的升级。本文将计算机视觉领域的YOLO算法与传统产业的安全帽检测相结合,具有重要的实际意义。

技术实现思路

[0006]专利技术目的:针对
技术介绍
中指出的问题,本专利技术提供一种基于改进YOLOv5 算法的安全帽佩戴检测方法,降低安全帽检测的人力成本、提高安全帽检测的效率,借助人工智能科技减少传统行业的施工安全隐患。
[0007]技术方案:本专利技术公开一种基于改进YOLOv5算法的安全帽佩戴检测方法,包括如下步骤:
[0008]步骤1:收集大量安全帽的图片作为原始样本数据集,使用LabelImg标注工具对目标图片进行标注,随机选取80%的数据集图片作为训练集,其余作为测试集;
[0009]步骤2:搭建YOLOv5网络,所述YOLOv5网络利用Mosaic对输入端进行数据增强,使用CSPDarknet53作为主干网络,利用K

means聚类算法进行优化,使用训练集样本训练该安全帽检测网络模型;
[0010]步骤3:保存步骤2中训练好的模型参数文件,并更新安全帽检测网络模型;
[0011]步骤4:将测试集样本输入步骤3中得到的安全帽检测网络模型进行检测。
[0012]进一步地,所述步骤1中具体包括如下步骤:
[0013]步骤1.1:基于SHWD数据集,利用网络爬虫工具获取有关于施工现场安全帽相关的图像,以及对建筑工地、化工厂监控录像中截取的有效样本的视频帧,制作出丰富多样而具有代表性的图片数据集;
[0014]步骤1.2:使用LabelImg的目标检测标注工具对数据集图片进行标注,标注的类包括安全帽和人两类;其中,安全帽标注区域包括脖子以上的头部及安全帽;标注完成后,形成xml格式的标签文件,与图像一起构成voc 格式的数据集;
[0015]步骤1.3:将标签文件由voc格式(xml文件)转为YOLO数据集标签文件格式,并以8:2的比例将数据集随机划分训练集和测试集。
[0016]进一步地,所述步骤2中YOLOv5网络包括Input输入端、Backbone主干网络、Neck网络和Head输出端,利用Mosaic对Input输入端进行数据增强, Mosaic数据增强采用了4张图片,随机缩放、随机裁剪、随机排布的方式进行拼接,使用CSPDarknet53作为Backbone主干网络,在Backbone主干网络中采用Mish激活函数,网络后面依然采用Leaky_relu激活函数;利用 K

means聚类算法对训练集样本的groundtruth参数进行迭代,得到最优的尺寸参数,将之设定为anchor box预测框的尺寸。
[0017]进一步地,所述CSPDarknet53包括5个CSP模块,通过dense block发送副本到下一个阶段,从而将基础层的特征映射图分离出来;每个CSP模块前面的卷积核大小是3*3,stride=2。
[0018]进一步地,利用K

means聚类算法对训练集样本的groundtruth参数进行迭代,得到最优的尺寸参数具体为:
[0019]利用K

means算法对预选框进行聚类时,计算IoU交并比距离,使用K

means 算法聚类训练集中所有目标框的宽、高,得到9个宽、高组合,也即得到9个anchor 预测框的数值,采用向上取整,作为最终anchor的参数。
[0020]进一步地,在目标检测的后处理过程中采用加权CIoU

NMS的方式进行多目标的筛选,具体包括:
[0021]1)计算anchor和groundtruth之间权重函数α、相似性u以及IoU:
[0022]IoU值的计算公式如下:
[0023][0024]其中:b为anchor box,b
gt
为groundtruth;
[0025]权重函数α的计算公式如下:
[0026][0027]长宽比一致性参数相似性v的计算公式如下:
[0028][0029]2)计算惩罚项
[0030]3)再根据CIoU值的对数损失构建损失函数,损失函数的计算公式如下:
[0031][0032]4)设置CIoU阈值为0.65,判断是否大于CIoU阈值,如果大于CIoU阈值则继续判断两个边框的标签是否相同;
[0033]5)当2个条件满足且同时成立,然后加权计算边框值,按照正确边框的置信度重新加权连成一个张量,其中置信度的阈值为0.001,最终得到最后的边框,最后去除无效的边框。
[0034]进一步地,所述步骤3中具体包括如下步骤:
[0035](3

1)依据步骤2中优化方案修改配置文件YOLOv5s.yml,并将tran.py文件中训练迭代次数epochs修改为200,将自制数据集输入到改进后的YOLOv5网络模型中,开始训练;
[0036](3

2)将上述网络训练结果中的最优权重参数文件best.pt保存,将best.pt设置为改进后的YOLOv5网络模型的权重文件。
[0037]有益效果:
[0038](1)相较于现有技术,本专利技术YOLOv5算法中采用CSPDarknet53作为基础网络,可以有效提升模型的特征提取力。
[0039](2)本专利技术利用Mosaic本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5算法的安全帽佩戴检测方法,其特征在于,包括如下步骤:步骤1:收集大量安全帽的图片作为原始样本数据集,使用LabelImg标注工具对目标图片进行标注,随机选取80%的数据集图片作为训练集,其余作为测试集;步骤2:搭建YOLOv5网络,所述YOLOv5网络利用Mosaic对输入端进行数据增强,使用CSPDarknet53作为主干网络,利用K

means聚类算法进行优化,使用训练集样本训练该安全帽检测网络模型;步骤3:保存步骤2中训练好的模型参数文件,并更新安全帽检测网络模型;步骤4:将测试集样本输入步骤3中得到的安全帽检测网络模型进行检测。2.根据权利要求1所述的基于改进YOLOv5算法的安全帽佩戴检测方法,其特征在于,所述步骤1中具体包括如下步骤:步骤1.1:基于SHWD数据集,利用网络爬虫工具获取有关于施工现场安全帽相关的图像,以及对建筑工地、化工厂监控录像中截取的有效样本的视频帧,制作出丰富多样而具有代表性的图片数据集;步骤1.2:使用LabelImg的目标检测标注工具对数据集图片进行标注,标注的类包括安全帽和人两类;其中,安全帽标注区域包括脖子以上的头部及安全帽;标注完成后,形成xml格式的标签文件,与图像一起构成voc格式的数据集;步骤1.3:将标签文件由voc格式(xml文件)转为YOLO数据集标签文件格式,并以8:2的比例将数据集随机划分训练集和测试集。3.根据权利要求1所述的基于改进YOLOv5算法的安全帽佩戴检测方法,其特征在于,所述步骤2中YOLOv5网络包括Input输入端、Backbone主干网络、Neck网络和Head输出端,利用Mosaic对Input输入端进行数据增强,Mosaic数据增强采用了4张图片,随机缩放、随机裁剪、随机排布的方式进行拼接,使用CSPDarknet53作为Backbone主干网络,在Backbone主干网络中采用Mish激活函数,网络后面依然采用Leaky_relu激活函数;利用K

means聚类算法对训练集样本的groundtruth参数进行迭代,得到最优的尺寸参数,将之设定为anchor box预测框的尺寸。4.根据权利要求3所述的基于改进YOLOv5算法的安全帽佩戴检测方法,其特征在于,所述CSPDarkn...

【专利技术属性】
技术研发人员:陈冬梅赵环宇蔡萍萍冯翔翊张楚刘伟郭浩宇华尚
申请(专利权)人:淮阴工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1