一种基于改进YOLOv5的化工厂安全帽佩戴检测方法技术

技术编号：37975413 阅读：7 留言：0更新日期：2023-06-30 09:50

本发明专利技术公开了一种基于改进YOLOv5的化工厂安全帽佩戴检测方法，预先获取待检测图像和训练图像，将图像中待检测区域标注出来，得到安全帽检测数据集，通过数据清洗，得到训练集和测试集；构建基于改进YOLOv5的安全帽佩戴检测模型，包括输入端、SwinTransformer模块、Neck模块和输出端；并在YOLOv5模型中加入注意力机制ECA模块及更改损失函数设置为Alpha

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进YOLOv5的化工厂安全帽佩戴检测方法

[0001]本专利技术属于计算机视觉的目标检测
，具体涉及一种基于改进YOLOv5的化工厂安全帽佩戴检测方法。

技术介绍

[0002]高空作业、建筑工地、井下、隧道、涵洞等施工环境的危险性较大，如果发生事故，施工人员的生命安全无法得到保障。
[0003]研究表明，正确合理的使用安全帽是最便宜、最方便，也是最有效保护工人生命安全的个人便携防护用具，曾经救过无数工人的命。为了避免不戴安全帽导致的安全事故发生，在提高化工厂工人安全意识的同时，更要加强对安全帽佩戴的监督与管理。
[0004]随着深度学习技术的发展，很多学者都进行过安全帽佩戴识别的相关研究。由于真实检测任务中施工人员密集，检测目标小；工作环境复杂，受天气、光照等影响大；现场存在遮挡等干扰因素多，这些算法只能实现理想状态下简单识别，对化工厂现场的复杂环境的泛化能力不佳，对小目标的检测性能较差。为弥补安全防护用具检测模型性能的不足，需要根据化工厂现场的复杂特点优化安全防护用具检测算法，泛化其检测能力，提高小目标检测精度；为填补安全防护用具检测系统的空缺，需要搭建一套安全防护用具佩戴实时检测系统，应用到化工厂现场的监督管理中，为工人的生命安全提供保障。因此本专利技术对YOLOv5模型进行改进优化，在保证检测速度的同时提升安全帽佩戴的检测精度。
[0005]随着计算机性能的提升与相关图像处理算法的改进，许多学者提出了一系列基于计算机视觉的安全帽佩戴检测方法，大致可分为以下几类：
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5的化工厂安全帽佩戴检测方法，其特征在于，包括以下步骤：(1)预先获取待检测图像和训练图像，将图像中待检测区域标注出来，得到安全帽检测数据集，通过数据清洗，得到训练集和测试集；(2)构建基于改进YOLOv5的安全帽佩戴检测模型，包括输入端、Swin Transformer模块、Neck模块和输出端；并在YOLOv5模型中加入注意力机制ECA模块及更改损失函数设置为Alpha
‑
IoU；(3)将训练数据集和测试数据集输入到基于改进YOLOv5的安全帽佩戴检测模型中，进行训练，得到优化后的模型；(4)将待检测的图像输入优化后的模型，在detect中进行检测得到安全帽佩戴的检测结果。2.根据权利要求1所述的一种基于改进YOLOv5的化工厂安全帽佩戴检测方法，其特征在于，所述步骤(1)实现过程如下：使用labelGo对图像进行标注，标注后的文件以“.xml”为后缀的标签文件，之后再转成“.txt”后缀的格式，得到数据集。3.根据权利要求1所述的一种基于改进YOLOv5的化工厂安全帽佩戴检测方法，其特征在于，步骤(2)所述输入端对输入的安全放防护用具小目标佩戴图片进行随机缩放，剪裁和排布，然后通过自适应锚框计算，初始设定长宽的锚宽，输出预测框，与真实框ground truth进行对比，在方向更新，迭代网络参数；然后再对原始的安全放防护用具图片自适应的添加最少的黑边，计算缩放比例，计算缩放后的尺寸，计算黑边填充数值，得到增强的图像。4.根据权利要求1所述的一种基于改进YOLOv5的化工厂安全帽佩戴检测方法，其特征在于，所述Swin Transformer模块的结构如下：输入原始的图像之后是一个Patch Partition，再之后是一个Linear Embedding层，图像经过这两个层就是通过一个Patch Merging层，Patch Merging通过nn.Unfold函数实现降采样，经过nn.Unfold之后会得到个特征向量；stage的Feature Map的通道数为3，第一个stage的输入是RGB图像，stage1部分，先通过一个Linear Embedding将输划分后的patch特征维度变成C，然后送入Swin Transformer Block；Swin Transformer模块构建了4个stage，每个stage中都是类似的重复单元；stage2
‑
stage4操作相同，先通过一个Patch Merging，将输入按照2x2的相邻Patches合并，patch块的数量变成特征维度为4C，与stage1一样使用Linear Embedding将4C压缩成2C，然后送入Swin Transformer Block；Swin Transformer模块中核心的部分是4个Stage中的Swin Transformer Bloc...

【专利技术属性】
技术研发人员：王梓轩，姜明新，曹宇，陆易，甘峰瑞，
申请(专利权)人：淮阴工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人