一种基于YOLO网络压缩算法的安全帽识别智能监控系统技术方案

技术编号:30227142 阅读:14 留言:0更新日期:2021-09-29 09:53
本发明专利技术公开了一种基于YOLO网络压缩算法的安全帽识别智能监控系统,属于计算机视觉和数字图像处理技术领域,本发明专利技术提供的监控系统包括获取训练数据的数据处理模块、设置及网络结构及训练网络参数的特征提取与预测模块、对所设置的网络模型的全连接层进行压缩处理的网络压缩模块和结果检测模块,本发明专利技术采用YOLO网络,降低背景误检率低,同时可以直接优化性能检测,提高准确率;以及直接对锚框进行回归和分类,加快了运行速度,实现了实时处理视频,以及可以学到物体更泛化的特征表示,更能适应新的领域,泛化能力高,可高度可推广。本发明专利技术能用于对施工区域工作人员是否佩戴安全帽的智能监控。能监控。能监控。

【技术实现步骤摘要】
一种基于YOLO网络压缩算法的安全帽识别智能监控系统


[0001]本专利技术属于计算机视觉和数字图像处理
,具体涉及一种基于目标检测网络YOLO(You Only Look Once)进行网络压缩实现对施工区域工作人员是否佩戴安全帽的监控系统。

技术介绍

[0002]目标检测是计算机视觉和数字图像处理经久不衰的一个研究方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域。由于计算机收到这些RGB像素矩阵,不会直接得到目标(如行人、车辆等)的抽象概念,更不能定位其位置,再加上目标形态千差万别,目标和背景重合等问题,使得目标检测难上加难。此外,由于视频中的目标具有不同姿态且经常出现遮挡、其运动具有不规则性,同时考虑到监控视频的景深、分辨率、天气、光照等条件和场景的多样性,而且目标检测算法的结果将直接影响后续的跟踪、动作识别和行为描述的效果。因此,通过计算机视觉提高物体检测的准确性和减少对人力资本的消耗,具有重要的现实意义,目标检测也就成为了近年来理论和应用的研究热点,它是视频智能监控系统的核心部分,对后续的各种识别任务起着至关重要的作用。
[0003]自从深度神经网络算法首次在ImageNet数据集上大放异彩后,目标检测算法得到了较为快速的发展,通过利用多层计算模型来学习抽象的数据表示,能够发现大数据中的复杂结构。其中目标检测网络YOLO中的YOLOv1是一种基于深度神经网络的对象识别和定位算法,它采用一个CNN网络来实现检测,是一种单管道策略,其训练与预测都是端到端(end
‑<br/>to

end),所以YOLOv1算法比较简洁且速度快。此外,由于Yolo是对整张图片做卷积,所以其在检测目标有更大的视野,它不容易对背景误判且泛化能力强,在做迁移时,模型鲁棒性高。但当大规模数据训练获得的深度网络模型大且计算量也大,这就需要优良的硬件的计算资源和内存条件,然而在实际的实时系统应用中这往往很难实现。

技术实现思路

[0004]本专利技术的专利技术目的在于:针对上述存在的问题,提供一种基于YOLO网络压缩算法的安全帽识别智能监控系统,实现对施工人员安全帽是否佩戴的动态监控,为施工现场的安全提供保障。
[0005]为实现上述专利技术目的,本专利技术提供的基于YOLO网络压缩算法的安全帽识别智能监控系统,包括:
[0006]数据处理模块,用于获取训练数据集,即通过对输入图像进行多种数据预处理,得到训练数据集,数据处理模块可以增加网络的训练样本,从而增加目标,以提升系统的性能;
[0007]特征提取和预测模块:用于设置对图像进行特征提取和目标识别的网络模型,所述网络模型为基于YOLO网络的网络模型;
[0008]网络压缩模块:用于对特征提取和预测模块中的网络模型的全连接层进行压缩处
理,并触发特征提取和预测模块从数据处理模块读取训练数据对压缩处理后的网络模型进行模型参数学习训练,以及保存训练好的网络模型;
[0009]结果检测模块:将待识别图像输入到特征提取和预测模块中训练好的网络模型,基于特征提取和预测模块返回的前向传播输出,得到目标对象的预测锚框的位置和类别;并采用非极大值抑制处理对得到的预测锚框进行去冗余处理,得到当前待识别图像的识别结果并输出显示。
[0010]进一步的,网络模型的特征提取网络为YOLO网络的前20个卷积层结构,特征提取网络之后顺次连接4个卷积层和2个全连接层构成目标识别支路,最后一层全连接层采用了一层Dropout,且最后一层全连接层采用线性激活函数,网络模型中其它层涉及的激活函数均采用Leaky Relu激活函数。
[0011]进一步的,训练时,所述网络模型的损失函数值为回归损失、分类损失和置信度损失之和。
[0012]进一步的,所述特征提取网络采用预训练的方式获取特征提取网络的初始网络参数:在所述特征提取网络之后顺次连接一个平均池化层和全连接层,基于指定的图像识别任务,在公开的图像识别数据集(例如ImageNet)上进行预训练。
[0013]进一步的,所述数据预处理包括随机调整亮度,随机调整对比度、色相、饱和度,随机光照噪声,随机扩展,随机裁剪,随机镜像和随机采集块域。
[0014]综上所述,由于采用了上述技术方案,本专利技术的有益效果包括:
[0015](1)本专利技术中采用YOLO是one

stage的思想,用一整幅图像来训练,可以将物体的整体的类别信息以及外观信息进行编码,降低背景误检率低,同时可以直接优化性能检测,提高准确率。
[0016](2)本专利技术中直接对锚框(bbox)进行回归和分类,加快了运行速度,实现了实时处理视频。
[0017](3)本专利技术可以学到物体更泛化的特征表示,更能适应新的领域,泛化能力高,可高度可推广。
[0018](4)本专利技术采用网络压缩方法,利用矩阵分解将权重矩阵分解为几个低阶矩阵,用低阶矩阵来表示高阶矩阵,大大加快了训练和测试网络模型的速度,缩短了训练和测试的时间。
附图说明
[0019]图1是本专利技术实施例中,所提供的安全帽识别智能监控系统的结构示意图;
[0020]图2是本专利技术实施例中,采用的YOLO网络的结构示意图;
[0021]图3是本专利技术实施例中,网络压缩结构示意图;
[0022]图4是本专利技术实施例中,结果检测过程示意图。
具体实施方式
[0023]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合具体的实施方式和附图,对本专利技术的具体实施过程进行较为详细的说明,以方便技术人员更准确的理解本专利技术后,应用在各个具体的领域当中。
[0024]参见图1,本专利技术实施例公开了一种基于YOLO网络压缩算法的安全帽识别智能监控系统,包括数据处理模块、特征提取与预测模块、网络压缩模块和结果检测模块。各模块具体为:
[0025]数据处理模块:用于获取训练数据集,即通过对输入图像(施工区域采集的视频图像)进行多种数据预处理,得到训练数据集,供后端模块使用。其中,数据预处理包括:随机调整对比度(Contrast)、色相(Hue)、饱和度(Saturation),随机光照噪声,随机扩展,随机裁剪和随机镜像。在安全帽识别智能监控系统中,目标检测任务(以安全帽作为检测对象)通过随机调整亮度,对数据进行处理,后提升系统的性能。
[0026]特征提取和预测模块:用于预置对图像进行特征提取和目标识别的网络模型,进而实现图片的特征提取和预测。本专利技术实施例中,该模块所采用的网络结构参考GooLeNet模型,包含24个卷积层和2个全连接层,其通过图像金字塔结构抽取特征,通过一系列不同尺度的卷积层在不同尺度上做特征提取,来获得更多的特征图,学到物体更泛化的特征表示,更能适应新的领域,泛化能力高,可高度可推广,全连接层用来预测图像位置和类别概率值,并且为了跨通道信息整合使用了卷积核为1
×
1的卷积层代替了GooLeNet的Inception模块来做降维本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于YOLO网络压缩算法的安全帽识别智能监控系统,其特征在于,包括:数据处理模块,用于获取训练数据集;特征提取和预测模块:用于设置对图像进行特征提取和目标识别的网络模型,所述网络模型为基于YOLO网络的网络模型;网络压缩模块:用于对特征提取和预测模块中的网络模型的全连接层进行压缩处理,并触发特征提取和预测模块从数据处理模块读取训练数据对压缩处理后的网络模型进行模型参数学习训练,以及保存训练好的网络模型;结果检测模块:将待识别图像输入到特征提取和预测模块中训练好的网络模型,基于特征提取和预测模块返回的前向传播输出,得到目标对象的预测锚框的位置和类别;并采用非极大值抑制处理对得到的预测锚框进行去冗余处理,得到当前待识别图像的识别结果并输出显示。2.如权利要求1所述的系统,其特征在于,对图像进行特征提取和目标识别的网络模型网络模型的特征提取网络为YOLO网络的前20个卷积层结...

【专利技术属性】
技术研发人员:曾伟汪韦怡黄祥
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1