一种基于改进YOLOv3的人员在岗状态检测方法技术

技术编号:24498918 阅读:66 留言:0更新日期:2020-06-13 04:12
本发明专利技术公开了一种基于改进YOLOv3的人员在岗状态检测方法,ILF‑YOLOv3(Improve Loss and Feature‑YOLOv3)。首先,使用二分交叉熵损失函数和添加制衡权重参数的方式分别对YOLOv3算法的目标定位和置信度损失函数进行了改进,有效缓解了梯度的不稳定性,加快了模型的收敛速度,均衡了难、易分类样本权重的比重;此外,在YOLOv3网络的多尺度特征检测模块添加了一个卷积模块,增加了多尺度特征间的特征融合密度,增强了多尺度特征信息的完整性;最后,针对采样数据集单一性的问题,采用对抗网络对其进行定向增强来模拟现实中可能会出现的各种环境状况。实验结果表明,改进后的算法在测试集上的mAP(mean Average Precision)值提高了7.9%,召回率提高了14%。

An on-the-job state detection method based on improved yolov3

【技术实现步骤摘要】
一种基于改进YOLOv3的人员在岗状态检测方法
本专利技术涉及图像处理
,具体涉及一种基于改进YOLOv3的人员在岗状态检测方法。
技术介绍
服务型行业在岗人员工作状态严重影响着单位的对外形象,存在客户对员工异常工作状态不满意的问题。为了有效解决这一问题成为现有许多服务型单位的首要任务。但是现有的管理和监督手段还停留在人工监督阶段,而且由于人员检测存在背景坏境复杂、光照强度和监控角度变化等问题严重影响着目标检测算法的性能。随着深度学习技术在计算机视觉领域的不断发展和应用,基于深度学习的目标检测算法已成为主流。该类算法主要分为两类:第一类是two-stage模型,首先预选出候选区域,再通过卷积神经网络提取目标特征。此类算法精度较高,发展成熟,但速度较慢,无法满足实时性检测要求。典型的特征提取网络有AlexNet、OverFeat、GoogleNet、VGG和ResNet;2014年在ILSVRC上又提出了R-CNN算法,之后在该算法基础上,又提出了FastR-CNN、DeepID-Net和FasterR-CNN等目标检测算法。第二类算法为one-stage模型,该类方法是基于回归思想的端到端的模型算法,其网络结构简单,实时性更强。2016年,Redmon等人相继了提出了YOLO和YOLOv2网络模型;2018年,在YOLOv2的基础上Redmon等人又提出YOLO-v3算法,该算法是时下在检测的精度和训练的速度上最均衡的目标检测算法。基于YOLOv3的优越性能,已经有很多的实践应用和相应的模型改进。如戴伟聪等人将YOLOv3网络应用于遥感图像飞机目标的识别,并提出了49层的网络模型,将3尺度特征检测增加至4尺度检测;鞠默然等人改进了网络加强了网络对小目标的检测;施辉等人将YOLO应用到安全帽佩戴的检测上都取得了非常优越的效果。但是目前针对在岗人员状态检测,还存在的人力资源浪费、检测环境复杂和检测结果不客观等问题。
技术实现思路
本专利技术的目的在于避免现有技术的不足之处而提供一种基于改进YOLOv3的人员在岗状态检测方法。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种基于改进YOLOv3的人员在岗状态检测方法,包括:基于YOLOv3网络模型构建改进YOLOv3网络模型,改进过程为:替换YOLOv3网络模型的损失函数;对YOLOv3网络模型的多尺度检测模块进行改进;提取在岗状态监测视频,利用图像工具生成在岗状态特征图像,标注出全部在岗状态特征图像中的目标特征区域,并将标注后的在岗状态特征图像按比例分为训练集、测试集和验证集;将作为训练集的在岗状态特征图像输入改进YOLOv3网络模型进行训练,训练完成后将测试集和验证集作为输入,对训练结果进行验证;训练完成后,利用实时在岗状态监控视频生成实时在岗状态特征图像,输入训练完成的改进YOLOv3网络模型,输出标注目标特征区域的实时在岗状态特征图像,通过查看输出的实时在岗状态特征图像中是否存在异常目标,判断在岗状态是否异常。其中,在替换YOLOv3网络模型的损失函数的步骤中,包括对目标类别损失函数和目标定位损失函数的更换。其中,对YOLOv3网络模型的多尺度检测模块进行改进的步骤中,通过添加YOLOv3网络模型中间层的卷积模块来到达更多层级间的特征融合,保证输出的特征包含更完整的特征信息。其中,卷积模块包含3项卷积操作:首先,第一个1×1×N的卷积核会将特征图像的通道数卷积成目标特征图像的通道数,从而方便之后拼接操作,其中N表示目标特征图像的通道数;然后通过改变Stride参数,利用3×3的卷积核来倍化特征图像,将特征图像的大小卷积成目标特征图像的大小;最后,对拼接后获得的新特征图像进行3×3卷积,该卷积是在与目标特征拼接之后执行,将减少拼接特征图像融合后出现的混叠效应,同时也减少了不必要的特征偏移。其中,将标注后的在岗状态特征图像按比例分为训练集、测试集和验证集的步骤中,将标注后的在岗状态特征图像根据6:4的比例生成训练集和交叉验证集,在交叉验证集中测试集和验证集又根据3:2的比例划分。其中,利用图像工具生成在岗状态特征图像,标注出全部在岗状态特征图像中的目标特征区域之后,还包括:利用对抗网络来处理在岗状态特征图像的样本集,模拟现实复杂环境中会出现的噪点信息,增强在岗状态特征图像数据集的多样性。其中,利用对抗网络来处理在岗状态特征图像的样本集的步骤中,通过对抗网络中的生成网络用随机的噪声点处理标注后的在岗状态特征图像,生成新的在岗状态特征图像;通过对抗网络中的判别网络用来判别生成的在岗状态特征图像的真实性。其中,在训练之前,采用K-means聚类算法来获取改进YOLOv3网络模型中合理的anchor框进行训练,包括步骤:拟定适当的聚类个数,然后按参数间距离的方式来实现聚类的划分;计算参数间距离的方式包括欧式聚类或曼哈顿距离;采用Elbowmethod方法获取k值;将误差平方和不会随k值变化而发生大幅度变化的k值作为合适的k值。和现有技术相比,本专利技术的基于改进YOLOv3的人员在岗状态检测方法使用二分交叉熵损失函数和添加制衡参数的方式分别对YOLOv3算法的目标定位损失函数和目标置信度损失函数作了替换和改进,有效缓解了梯度的不稳定性而且加快了模型的收敛速度,均衡了易分类与难分类样本权重;在YOLOv3的多尺度特征检测模块,添加一个卷积模块来增加不同尺度特征间的特征融合;针对数据集采样单一性的问题,采用对抗网络对采样的数据集进行增强来模拟现实中可能会出现的各种环境状况。通过本专利技术,不仅有效缓解随深度加深而出现的梯度不稳定情况,而且算法的检测精度也得到了显著提升,实现了智能化的人员在岗状态的实时检测。附图说明图1为本专利技术提供的一种基于改进YOLOv3的人员在岗状态检测方法的流程示意图;图2为本专利技术提供的一种基于改进YOLOv3的人员在岗状态检测方法中改进后的多尺度检测模块的结构示意图;图3为本专利技术提供的一种基于改进YOLOv3的人员在岗状态检测方法中改进后的多尺度检测模块增加的卷积模块的结构示意图;图4为本专利技术提供的一种基于改进YOLOv3的人员在岗状态检测方法中人员在岗状态监测的流程示意图。具体实施方式下面结合具体实施方式对本专利技术的技术方案作进一步更详细的描述。显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都应属于本专利技术保护的范围。参阅图1,本专利技术提供了一种基于改进YOLOv3的人员在岗状态检测方法,包括:S110:基于YOLOv3网络模型构建改进YOLOv3网络模型,改进过程为:替换YOLOv3网络模型的损失函数;对YOLOv3网络模型的多尺度检测模块进行改进。YOLOv3网络在YOLOv2网络的基础上作了不小的改进,不但速度没有本文档来自技高网
...

【技术保护点】
1.一种基于改进YOLOv3的人员在岗状态检测方法,其特征在于,包括:/n基于YOLOv3网络模型构建改进YOLOv3网络模型,改进过程为:替换YOLOv3网络模型的损失函数;对YOLOv3网络模型的多尺度检测模块进行改进;/n提取在岗状态监测视频,利用图像工具生成在岗状态特征图像,标注出全部在岗状态特征图像中的目标特征区域,并将标注后的在岗状态特征图像按比例分为训练集、测试集和验证集;/n将作为训练集的在岗状态特征图像输入改进YOLOv3网络模型进行训练,训练完成后将测试集和验证集作为输入,对训练结果进行验证;/n训练完成后,利用实时在岗状态监控视频生成实时在岗状态特征图像,输入训练完成的改进YOLOv3网络模型,输出标注目标特征区域的实时在岗状态特征图像,通过查看输出的实时在岗状态特征图像中是否存在异常目标,判断在岗状态是否异常。/n

【技术特征摘要】
1.一种基于改进YOLOv3的人员在岗状态检测方法,其特征在于,包括:
基于YOLOv3网络模型构建改进YOLOv3网络模型,改进过程为:替换YOLOv3网络模型的损失函数;对YOLOv3网络模型的多尺度检测模块进行改进;
提取在岗状态监测视频,利用图像工具生成在岗状态特征图像,标注出全部在岗状态特征图像中的目标特征区域,并将标注后的在岗状态特征图像按比例分为训练集、测试集和验证集;
将作为训练集的在岗状态特征图像输入改进YOLOv3网络模型进行训练,训练完成后将测试集和验证集作为输入,对训练结果进行验证;
训练完成后,利用实时在岗状态监控视频生成实时在岗状态特征图像,输入训练完成的改进YOLOv3网络模型,输出标注目标特征区域的实时在岗状态特征图像,通过查看输出的实时在岗状态特征图像中是否存在异常目标,判断在岗状态是否异常。


2.根据权利要求1所述的基于改进YOLOv3的人员在岗状态检测方法,其特征在于,在替换YOLOv3网络模型的损失函数的步骤中,包括对目标置信度损失函数和损失函数的更换。


3.根据权利要求1所述的基于改进YOLOv3的人员在岗状态检测方法,其特征在于,对YOLOv3网络模型的多尺度检测模块进行改进的步骤中,通过添加YOLOv3网络模型中间层的卷积模块来到达更多层级间的特征融合,保证输出的特征包含更完整的特征信息。


4.根据权利要求3所述的基于改进YOLOv3的人员在岗状态检测方法,其特征在于,卷积模块包含3项卷积操作:首先,第一个1Í1ÍN的卷积核会将特征图像的通道数卷积成目标特征图像的通道数,从而方便之后拼接操作,其中N表示目标特征图像的通道数;然后通过改变Stride参数,利用3Í3的卷积核来倍化特征图像,将特...

【专利技术属性】
技术研发人员:谢斌红栗宁君张英俊潘理虎
申请(专利权)人:太原科技大学
类型:发明
国别省市:山西;14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1