当前位置: 首页 > 专利查询>燕山大学专利>正文

基于深度学习的佩戴口罩检测方法技术

技术编号:27060927 阅读:20 留言:0更新日期:2021-01-15 14:41
本发明专利技术公开了一种基于深度学习的佩戴口罩检测方法,其包括:进行佩戴口罩检测模型的训练以及与语音提示模块的连接。佩戴口罩检测模型的训练过程包括:优化yolov3网络检测模型,将yolov3网络模型中的基础网络BN层和卷积层进行合并,并将yolo检测层由三层变为两层,通过k‑means等方法进行参数优化,训练得到鲁棒性较高,检测速度较快的佩戴口罩检测模型,实现对于人们是否佩戴口罩的精确检测。同时,将佩戴口罩检测结果与语音模块相连接,当佩戴口罩检测结果不同时,语音模块发出对应的提示语音,实现语音提醒的实际功能。该方法能够实现对于是否佩戴口罩的快速,精准识别以及准确的语音提示功能,在日常生活工作方面有广泛的应用前景,具有较强的实用性。

【技术实现步骤摘要】
基于深度学习的佩戴口罩检测方法
本专利技术属于机器学习领域,特别是涉及一种基于深度学习的佩戴口罩检测方法。
技术介绍
目前急需一种能够在公共区域内自动检测进出人员是否佩戴口罩的检测提醒的应用系统。目前传统的检测方法利用阈值分割和帧差法检测目标区域,再使用目标区域的色彩分布来进行判断,基于人工设计的传统图像处理算法应用场景单一、不稳定、当场景变化时,准确率严重变化。而现有的深度学习检测方法检测速度相对较慢,而且在获取速度时又损失了相应检测的精度且占用内存较大。目前在口罩佩戴检测方面需要一种检测速度快,鲁棒性好的检测系统,为此我们提出了基于深度学习的佩戴口罩检测方法。
技术实现思路
针对现有的目标检测跟踪系统存在应用场景单一、检测识别速度慢、鲁棒性差、占用内存大等缺点,本专利技术提出了一种基于深度学习的目标检测方法,其包括以下步骤:S1、采集公共场合下人们佩戴口罩和未佩戴口罩的图像,按清晰度进行筛选;S11、选择不同地点及环境,使用高清摄相机采集5000张佩戴口罩照片与未佩戴口罩照片作为样本,保证训练数据集的多样性;S12、对样本数据集进行扩充和旋转处理,使训练出的模型具有高鲁棒性;S2、对所述图像进行预处理,构建佩戴口罩检测数据集,使用标注工具对数据集图像生成对应的标注、标签信息和位置信息,将数据集按4:1比例随机分为训练数据集和测试集;S21、使用标注工具对图像进行标注时,对图像中的人脸部分进行标注,当人脸部分有口罩时,标注mask,当人脸部分没有口罩时,标注为nomask;S3、将所述训练集放入深度神经网络进行模型训练,提取戴口罩与未佩戴口罩的相关特征,通过聚类算法k-means产生预测框;S4、删减yolov3网络最大尺度的yolo检测层,将卷积层和BN层合并,对所述训练集输入改进后的yolov3网络进行重复训练,获得优选的权重值与偏置值;S41、将检测层的数量更改至与检测类别的数量相一致,以提高检测精度;S42、对改进后的网络进行重复训练,获得适用本数据集的最优参数、权重值和偏置;S5、将目标检测模块与语音模块相连接,根据不同的检测情况发出不同提示声音。优选地,在训练深度学习网络过程中,对实际现场中出现的人员进行标注,通过更改原有的yolov3网络模型对应的参数与网络层数,能保证精度并加快目标检测速度,通过改变网络层数和参数,能减少检测时间,加强目标检测的实时性。优选地,将卷积层x1=ω*x+b与BN层的函数公式合并为公式x2=ω1*x+b1,其中,ω为卷积权重、b为卷积偏置、u为BN层中均值、σ为方差、γ为缩放因子、β为偏移、ε≠0,x1为卷积层计算结果,x2为经过卷积计算和BN层后的结果,x为进入卷积计算的计算参数,ω1为合并后新的卷积权重,b1为合并后新的卷积偏置。优选地,对yolov3网络进行重复性训练时,将网络的的输入尺寸调整为416×416大小,设置交并比IOU阈值为0.5、置信度阈值为0.5、冲量momentum为0.9,以提高模型的检测精度。优选地,将目标检测模块与语音模块相连接,当检测到人佩戴好口罩时,则提示请进,当检测到人未佩戴好口罩时,则提示请佩戴好口罩。本专利技术与现有技术相比具有如下优点:1)通过分析更改yolov3网络,加快检测速度,提高检测精度;2)提出了基于深度学习的目标检测模块,结合语音播报模块实现对进入公共活动区域人员的佩戴口罩提醒;3)具有检测速度快,检测目标精准,适宜多场景检测,鲁棒性较好等优点,能够满足目标检测系统的要求。附图说明图1为本专利技术的模型优化流程图;图2a为本专利技术的原始网络结构程图、图2b为残差组件改进图;图3为本专利技术的改进网络结构图;图4为本专利技术的整体流程图;以及图5为本专利技术的检测效果图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要注意的为,除非另有说明,本申请使用的技术术语或者科学术语应当为本专利技术所属领域技术人员所理解的通常意义。一种基于深度学习的佩戴口罩检测方法,其包括如下步骤:深度模型的优化过程如图1,具体训练过程描述如下:S1、首先在公路上、景区、超市、公园等各种生活区域拍摄4000-5000张人们佩戴口罩照片以及同等数量的未佩戴口罩照片,并将拍摄到的图片中模糊不清的照片清除出去;S2、对S1中采集的图像进行预处理,并构建佩戴口罩检测的数据集:数据集图像使用Lablemming标注工具生成对应的标注、标签信息和位置信息,划定脸部区域,标签信息即样本中目标所属类别分为mask和nomask两类,标注信息即样本中目标的位置信息。将数据集使用python文件按照比例4:1随机分为训练数据集和测试集,同时对数据进行扩充操作:图像进行水平翻转、随机裁剪、更改图像对比度。S3、将S2中处理制作后的数据集放入未改进的yolov3网络进行训练,由于yolov4在做boundingbox预测的时候,用到了anchorboxes,anchors为最有可能的object的width与height,可事先通过聚类得到,比如某一个像素单元,通过这个像素单元预测出一个object,围绕这个像素单元,可以预测出无数种object的形状,并不是随便预测的,要参考anchorbox的大小,即从已标注的数据中通过聚类统计到的最有可能的object的形状,所以为了使模型参数优化本专利技术使用K-means算法获得最优参数,为深度模型的准确性提供了保证,具体参数如图1所示。详细来说,先将网络的的输入尺寸调整为416×416,并设置交并比IOU阈值为0.5,IOU为目标检测中使用的一个概念,是产生的候选框candidatebound与原标记框groundtruthbound的交叠率,即它们的交集与并集的比值,最理想情况是完全重叠,即比值为1,,进行训练,获取最优参数值。所有训练图片的一个批次batch,批次大小bat设置置信度阈值为0.5、冲量momentum设置为0.9ch_size的划分根据我们在.cfg文件中设置的subdivisions参数。在我使用的.cfg文件中batch=64,subdivision=8,所以在训练输出中,训练迭代包含了8组,每组又包含了8张图片,跟设定的batch和subdivision的值一致。也就是说每轮迭代会从所有训练集里随机抽取batch=64个样本参与训练,所有这些batch个样本又被均分为subdivision=8次送入网络参与训练,以减轻内存占用的压力。Class参数为训练检测的目标数,由于本目标检测的目的为是否佩戴口罩,将class参数设置为2,两种即戴口罩mask和未佩戴口罩nomask。修改好后,修改编译文件makefil本文档来自技高网...

【技术保护点】
1.一种基于深度学习的佩戴口罩检测方法,其特征在于,其包括以下步骤:/nS1、采集公共场合下人们佩戴口罩和未佩戴口罩的图像,按清晰度进行筛选;/nS11、选择不同地点及环境,使用高清摄相机采集5000张佩戴口罩照片与未佩戴口罩照片作为样本,保证训练数据集的多样性;/nS12、对样本数据集进行扩充和旋转处理,使训练出的模型具有高鲁棒性;/nS2、对所述图像进行预处理,构建佩戴口罩检测数据集,使用标注工具对数据集图像生成对应的标注、标签信息和位置信息,将数据集按4:1比例随机分为训练数据集和测试集;/nS21、使用标注工具对图像进行标注时,对图像中的人脸部分进行标注,当人脸部分有口罩时,标注mask,当人脸部分没有口罩时,标注为nomask;/nS3、将所述训练集放入深度神经网络进行模型训练,提取戴口罩与未佩戴口罩的相关特征,通过聚类算法k-means产生预测框;/nS4、删减yolov3网络最大尺度的yolo检测层,将卷积层和BN层合并,对所述训练集输入改进后的yolov3网络进行重复训练,获得优选的权重值与偏置值;/nS41、将检测层的数量更改至与检测类别的数量相一致,以提高检测精度;/nS42、对改进后的网络进行重复训练,获得适用本数据集的最优参数、权重值和偏置;/nS5、将目标检测模块与语音模块相连接,根据不同的检测情况发出不同提示声音。/n...

【技术特征摘要】
1.一种基于深度学习的佩戴口罩检测方法,其特征在于,其包括以下步骤:
S1、采集公共场合下人们佩戴口罩和未佩戴口罩的图像,按清晰度进行筛选;
S11、选择不同地点及环境,使用高清摄相机采集5000张佩戴口罩照片与未佩戴口罩照片作为样本,保证训练数据集的多样性;
S12、对样本数据集进行扩充和旋转处理,使训练出的模型具有高鲁棒性;
S2、对所述图像进行预处理,构建佩戴口罩检测数据集,使用标注工具对数据集图像生成对应的标注、标签信息和位置信息,将数据集按4:1比例随机分为训练数据集和测试集;
S21、使用标注工具对图像进行标注时,对图像中的人脸部分进行标注,当人脸部分有口罩时,标注mask,当人脸部分没有口罩时,标注为nomask;
S3、将所述训练集放入深度神经网络进行模型训练,提取戴口罩与未佩戴口罩的相关特征,通过聚类算法k-means产生预测框;
S4、删减yolov3网络最大尺度的yolo检测层,将卷积层和BN层合并,对所述训练集输入改进后的yolov3网络进行重复训练,获得优选的权重值与偏置值;
S41、将检测层的数量更改至与检测类别的数量相一致,以提高检测精度;
S42、对改进后的网络进行重复训练,获得适用本数据集的最优参数、权重值和偏置;
S5、将目标检测模块与语音模块相连接,根据不同的检测情况发出不...

【专利技术属性】
技术研发人员:张立国张勇金梅孙胜春郎梦园张子豪张少阔刘博李福昆
申请(专利权)人:燕山大学
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1