一种基于CenterNet的实时吸烟检测方法及装置制造方法及图纸

技术编号：37458787 阅读：11 留言：0更新日期：2023-05-06 09:31

本发明专利技术涉及目标检测和图像分类领域，具体提供了一种基于CenterNet的实时吸烟检测方法，首先采集包含吸烟行为的视频图像，制作样本数据集，根据所述数据集训练香烟检测模型；对待检测场景进行检测，分别提取人脸和人手区域，送入后续设计的分类器网络中，综合两区域输出得到吸烟行为识别判断结果。与现有技术相比，本发明专利技术中使用无锚框的目标检测模型CenterNet对吸烟行为进行识别和定位，通过利用其网络结构的设计和更换调整更轻量化的骨干网络，有效减轻了小目标检测效果差，特征难以提取等问题。以提取等问题。以提取等问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于CenterNet的实时吸烟检测方法及装置

[0001]本专利技术涉及目标检测和图像分类领域，具体提供一种基于CenterNet的实时吸烟检测方法及装置。

技术介绍

[0002]众所周知，吸烟有害健康，如果在某些公共场所吸烟,损害的就不仅仅是个人健康，而是公共消防安全。为了保障消防安全，很多公共场所，例如商市场、影剧院等人员密集场所、公共交通工具、加油站等都会有禁止吸烟标志，但仍存在监管不力、监管为不到位的情况。通过计算机视觉目标检测模型在视频监控上的应用，可实现在禁烟场合对吸烟行为的实时监管防控，维护消防安全。
[0003]目标检测是计算机视觉和数字图像处理的一个热门方向，广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域，通过计算机视觉减少对人力资本的消耗，具有重要的现实意义。因此，目标检测就成为了近年来理论和应用领域的热点。得益于深度学习的广泛运用，目标检测算法得到了较为快速的发展，在工业上有广泛的落地和应用，上到卫星遥感，下到自动驾驶。同时目标检测又是计算机视觉最古老和基础性的算法，对其他视觉方向领域，包括人脸识别、实例分割、姿态估计等任务起着至关重要的作用。
[0004]出于以上两点的考虑，基于深度学习的目标检测模型被自然而然地应用到了吸烟行为检测的场景上，但是在实际使用的场景中仍存在一些问题。首先，常见的目标检测模型针对小目标检测效果不理想，而检测精度高的模型在检测速度上有待提高。小目标描述的是目标面积小于32
×
32像素的物体，由于小目标分辨率较低...

【技术保护点】

【技术特征摘要】
1.一种基于CenterNet的实时吸烟检测方法，其特征在于，首先采集包含吸烟行为的视频图像，制作样本数据集，根据所述数据集训练香烟检测模型；对待检测场景进行检测，分别提取人脸和人手区域，送入后续设计的分类器网络中，综合两区域输出得到吸烟行为识别判断结果。2.根据权利要求1所述的一种基于CenterNet的实时吸烟检测方法，其特征在于，采集包括吸烟行为的视频图像中，通过截取下载视频或视频流中的图像帧、拍摄自定义图像、通过爬取包含吸烟行为的图像或检索网上吸烟检测的开源数据集进行采集。3.根据权利要求2所述的一种基于CenterNet的实时吸烟检测方法，其特征在于，所述的香烟检测模型为CenterNet检测模型，将图像预处理并将尺寸固定为512
×
512大小；首先经过一个步长为2的7
×
7卷积和步长为2的残差单元，将图片的宽高压缩为原来的1/4，之后经过第一个沙漏模块，经过下采样和上采样之后，完成一次特征提取和精炼。4.根据权利要求3所述的一种基于CenterNet的实时吸烟检测方法，其特征在于，经过一个连接结构，第二个沙漏模块与所述第一个沙漏模块相连，在下采样和上采样模块中，选择对ResNet增添上采样模块，变成U型的网络结构，沙漏模块前后特征图尺寸不变；随后输出的特征图尺寸为128
×
128
×
256，特征图经过处理后有三个输出：第一个为HeatMap，中心点位置的热力图表示；第二个为Offset，对所述HeatMap的输出进行精炼，提高定位的准确度；第三个为Height&Width，预测以关键点为中心的检测框的宽高。5.根据权利要求4所述的一种基于CenterNet的实时吸烟检测方法，其特征在于，中心点热力图表示为W/R
×
H/R
×
C维的[0,1]之间的分布，其中C为类别的数量,W和H表示输入图片的宽和高，R表示步长；如果预测值接近于1，表示格子内有一个待检目标，如果接近于0表示为背景；在训练阶段，检测中心点的损失函数用类似于focal loss的公式表示，Offset表示预测出的中心点的偏移量，训练时采用的是L1 loss，边框的宽和高，经过左上和右下两个点的中间表示，通过中心点坐标和GT label进行回归，采用的也是L1损失；对不同损失项增添相应的权重系数，相加得到总的损失。6.根据权利要求5所述的一种基于CenterNet的实时吸烟检测方法，其特征在于，在推理阶段，首先通过实时视频流协议按照一定的帧数间隔读取视频，将帧进行简单预处理后输入到CenterNet检测模型中；模型的后处理为对预测的HeatMap、offset和Height&Width进行解码从而得到Bounding Box的过程，...

【专利技术属性】
技术研发人员：王家彬，朱亚伟，
申请(专利权)人：浪潮软件集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人