一种口罩佩戴方式检测方法技术

技术编号:37638585 阅读:12 留言:0更新日期:2023-05-25 10:05
本发明专利技术公开了一种口罩佩戴方式检测方法,首先对输入图像使用YOLO系列基础网络进行特征提取与融合,生成三层特征图;再利用五种不同的卷积层和池化层操作后进行拼接,产生三层增强特征图;随后分别使用注意力机制模块、卷积操作与Softmax操作共同处理,得到三层降噪特征图,并计算注意力损失;最后利用YOLO系列预测模块对三层降噪特征图和注意力损失做分类和坐标回归,采用非极大值抑制处理后输出标记口罩位置和佩戴方式。本发明专利技术使得图像中目标的特征信息更加明确,背景信息存在的无用噪声被有效抑制,对于检测精度提升效果明显,该方法具有良好的应用前景和经济效益。法具有良好的应用前景和经济效益。法具有良好的应用前景和经济效益。

【技术实现步骤摘要】
一种口罩佩戴方式检测方法


[0001]本专利技术属于自然图像目标检测领域,涉及一种口罩佩戴方式检测方法,特别是一种基于改进型单阶段目标检测网络的口罩佩戴方式检测方法。

技术介绍

[0002]现如今在公共场合内检测督促人群规范佩戴口罩的工作是有效阻止疫情传播的重要一环,而现阶段大部分地区进行该工作时仍采取人工检测的方式,存在监测范围小、检测效率低、增加疫情传播风险等制约因素。随着深度学习的兴起,通过摄像头采集数据与计算机处理数据的目标检测算法为替代人工检测口罩佩戴情况提供了新思路。
[0003][0004]目标检测算法在计算机视觉领域中一直是被广泛关注的研究热点,其应用广泛、检测准确、覆盖范围广等特点充分显示出目标检测的重要研究价值。基于目标检测中目标预测框从无到有以及预测框变化的过程可大致分为两个方向:单阶段算法与两阶段算法。其中单阶段算法中较为经典的是YOLO(YouOnlyLookOnce)系列算法与SSD(SingleShotMultiBox Detector)系列算法等,且两阶段算法中的FasterR

CNN系列算法应用十分广泛。单阶段算法将目标位置的定位与目标类别的分类同时进行处理,即不需要预先产生预测框,直接产生针对目标类别的概率以及位置信息,只通过依次检测就可以获得最终检测结果。因此单阶段算法的优点在于处理速度快,但精度有所损失。二阶段算法首先找到目标的位置,得到预测框,然后再对预测框进行分类和位置回归。相比较单阶段算法,二阶段算法的处理速度慢但精度较高。
[0005]针对口罩佩戴方式的目标检测需要接近实时检测的速度,单阶段算法更适用于该检测技术的应用背景。但在采集图像信息时,口罩本身体积较小、未规范佩戴口罩情况易混淆且存在和背景信息相似的可能,导致利用现有检测算法无法满足检测要求。要提高检测精度,核心在于有效地在复杂背景下提取、增强目标信息的特征,弥补目标检测在处理特征信息问题的不足;以及解决背景噪声淹没对象信息、对象边界模糊等问题,而如何处理提取的目标特征信息正是其中的关键技术。

技术实现思路

[0006]针对上述现有技术,本专利技术要解决的技术问题是提供一种基于改进型单阶段目标检测网络的口罩佩戴方式检测方法,可以有效提高自然图像目标的检测精度。
[0007]为解决上述技术问题,本专利技术的一种口罩佩戴方式检测方法,包括以下步骤:
[0008]步骤1:对输入图像使用YOLO系列基础网络进行特征提取与融合,生成具有不同分辨率、不同语义强度的三层特征图;
[0009]步骤2:对步骤1得到的三层特征图,使用五种不同的卷积层和池化层操作进行处理,并将生成结果在通道维度上实现拼接,产生具有多层次增强目标特征信息的三层增强特征图;
[0010]步骤3:对步骤2得到的每一层增强特征图,分别使用注意力机制模块、卷积操作与Softmax操作共同处理,将输出结果与输入增强特征图相乘,得到三层降噪特征图,并计算注意力损失;
[0011]步骤4:对步骤3得到的三层降噪特征图和注意力损失使用YOLO系列预测模块做分类和坐标回归,采用非极大值抑制处理后的输出标记口罩位置和佩戴方式。
[0012]进一步的,步骤二中对步骤1得到的三层特征图,使用五种不同的卷积层和池化层操作进行处理,并将生成结果在通道维度上实现拼接,产生具有多层次增强目标特征信息的三层增强特征图包括:
[0013]步骤2.1:将输入特征图通过尺寸大小为1
×
1的卷积层进行特征提取;
[0014]步骤2.2:将输入特征图通过尺寸大小为1
×
1、1
×
3、3
×
1的三层卷积层进行特征提取;
[0015]步骤2.3:将输入特征图通过尺寸大小为1
×
1、1
×
5、5
×
1的三层卷积层进行特征提取;
[0016]步骤2.4:将输入特征图通过尺寸大小为1
×
1的卷积层以及尺寸大小为3
×
3的平均池化层进行特征提取;
[0017]步骤2.5:将输入特征图通过尺寸大小为1
×
1的卷积层以及尺寸大小为3
×
3的最大池化层进行特征提取;
[0018]步骤2.6:将上述五个步骤的输出特征图在通道维度进行拼接,得到具有多层次增强目标特征信息的三层增强特征图。
[0019]进一步的,步骤3中对步骤2得到的每一层增强特征图,分别使用注意力机制模块、卷积操作与Softmax操作共同处理,将输出结果与输入增强特征图相乘,得到三层降噪特征图,并计算注意力损失包括:
[0020]步骤3.1:将步骤2所得的每一层融合增强特征图输入至注意力模块中进行通道、空间特征权重计算,首先使用平均池化与最大池化等操作沿着通道和空间两个独立维度依次推断注意力特征描述符,然后将注意力特征描述符乘以输入特征图,进行自适应特征细化;
[0021]步骤3.2:将步骤2所得的每一层融合增强特征图通过卷积运算产生一个二通道的显著特征图,随后对其执行Softmax操作,并选择其中一个通道与步骤3.1的输出特征图、步骤2的输出特征图相乘,得到特征降噪后的三层降噪特征图;
[0022]步骤3.3:将步骤3.2所得二通道的显著特征图与由真实框得到的二值特征图进行像素Softmax交叉熵损失计算,作为该过程的注意力损失。
[0023]进一步的,步骤4中对步骤3得到的三层降噪特征图和注意力损失使用YOLO系列预测模块做分类和坐标回归,采用非极大值抑制处理后的输出标记口罩位置和佩戴方式包括:
[0024]步骤4.1:将每一层降噪特征图划分网格,每个网格预测三个预测框的位置信息和置信度信息。
[0025]步骤4.2:设置置信度阈值,过滤掉得分低的预测框,对保留的预测框进行非极大值抑制处理,得到最终的检测结果。
[0026]本专利技术的有益效果:本专利技术提出了一种基于改进型单阶段目标检测网络的口罩佩
戴方式检测方法,首先对输入图像使用YOLO系列基础网络进行特征提取与融合,生成三层特征图;再利用五种不同的卷积层和池化层操作后进行拼接,产生三层增强特征图;随后分别使用注意力机制模块、卷积操作与Softmax操作共同处理,得到三层降噪特征图,并计算注意力损失;最后利用YOLO系列预测模块对三层降噪特征图和注意力损失做分类和坐标回归,采用非极大值抑制处理后输出标记口罩位置和佩戴方式。提出的算法使得图像中目标的特征信息更加明确,背景信息存在的无用噪声被有效抑制,对于检测精度提升效果明显,该方法具有良好的应用前景和经济效益。
附图说明
[0027]图1是本专利技术实施例提供的基于改进型单阶段目标检测网络的口罩佩戴方式检测方法的整体示意图;
[0028]图2是本专利技术实施例提供的特征增强模块网络结构示意图;
[0029]图3是本专利技术实施例提供的特征降噪模块网络结构示意图;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种口罩佩戴方式检测方法,其特征在于,包括以下步骤:步骤1:对输入图像使用YOLO系列基础网络进行特征提取与融合,生成具有不同分辨率、不同语义强度的三层特征图;步骤2:对步骤1得到的三层特征图,使用五种不同的卷积层和池化层操作进行处理,并将生成结果在通道维度上实现拼接,产生具有多层次增强目标特征信息的三层增强特征图;步骤3:对步骤2得到的每一层增强特征图,分别使用注意力机制模块、卷积操作与Softmax操作共同处理,将输出结果与输入增强特征图相乘,得到三层降噪特征图,并计算注意力损失;步骤4:对步骤3得到的三层降噪特征图和注意力损失使用YOLO系列预测模块做分类和坐标回归,采用非极大值抑制处理后的输出标记口罩位置和佩戴方式。2.根据权利要求1所述的一种口罩佩戴方式检测方法,其特征在于:步骤二所述对步骤1得到的三层特征图,使用五种不同的卷积层和池化层操作进行处理,并将生成结果在通道维度上实现拼接,产生具有多层次增强目标特征信息的三层增强特征图包括:步骤2.1:将输入特征图通过尺寸大小为1
×
1的卷积层进行特征提取;步骤2.2:将输入特征图通过尺寸大小为1
×
1、1
×
3、3
×
1的三层卷积层进行特征提取;步骤2.3:将输入特征图通过尺寸大小为1
×
1、1
×
5、5
×
1的三层卷积层进行特征提取;步骤2.4:将输入特征图通过尺寸大小为1
×
1的卷积层以及尺寸大小为3
×
3的平均池化层进行特征提取;步骤2.5:将输入特征图通过尺寸...

【专利技术属性】
技术研发人员:辛政志杨志钢温桂炜柴志远杨昊翔
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1