基于深度学习的安全帽佩戴检测方法、装置及设备制造方法及图纸

技术编号:39260543 阅读:40 留言:0更新日期:2023-10-30 12:12
本公开涉及一种基于深度学习的安全帽佩戴检测方法、装置及设备,包括:将样本图像分割得到的样本子图像及对应的标注图像,输入待训练检测模型得到目标检测模型,训练过程中按照预设数量从样本子图像抽取图像,拼接得到拼接样本子图像,对拼接样本子图像添加检测框,合并检测框添加后的拼接样本子图像得到合并样本图像,检测合并样本图像中的样本对象得到样本对象的坐标和类别,根据样本对象的坐标和类别,标注图像中安全帽检测对象的坐标和类别确定定位损失,根据定位损失反向传播得到目标检测模型;将待检测图像按照滑动窗口和预设步幅分割为待检测子图像,将待检测子图像输入目标检测模型得到安全帽佩戴检测结果。提高安全帽佩戴检测准确性。佩戴检测准确性。佩戴检测准确性。

【技术实现步骤摘要】
基于深度学习的安全帽佩戴检测方法、装置及设备


[0001]本公开涉及图像处理
,尤其涉及一种基于深度学习的安全帽佩戴检测方法、装置及设备。

技术介绍

[0002]安全帽对于工地施工人员来说,是头部防护的基本装备,能够有效地降低头部受伤的风险,降低工伤事故的发生。安全帽检测系统通过实时监测,能够及时发现未佩戴或佩戴不当的情况,并通过提醒和警示来确保进入工地的施工人员正确佩戴安全帽。
[0003]相关场景中,基于Faster R

CNN和R

CNN的两阶段模型基于候选框生成算法(如Selective Search、Region Proposal Network),在采集的图像上生成候选框,并将生成有候选框的图像输入特征提取网络,提取出每个候选框的特征表示。然后,将特征表示送入分类器,对每个候选框进行分类和边界框回归,判断候选框中是否包含目标对象以及确定目标对象的准确位置。例如Faster R

CNN和R

CNN等模型都是基于两阶段的检测模型。但是,其过程较本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的安全帽佩戴检测方法,其特征在于,应用于无人机,包括:获取样本图像集,并根据预设尺寸的滑动窗口以及预设步幅,将所述样本图像集中的各样本图像分别分割为多个样本子图像;对各所述样本子图像进行标注,得到所述样本子图像对应的标注图像,其中所述标注图像中标注有安全帽检测对象的坐标以及类别,所述类别用于表示所述安全帽检测对象是否佩戴所述安全帽以及在佩戴所述安全帽的情况下是否准确佩戴所述安全帽;将所述样本子图像以及对应的所述标注图像输入待训练检测模型,得到目标检测模型,其中,在训练过程中,按照预设数量随机从各所述样本子图像抽取待拼接样本子图像进行拼接,得到与所述样本子图像尺寸大小相同的拼接样本子图像,对各所述拼接样本子图像进行样本对象检测框添加,并按照标注的样本对象的坐标,将样本对象检测框添加后的各所述拼接样本子图像进行合并,得到与所述样本图像尺寸大小相同的合并样本图像,并对所述合并样本图像中的样本对象进行检测,得到合并样本图像中的样本对象的坐标以及类别,根据所述样本对象的坐标以及类别,所述安全帽检测对象的坐标以及类别确定定位损失,并根据所述定位损失对所述待训练检测模型进行反向传播训练,得到目标检测模型;将所述无人机实时采集的待检测图像按照所述预设尺寸的滑动窗口以及所述预设步幅,分割为多个待检测子图像,并将各所述待检测子图像输入所述目标检测模型中,得到所述目标检测模型输出的安全帽佩戴检测结果。2.根据权利要求1所述的方法,其特征在于,所述对所述合并样本图像中的样本对象进行检测,得到合并样本图像中的样本对象的坐标以及类别的步骤,包括:分别对所述合并样本图像进行全局平均池化以及全局最大池化,得到压缩图像,其中,若所述合并样本图像为W*H*C的特征图,则所述压缩图像为1*1*2C的特征图;将所述压缩图像依次作为第一全连接层、Leaky ReLU激活函数、第二全连接层、Sigmoid激活函数的输入,并通过控制第一全连接层中的SERadio=0.5使得输出维度为1*1*C的激励图像;将所述合并样本图像与所述激励图像中各通道权重值进行对应通道的二维矩阵相乘,得到所述合并样本图像中的样本对象的坐标以及类别。3.根据权利要求2所述的方法,其特征在于,所述分别对所述合并样本图像进行全局平均池化以及全局最大池化,得到压缩图像的步骤,包括:Y

=AvgP(X)+MaxP(X)其中,AvgP(X)为对所述合并样本图像进行全局平均池化,MaxP(X)为对所述合并样本图像进行全局最大池化,X为输入的合并样本图像,Y

为输出的1*1*2C的压缩图像。4.根据权利要求2所述的方法,其特征在于,所述将所述压缩图像依次作为第一全连接层、Leaky ReLU激活函数、第二全连接层、Sigmoid激活函数的输入的步骤,包括:Y

=Sig(FC2(LReLU(FC1(Y

))))其中,Y

为压缩图像,Y

为输出的激励图像,FC1为第一全连接层,FC2为第二全连接层,LReLU为Leaky ReLU激活函数,Sig为Sigmoid激活函数。5.根据权利要求4所述的方法,其特征在于,所述Leaky ReLU激活函数为:
其中,y
i
为输入的第i个压缩图像,a
i
为预设的函数常数,f(y
i
)为Leaky ReLU激活函数的输出。6.根据权利要求1所述的方法,其特征在于,通过如下公式确定定位损失:其中,IoU表示两个边界框的交并比,center_distance表示两个边界框中心点的距离的平方,计算公式为:center_dista...

【专利技术属性】
技术研发人员:陈锡爱沈澳琦
申请(专利权)人:中国计量大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1