基于改进RetinaNet的员工着装规范检测方法技术

技术编号:24855556 阅读:19 留言:0更新日期:2020-07-10 19:08
本发明专利技术公开了基于改进RetinaNet的员工着装规范检测方法,步骤如下:样本的采集和标注;对训练数据集进行数据增强;基于RetinaNet的改进与anchors选择;网络的预训练以及使用标注的训练样本集对改进网络进行训练;用测试样本集对训练的模型进行验证,确定检测效果。针对待检测目标与背景相似的场景下检测精度的不足,本发明专利技术提出了基于Root‑Resnet‑50的改进网络用于提取图像特征,使得网络模型对于与背景相近目标的检测具有更好的鲁棒性。网络结构相对较为简单,模型检测速度较快,可以直接应用于监控视频的实时检测,对于员工的着装可以起到监督和提醒的作用,从而有效的提高员工管理的效率。

【技术实现步骤摘要】
基于改进RetinaNet的员工着装规范检测方法
本专利技术涉及计算机视觉、目标检测、深度学习领域,尤其涉及一种基于改进RetinaNet的员工着装规范检测方法。
技术介绍
随着社会经济和信息技术的快速发展,利用计算机技术替代人工参与企业管理受到人们越来越多的关注。其中员工的着装规范由于规范明确、特征较为明显、检查枯燥等特点,采用计算机技术可以较好的替代人工进行检测以及规范管理。在一些服务场所和作业场所,员工的着装有着明确的限制,如电影院、餐厅的服务人员应该穿标准的员工服装、工场内的工人需要穿好防护服装、工地的工人需要穿戴好安全服和安全帽等,着装的规范化可以有效的提高服务质量、避免一些安全事故的发生,因此需要长时间的检查,尽力避免相关违规现象的发生。目前的着装规范检测大都依靠人工进行检查,这会导致企业大量人力物力的耗费,当员工处于不同的场景下时,也会导致人工检查的不便,同时人工检查也会存在一定的疏漏,难以避免。另外,着装规范检测也有基于计算机视觉的检测方法,如基于传统特征算子的图像识别方法、基于two-stage目标检测的着装规范检测方法、基于one-stage目标检测的着装规范检测方法等。然而在员工着装规范检测中还有大量关键性问题需要解决;目前亟待解决的问题有:传统图像算法提取手工特征鲁棒性不佳,造成检测的精度难以提高;基于two-stage目标检测和one-stage目标检测的着装规范检测方法在检测精度和检测速度方面难以做好平衡,基于two-stage目标检测的着装规范检测方法检测精度较高但是检测速度较慢,难以实时检测,而基于one-stage目标检测的着装规范检测方法检测速度较快,但是检测精度较差。
技术实现思路
本专利技术的目的在于克服现有技术的不足,本专利技术提供了一种基于改进RetinaNet的员工着装规范检测方法,提取更深层、更具鲁棒性的图像特征,然后通过Focalloss损失函数解决目标检测过程中正负样本以及难易样本不平衡的问题,使得模型在达到较好的检测精度的同时可以有较高的检测速度,达到实时检测的要求为了解决上述技术问题,本专利技术采用如下技术方案:一种基于改进RetinaNet的员工着装规范检测方法,包括如下步骤:A、针对应用场景进行样本数据集的采集和标注,并对样本数据集进行数据集增强操作;B、构建基于RetinaNet的目标检测网络结构,包括特征金字塔网络、分类子网络以及回归框子网络;采用Root-Resnet-50作为特征金字塔网络中自底向上的特征提取网络,将Root-Resnet-50中每个模块的输出与特征金字塔网络自顶向下上采样的结果进行相加,获得对应层次的特征图输出,将对应层次的特征图分别输入到分类子网络以及回归框子网络,获得相应的类别以及位置坐标;C、根据待检测目标中员工服饰类和非员工服饰类的长宽比例,设定锚点框的比例;D、采用步骤A得到的样本数据集对目标检测网络进行训练,生成训练模型;E、视频采集员工的着装图像并输入到步骤D生成的训练模型中,得到待测着装的类别及位置,若检测到员工的着装类别或穿戴位置不符合根据员工着装规范预设的标准,则发出提醒信号。进一步的,所述的步骤A具体为:A1、样本数据集的采集,包括实际应用场景下图像的人工采集和网络图像的下载;A2、样本数据集的标注:按照待检测的员工着装规范,通过LableImg工具对样本图像中的待检测目标进行标注,标注的矩形框的标签包括:员工服饰-staff、非员工服饰-notstaff、围裙-pinafore、帽子-hat、口罩-mask等,标注完成自动保存为与样本图像对应的xml文件;A3、样本数据集的数据集增强,包括:翻转,对样本图像进行翻转操作,将翻转后的图像作为新的样本图像,同时更新翻转样本图像的标注文件;剪裁,对样本图像进行随机剪裁,随机区间设为长度和宽度的10%,同时更新剪裁样本图像的标注文件;缩放,对样本图像进行随机缩放,缩放比例分别为0.5、0.8、1.2、1.5,同时更新缩放样本图像的标注文件;亮度变化,对样本图像进行随机亮度变化,模仿真实情况下光照强度的变化,亮度变化比例分别为0.5、0.75、1.25、1.50。进一步的,所述的步骤B具体为:构建基于RetinaNet的目标检测网络结构,包括特征金字塔网络、分类子网络以及回归框子网络;所述的特征金字塔网络包括自底向上的前馈计算和自顶向下的侧向连接,网络输入是单尺度的任意大小的图像,输出为多层次上的、大小成比例的特征图;采用Root-Resnet-50作为特征金字塔网络中自底向上的特征提取网络,将Root-Resnet-50中每个block输出的不同等级语义下的特征分别与特征金字塔网络自顶向下的上采样的结果进行相加,获得对应层次的特征图输出;将对应层次的特征图分别输入到分类子网络以及回归框子网络,输出候选框中的目标所属类别以及位置坐标,分类子网络采用独热编码表示输出类别,即相应的标签对应的类别;输入图像首先经过3个卷积层,每个卷积层包含64个3*3卷积核,步长为1,第三个卷积层的输出连接4个block共计16个残差模块,每个残差模块由3个卷积核分别为1*1、3*3、1*1的三个卷积层、批标准化层、激活函数层组成,4个block中卷积层的卷积核数依次为64、128、256、512,每个block中的最后一个残差模块的步长为2,其余残差模块的步长为1,Block之间的衔接采用卷积核为1*1的卷积层,每个block的输出为输入图像在不同等级语义下的特征;所述的分类子网络和回归框子网络的结构相似,都是通过三个全连接层网络计算相应的类别以及位置坐标,分类子网络的输出尺寸为2*k*A,回归框子网络的输出尺寸为4*A,其中k表示类别数,A表示anchor数。进一步的,所述目标检测网络的损失函数采用FocalLoss。进一步的,所述的Root-Resnet-50网络采用预激活的残差模块,激活函数采用PRelu函数。进一步的,步骤C所述的锚点框的长宽比为[1:1,1:2,2:1,3:1]。进一步的,所述的步骤D具体为:D1、网络的预训练:采用COCO数据集对目标检测网络进行预训练,将预训练好的网络模型参数保存为ckpt文件;D2、网络的二次训练:加载预训练模型,使用步骤A得到的样本数据集对预训练的模型进行二次训练,设置初始学习率为0.01,学习率的值根据训练次数的增加呈阶梯式下降,设置batch_size的大小为16,在训练过程中,anchor和真实框的IOU大于0.7记为正例,IOU小于0.3记为反例,最终得到训练好的模型。现有技术相比,本专利技术具有的有益效果是:首先,样本数据集的采集、标注与数据增强,数据集的采集包括实际应用场景下图像的人工采集和网络图像的下载,采集到的图像中待检测目标应确保清晰明了,应确保待检测的各类目标的样本类保持基本一致;数据标注应避免遗漏、错标等情本文档来自技高网
...

【技术保护点】
1.基于改进RetinaNet的员工着装规范检测方法,其特征在于,包括以下步骤:/nA、针对应用场景进行样本数据集的采集和标注,并对样本数据集进行数据集增强操作;/nB、构建基于RetinaNet的目标检测网络结构,包括特征金字塔网络、分类子网络以及回归框子网络;采用Root-Resnet-50作为特征金字塔网络中自底向上的特征提取网络,将Root-Resnet-50中每个模块的输出与特征金字塔网络自顶向下上采样的结果进行相加,获得对应层次的特征图输出,将对应层次的特征图分别输入到分类子网络以及回归框子网络,获得相应的类别以及位置坐标;/nC、根据待检测目标中员工服饰类和非员工服饰类的长宽比例,设定锚点框的比例;/nD、采用步骤A得到的样本数据集对目标检测网络进行训练,生成训练模型;/nE、视频采集员工的着装图像并输入到步骤D生成的训练模型中,得到待测着装的类别及位置,若检测到员工的着装类别或穿戴位置不符合根据员工着装规范预设的标准,则发出提醒信号。/n

【技术特征摘要】
1.基于改进RetinaNet的员工着装规范检测方法,其特征在于,包括以下步骤:
A、针对应用场景进行样本数据集的采集和标注,并对样本数据集进行数据集增强操作;
B、构建基于RetinaNet的目标检测网络结构,包括特征金字塔网络、分类子网络以及回归框子网络;采用Root-Resnet-50作为特征金字塔网络中自底向上的特征提取网络,将Root-Resnet-50中每个模块的输出与特征金字塔网络自顶向下上采样的结果进行相加,获得对应层次的特征图输出,将对应层次的特征图分别输入到分类子网络以及回归框子网络,获得相应的类别以及位置坐标;
C、根据待检测目标中员工服饰类和非员工服饰类的长宽比例,设定锚点框的比例;
D、采用步骤A得到的样本数据集对目标检测网络进行训练,生成训练模型;
E、视频采集员工的着装图像并输入到步骤D生成的训练模型中,得到待测着装的类别及位置,若检测到员工的着装类别或穿戴位置不符合根据员工着装规范预设的标准,则发出提醒信号。


2.如权利要求1所述的基于改进RetinaNet的员工着装规范检测方法,其特征在于,所述的步骤A具体为:
A1、样本数据集的采集,包括实际应用场景下图像的人工采集和网络图像的下载;
A2、样本数据集的标注:按照待检测的员工着装规范,通过LableImg工具对样本图像中的待检测目标进行标注,标注的矩形框的标签包括:员工服饰-staff、非员工服饰-notstaff、围裙-pinafore、帽子-hat、口罩-mask标注完成自动保存为与样本图像对应的xml文件;
A3、样本数据集的数据集增强,包括:
翻转,对样本图像进行翻转操作,将翻转后的图像作为新的样本图像,同时更新翻转样本图像的标注文件;
剪裁,对样本图像进行随机剪裁,随机区间设为长度和宽度的10%,同时更新剪裁样本图像的标注文件;
缩放,对样本图像进行随机缩放,缩放比例分别为0.5、0.8、1.2、1.5,同时更新缩放样本图像的标注文件;
亮度变化,对样本图像进行随机亮度变化,模仿真实情况下光照强度的变化,亮度变化比例分别为0.5、0.75、1.25、1.50。


3.如权利要求1所述的基于改进RetinaNet的员工着装规范检测方法,其特征在于,所述的步骤B具体为:
构建基于RetinaNet的目标检测网络结构,包括特征金字塔网络、分类子网络以及回归框子网络;
所述的特征金字塔网络包括自底向上的前馈计算和自顶向下的侧向连接,网络输入是单尺度的任意大小的图像,输出为多层次上的、大小成比例的特征图;采用Root-Re...

【专利技术属性】
技术研发人员:包晓安陈春宇张娜
申请(专利权)人:浙江理工大学桐乡研究院有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1