当前位置: 首页 > 专利查询>南通大学专利>正文

一种基于改进的yolov5的餐饮工作人员服饰识别方法技术

技术编号:38492500 阅读:14 留言:0更新日期:2023-08-15 17:05
本发明专利技术提供了一种基于改进的yolov5的餐饮工作人员服饰识别方法,属于计算机视觉技术领域。解决了在有干扰因素的复杂背景下的餐饮工作人员服饰识别精度低的技术问题。其技术方案为:S1、样本数据采集;S2、构建改进型YOLOv5神经网络结构;S3、对改进YOLOv5算法进行训练;S4、模型剪枝;S5、现场采集待检测图像并进行图像预处理;S6、输出目标检测结果。本发明专利技术的有益效果为:实现餐饮工作人员服饰检测的智能化,减少人工监管所耗费的时间和精力。减少人工监管所耗费的时间和精力。减少人工监管所耗费的时间和精力。

【技术实现步骤摘要】
一种基于改进的yolov5的餐饮工作人员服饰识别方法


[0001]本专利技术涉及计算机视觉
,尤其涉及一种基于改进的yolov5的餐饮工作人员服饰识别方法。

技术介绍

[0002]当前随着国家经济快速发展和外卖行业的兴起,社会上出现了各种各样的餐饮单位,随之而来的食品安全事件频频发生,食品安全卫生引起越来越多人的关注,人们对餐饮行业的要求也随之提高。为了在一定程度上解决因餐饮工作人员在制作过程中导致的不干净的食物的问题,管理人员需要加强餐饮工作人员的服饰佩戴的检测。早期基于计算机视觉的服饰检测算法通常利用运动分割的办法找到视频中的特定区域,利用服饰的原有特征进行检测识别,但是传统方法提取的特征本身不具有高度抽象性,在现实场景中,餐饮工作人员的服饰目标特征易受周围环境的影响,表现出一定的差异性,导致检测的准确率下降,无法满足预警的要求。因此,为了增强对餐饮工作人员服饰佩戴的监督,保障食品制作过程中的卫生安全,降低人力成本投入,研发出能够排除餐饮制作环境中的干扰等不稳定因素,同时确保精度的智能餐饮工作人员服饰佩戴检测方法势在必行。
[0003]基于深度学习的目标检测算法主要分为双阶网络和单阶网络。双阶网络生成一个区域候选框,然后对候选框进行目标的分类与回归,其检测精度很高,但是检测速度往往低于单阶网络,实时性不强。单阶网络可以直接生成物体属于某个类别的概率和所在位置的坐标值,凭借轻量化的优点得到广泛应用,如航空发动机内部缺陷检测,无人驾驶汽车、灾害预警和市貌改善。
[0004]其中,YOLO系列因为其较快的检测速度,应用极为广泛,尤其是在不追求预测框高精度的场景下,与其他检测算法精度相同时,可以达到3到4倍的前向速度,是一个十分适合实际应用的检测框架。YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。
[0005]虽然现有的目标检测算法的性能高,但是对于目标较小时仍然会很大程度上影响算法的检测精度。因此,采用目前的目标检测算法,实现准确高效的餐饮工作人员服饰识别是一个亟待解决的难题。

技术实现思路

[0006]本专利技术的目的在于提供一种基于改进的yolov5的餐饮工作人员服饰识别方法,解决存在有干扰因素的复杂背景下的餐饮工作人员服饰识别精度低问题,该方法得出一种餐饮工作人员服饰识别的通用模型,可以适用在餐饮后厨、食品加工等多种场景下,实现餐饮工作人员服饰检测的智能化,减少人工监管所耗费的时间和精力,一定程度上,保障食品制作过程的卫生安全。
[0007]为了实现上述专利技术目的,本专利技术采用技术方案具体为:一种基于改进的yolov5的餐饮工作人员服饰识别方法,包括以下步骤:
[0008]S1、样本数据采集;
[0009](1)利用聚焦网络爬虫技术获取相关的数据,并把采集到的图片格式转换为.jpg进行储存;
[0010](2)使用labelImg标注工具标注出各目标的锚框,在使用labelImg标注工具之前,需要创建两个文件夹,一个存放已经采集好的图片,另一个存放准备标定后的txt文件,并修改data文件夹下的predefined_classes.txt类文件并保存。其次需要配置Anaconda环境,运行Anaconda Prompt,在终端通过pip install labelImg命令安装labelImg,并启用。进入labelImg界面需要点击open dir选择存放采集好的图片文件夹,然后再选择存放txt文件的文件夹,最后开始制作数据集;
[0011]S2、基于YOLOv5算法构建改进型YOLOv5神经网络结构;
[0012](1)引入RFB

s增强特征提取;
[0013]多层特征融合是实现不同大小目标准确识别的一种常用方法。RFB

s模块从主干网络中分别提取尺度大小为8
×
8、16
×
16、32
×
32的特征图,经过反卷积后依次与上一级融合,然后对不同融合尺度进行预测,以此保证网络对小目标的识别率。由于从浅到深,感受野越大,特征图提取的语义信息等级越高,而分辨率越低,因此在较深层和较浅层都会存在不同程度不同类型的信息损失。RFB

s和RFB相比主要有两个改进,一方面用3
×
3卷积层代替5x5卷积层,另一方面用1
×
3和3
×
1卷积层代替3
×
3卷积层,主要目的应该是为了减少计算量,类似Inception后期版本对Inception结构的改进。以增强对不同形态、不同大小目标的特征提取能力。
[0014](2)采用Focal

Loss替换BCE

loss;
[0015]本专利技术采用Focal

Loss替换分类损失函数。由于餐饮工作人员的服饰包括不同尺寸的大小目标,相对的大目标较易检测识别,但是小目标在餐饮工作场景中检测的精度低,存在漏检、误检的现象。Focal

Loss是为了解决训练过程中难分样本和易分样本类别不平衡问题而提出的,通过重新分配权重,减少易分样本所占的损失值比重,训练得到的模型可以将更多的注意力集中到难分的样本上,从而提高小目标或遮挡目标的检测精度。以二分类任务为例,Focal Loss损失函数的处理过程如下:
[0016][0017]在上述公式中,p指的是模型对样本类别的预测概率,(1

p)
γ
为抑制系数,γ为抑制参数,该参数要求大于0,主要用来抑制易样本的权重,y表示实际的标签类别。
[0018]例如当y=2时,正样本的预测结果为0.9,表示该样本是简单样本,这时候(1

0.9)
γ
的值会很小,该样本贡献的损失值会变小。如果预测的结果为0.3,那么依据该公式这份样本的损失值较大。按照这种计算方法预测结果较好的样本的损失值会远小于预测结果较差的损失值,训练的过程会偏向小目标和难分目标。
[0019]目前目标检测领域中交叉嫡损失函数依然是主流,但是针对小目标的检测FocalLoss表现出来很大的优势,因此,本专利技术在Focal

Loss函数上进行改进,用来替换原本的交叉嫡损失函数,从而提高小目标的检测精度。
[0020](3)锚框回归优化;
[0021]本专利技术使用EIOU回归损失函数来解决CIOU存在的问题,在CIOU的惩罚项基础上将
候选框和实际目标区域长宽比值的影响因子拆分开,分别计算候选框和实际目标区域的长宽数值。EIOU回归损失函数的表达式如公式(2)所示。
[0022][0023][0024][0025][0026]其中,C
ω
和C
h
是闭合候选框和实际区域最小外接矩形框的长度和宽度。式中包含3部分:候选本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进的yolov5的餐饮工作人员服饰识别方法,其特征在于,包括以下步骤:S1、样本数据采集;(1)利用聚焦网络爬虫技术获取相关的数据,并把采集到的图片格式转换为.jpg进行储存;(2)使用labelImg标注工具标注出各目标的锚框,在使用labelImg标注工具之前,需要创建两个文件夹,一个存放已经采集好的图片,另一个存放准备标定后的txt文件,并修改data文件夹下的predefined_classes.txt类文件并保存,其次需要配置Anaconda环境,运行Anaconda Prompt,在终端通过pip install labelImg命令安装labelImg,并启用,进入labelImg界面需要点击open dir选择存放采集好的图片文件夹,然后再选择存放txt文件的文件夹,最后开始制作数据集;S2、基于YOLOv5算法构建改进型YOLOv5神经网络结构;(1)引入RFB

s增强特征提取;多层特征融合是实现不同大小目标准确识别的一种常用方法,RFB

s模块从主干网络中分别提取尺度大小为8
×
8、16
×
16、32
×
32的特征图,经过反卷积后依次与上一级融合,然后对不同融合尺度进行预测,以此保证网络对小目标的识别率,由于从浅到深,感受野越大,特征图提取的语义信息等级越高,而分辨率越低,因此在较深层和较浅层都会存在不同程度不同类型的信息损失,RFB

s和RFB相比主要有两个改进,一方面用3
×
3卷积层代替5x5卷积层,另一方面用1
×
3和3
×
1卷积层代替3
×
3卷积层,主要目的应该是为了减少计算量,类似Inception后期版本对Inception结构的改进,以增强对不同形态、不同大小目标的特征提取能力;(2)采用Focal

Loss替换BCE

loss;采用Focal

Loss替换分类损失函数,由于餐饮工作人员的服饰包括不同尺寸的大小目标,相对的大目标较易检测识别,但是小目标在餐饮工作场景中检测的精度低,存在漏检、误检的现象,Focal

Loss是为了解决训练过程中难分样本和易分样本类别不平衡问题而提出的,通过重新分配权重,减少易分样本所占的损失值比重,训练得到的模型将更多的注意力集中到难分的样本上,从而提高小目标或遮挡目标的检测精度,以二分类任务为例,Focal Loss损失函数的处理过程如下:在上述公式中,p指的是模型对样本类别的预测概率,(1

p)
γ
为抑制系数,γ为抑制参数,该参数要求大于0,主要用来抑制易样本的权重,y表示实际的标签类别;(3)锚框回归优化;使用EIOU回归损失函数来解决CIOU存在的问题,在CIOU的惩罚项基础上将候选框和实际目标区域长宽比值的影响因子拆分开,分别计算候选框和实际目标区域的长宽数值,EIOU回...

【专利技术属性】
技术研发人员:李跃华仲新王金凤曹睿吉冯浩宸季萱颐
申请(专利权)人:南通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1