一种基于改进YOLOv5s餐盘检测方法技术

技术编号：40135808 阅读：8 留言：0更新日期：2024-01-23 22:50

本发明专利技术公开了一种基于改进YOLOv5s的餐盘检测方法，属于计算机视觉技术领域。本发明专利技术在YOLOv5s的基础网络结构下，将YOLO v5s的颈部网络替换为Efficient RepGFPN特征融合网络，并将特征图的不同通道维度采用不同的比例设置。相对于共享相同通道数量的网络，其具有更强的特征提取能力。此外，本发明专利技术还将替换后的特征融合网络中的上采样操作替换为通用、轻量级且高效的CARAFE上采样操作，以便在广泛的感受野内聚集信息，并动态适应特定实例的内容。最后，本发明专利技术还在主干网络中引入了SE注意力机制，以进一步增强特征提取能力。本发明专利技术在构建的餐盘数据集上进行了验证，结果表明，本发明专利技术提出的检测模型要优于YOLOv5s，其中，Precision、Recall、mAP@.5与mAP.5:.95分别提高了3.1％、3％、3.1％与3.6％。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉，具体涉及一种基于改进yolov5s的餐盘检测方法。

技术介绍

1、近年来，随着社会经济的快速快速发展，以及科学技术的不断创新，使得人们的生活质量稳步上升。并且，自从人工智能在二十世纪五十年代被提出来，至今已有数十年，相关技术逐渐成熟，运用领域越来越广泛，也使得人类在生活中的方方面面有着极大的便利。在人工智能的研究领域中，与其他研究方向相比较，计算机视觉较为热门，其相关的研究不计其数。目前，已有研究人员将计算机视觉技术与餐饮行业挂钩，比如已有的智慧餐厅，它可以满足更多消费者的需求，提供了多样化的选择。将餐饮行业与计算机视觉技术融合，使得餐饮行业逐步追求智能化、模块化和高效化的产业模式，最终形成新的智慧型餐饮行业。

2、目前，餐饮业为提高客流量并减少顾客等待时间，大多数餐厅和食堂采用顾客自助挑选食品并排队结账的方式来提高用餐效率。结账主要分为人工计价和图像识别自动计价两种方式。人工计价依赖收银员手动计算食品价格，但随着顾客数量的增加以及单一的计费方式，人工计价效率和准确率受到影响，随着时间的推移，这种方式也显现出更多的不足之处。此外，人工计价需要分配多个计费窗口，耗费时间。相比之下，图像识别自动计价方式带来了高效率和人力节省的优势。然而，为了获得更准确的图像识别模型，需要不断改进检测算法。

3、在传统的目标检测算法中，模型存在着检测时间长、复杂度高以及鲁棒性不够高的问题。然而，随着深度学习技术的不断发展，许多研究人员提出了众多卓越的目标检测算法，包括yolo系列和ssd等。这些算法在

4、目前的图像识别自动计价方式的目标检测模型存在一些不足之处，其中包括以下问题：首先，大多数餐厅和食堂使用的目标检测模型仅能识别该餐厅的餐盘，无法泛化到其他餐厅的餐盘，导致模型的类别过于狭隘。其次，将多个餐厅的餐盘混合并训练检测模型可能会因为餐盘的尺寸、颜色和形状过于相似而降低模型的识别准确率。第三，进行图像识别自动计价时，如果托盘上放置了手机、筷子、汤勺等物品，可能会对模型的检测产生干扰，从而导致识别错误。为了解决上述问题，本专利技术提出一种基于改进yolov5s的餐盘检测方法。

技术实现思路

1、本专利技术的目的在于提出一种基于改进yolov5s的餐盘检测方法以解决现有食堂、餐厅用目标检测方法餐盘定位不准确，识别有误的问题。

2、为了实现上述目的，本专利技术采用了如下技术方案：

3、一种基于改进yolov5的餐盘检测方法，包括如下步骤：

4、s1：获取训练模型的图像，将图像中需要检测的区域进行标注，得到餐盘检测数据集，在通过数据集的清洗与划分，得到训练集，测试集与验证集；

5、s2：构建基于改进yolov5s的餐盘检测模型，将原有yolov5s的neck模块替换为efficient repgfpn特征融合网络提高特征提取能力；

6、s3：在将efficient repgfpn特征融合网络中的上采样算子替换为carafe上采样算子增强检测效果；

7、s4：改进yolov5s的主干网络，加入se注意力机制，进一步增强特征提取的能力。

8、优选地，所述s1具体包括如下内容：

9、s1.1、将多个餐厅的餐盘数据集进行整合，形成一个新的数据集；

10、s1.2、将s1.1中所得新的数据集重新进行类别标注，得到多个餐厅的更多种餐盘类别的复杂数据集；

11、s1.3、对s1.2中得到的餐厅数据集进行划分，以得到训练数据集、验证数据集以及测试数据集。

12、优选地，所述s2具体包括如下内容：

13、s2.1、将efficient repgfpn特征融合网络替换原始yolov5s的neck网络，efficient repgfpn特征融合网络可以实现不同尺度特征使用不同的通道数，并且可以灵活控制高层特征与低层特征的表达能力，提高了特征提取能力。

14、优选地，所述s3具体包括如下内容：

15、s3.1、carafe是一个具有内容感知内核的上采样算子。具体包括如下操作步骤：

16、s3.1.1、根据每个目标位置的内容预测其重组内核；

17、s3.1.2、假设给定大小为c×h×w的特征图x和上采样率σ，且σ是整数，用预测的重组内核特征，carafe上采样算子将产生大小为c×σh×σw的新特征图x'；具体计算公式如下：

18、wl'＝ψ(n(xl,kencoder))

19、xl'＝φ(n(xl,kup)，wl')

20、式中，ψ为内核预测模块，预测位置上的内核w1’，k代表内核的大小，φ是内容感知重组模块，该模块将内核w1’进行重组；

21、s3.2、替换为carafe上采样算子之后，可以增强检测的效果，提高识别的准确率。

22、优选地，所述s4具体包括如下内容：

23、s4.1、se注意力模块，是一种支持即插即用的模块。具体包括如下操作步骤：

24、s4.1.1、对输入的特征图进行全局最大池化，例如，输入特征图为(b,c,h,w),经过最大池化变成(b,c,1,1)；

25、s4.1.2、经过全局平均池化之后在进行全连接，目的是把通道缩小；

26、s4.1.3、再次进行全连接，使得通道数量恢复正常；

27、s4.1.4、将原始特征图与权重相乘输出；具体计算公式如下：

28、

29、s＝fex(z，w)＝σ(g(z，w))＝σ(w2δ(w1z))

30、

31、式中，z代表通道注意力激励，fsq代表squeeze操作，h为输入特征图的高度，w为输入特征图的宽度，fex代表excitation操作下标c表示第几个通道，s为特征图的权重，σ表示sigmoid函数，δ表示relu函数，fex代表excitation操作，fscale代表scale操作。

32、s4.2、将se注意力模块加在主干网络第八层的后面，进一步增强网络的特征提取能力。

33、与现有技术相比，本专利技术提供了一种基于改进yolov5s餐盘检测方法，具备以下有益效果：

34、(1)本专利技术通过采集多个餐厅的各种餐盘类型构成一个庞大的数据集，使得实验所需的数据更能满足实验的需求，并且通过清洗和整理，使得样本数据更加平衡，也有利于检测效果的提升。

35、(2)本专利技术使用改进yolov5s的餐盘检测模型，使模型准确率有着很大的提升，不会将托盘上的其他物品，例如，手机、筷子、勺子等一些干扰因素进行错误的识别。将原有yolov5s的neck模块替换为efficient repgfpn特征融合，使得网络特征提取能力大大的提高，减少识别错误的概率。将efficient repgfpn特征融合网络中的上采样算子替换为carafe上采样算本文档来自技高网...

【技术保护点】

1.一种基于改进YOLOv5s网络的餐盘检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于改进YOLOv5s网络的餐盘检测方法，其特征在于，所述S1具体实现过程如下：

3.根据权利要求1所述的一种基于改进YOLOv5s网络的餐盘检测方法，其特征在于，S2中所述Efficient RepGFPN特征融合网络具体包括如下特点：

4.根据权利要求1所述的一种基于改进YOLOv5s网络的餐盘检测方法，其特征在于，S3中所述CARAFE上采样算子具体包括如下特点：

5.根据权利要求1所述的一种基于改进YOLOv5s网络的餐盘检测方法，其特征在于，S4中所述SE注意力机制具体包括如下特点：

【技术特征摘要】

1.一种基于改进yolov5s网络的餐盘检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于改进yolov5s网络的餐盘检测方法，其特征在于，所述s1具体实现过程如下：

3.根据权利要求1所述的一种基于改进yolov5s网络的餐盘检测方法，其特征在于，s2中所述efficient r...

【专利技术属性】
技术研发人员：熊继平，陈巍，
申请(专利权)人：浙江师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人