一种基于YOLOv5的苹果表面伤损检测的方法技术

技术编号:38548581 阅读:14 留言:0更新日期:2023-08-22 20:56
本发明专利技术涉及一种基于YOLOv5的苹果表面伤损检测的方法。采集自然环境下的高分辨率图像,并基于伤损程度将图像数据分为无伤损、有伤损两类。对苹果数据集按照是否存在伤损进行标注,利用K

【技术实现步骤摘要】
一种基于YOLOv5的苹果表面伤损检测的方法


[0001]本专利技术涉及苹果损伤检测
,尤其涉及一种基于YOLOv5的苹果表面伤损检测的方法。

技术介绍

[0002]随着居民收入水平的提高,对中高端苹果的消费需求也不断增加,苹果质量严重影响果农收入及消费者的消费体验。农业劳动密集型特性与农业从业人口的减少和老龄化的现状使得农业发展速度受限,特别是苹果产业更需要大量的劳动力进行产前种植、产中维护、产后加工运输等工作。随着人工智能快速的发展,给我们的生活带来了极大的便利,特别是深度学习的快速发展,在一定程度上促进医疗、教育、科技、农业等行业的发展。在苹果生产行业,苹果是否存在伤损是影响苹果运输与保存时间的重要影响因素、对苹果品质进行分类是促进苹果产业健康高质量发展的因素,传统方法通过人工根据苹果外表是否存在伤损对其进行分类,此过程费时费力且容易存在人工误分的风险,带来经济损失。近些年随着深度学习的发展及应用,目标检测算法在农业领域也得到了大量应用,YOLOv5算法是在原有YOLO目标检测架构的基础上采用近些年卷积神经网络领域中最优秀的优化策略,从数据处理、主干网络、网络训练、激活函数、损失函数等各个方面进行优化,以实现更高速度与精度的提升。将YOLOv5模型应用到苹果表面伤损检测,将会大大节省人力物力、缩减人力成本,为生产者增加收入,为消费者提升消费体验。
[0003]基于深度学习目标检测方法主要分为两大类:
[0004]两阶段检测算法如R

CNN、SPP

net等,这类算法首先通过边界框搜索算法或选择性搜索算法生成一系列相应的候选区域,然后利用卷积神经网络从原图像中提取特征进行分类和定位。两阶段算法需要对每一个可能包括物体的候选区域进行检测,在樱桃检测和定位精度都占有优势,但随带来的问题是时间复杂度较高。
[0005]单阶段检测算法如YOLO、SSD等。这类算法将目标检测作为回归问题,不需要在图像中生成待检测候选框,通过回归模型直接得到目标的类别概率和位置坐标值。虽然单阶段算法在速度和时间效率上要优于两阶段算法,但会造成检测精度的下降。然而随着YOLO模型的不断改进其精度也能在达到较高的水平,使其在目标检测上的应用越来越广泛。

技术实现思路

[0006]本专利技术技术方案针对现有技术解决方案过于单一的技术问题,提供了显著不同于现有技术的解决方案,本专利技术实施例提供一种基于YOLOv5的苹果表面伤损检测的方法,以解决现有的通过两阶段检测算法进行检验时,时间复杂度过高,单阶段检验算法虽然速度时间效率高,但是检测精度较差的技术问题。
[0007]本专利技术实施例采用下述技术方案:一种基于YOLOv5的苹果表面伤损检测的方法,包括以下步骤;
[0008]步骤1:采集自然环境下的苹果图像形成苹果数据集,利用人工标注对苹果进行锚
框标注及按伤损程度进行多类别划分,具体包括按伤损程度划分两类:无损、有损;
[0009]步骤2:将数据集划分为训练集、验证集和测试集,分别用于模型的训练和测试;
[0010]步骤3:利用K

means聚类方法对苹果数据集的真实边界框进行聚类,得到9种不同尺度的先验框,用于不同尺度目标的预测;
[0011]步骤4:采用YOLOv5模型对苹果数据进行训练,训练时采取Mosaic数据增强方法进行数据增强,然后将训练数据输入YOLOv5模型,对苹果目标的位置和类别进行预测,利用损失函数训练优化模型至收敛,得到并保存最终的模型权重数据。
[0012]步骤5:利用训练得到的最优模型权重,将测试集输入进行检测,产生最终的检测结果。
[0013]进一步、所述步骤1采用以下方法构建数据集;在自然光照合适的环境下,利用相机在不同拍摄条件下采集苹果图像数据,对苹果数据进行分类,根据表面是存在伤损将其分为:有损和无损。
[0014]进一步、所述步骤3中,利用K

means聚类方法对标记框聚类,得到9种不同尺寸的先验框。原始YOLO数据的Anchor是基于COCO数据集的1000类生活常见物体聚类得到,并不适用于苹果的数据,因此采用K

means聚类算法对苹果数据集目标检测框进行聚类分析,得到适用于自然环境下苹果的Anchor的数量与尺寸。
[0015]进一步、步骤4中,在训练时对数据采取Mosaic数据增强达到丰富数据集、减少GPU的作用。丰富数据集方面:通过随机使用4张图片,随机缩放,再随机分布进行拼接,这样大大丰富了检测数据集,特别是随机缩放增加了很多小目标,让网络的鲁棒性更好。减少GPU方面:在Mosaic增强训练时,可以直接计算4张图片的数据,使得Mini

batch大小并不需要很大,一个GPU就可以达到比较好的效果。
[0016]进一步、所述步骤4中,步骤4中,采用YOLOv5模型进行数据的训练。其网络架构主要包括:Input、Backbone、Neck、Prediction。Input可输入不同尺度的图像。Backbone包含Focus、CBL、CSP1_x、SPP等模块组成,通过以上组件对输入图像进行下采样与特征提取,Neck包含CSP2_x模块进一步提取特征,并通过不同部分进行的上采样得到不同的维度的特征。Prediction运用卷积层等将输入不同维度的特征图进行预测,并将其输出。
[0017]进一步、所述将步骤4聚合得到的特征图分别输入YOLOv5 Prediction层,对目标的位置和类别进行预测,各分支分别输出形式为N
×
N
×3×
(4+1+C)的向量,N表示该尺度分支下的特征图尺寸,也即将输入图像划分为N
×
N的grid cell。3表示每个grid cell的预测框数量,4和1分别表示预测框的坐标和置信度,C表示数据的类别数量;利用损失函数进行训练。总损失L包括正样本损失L1与负样本损失L2,正样本损失包括置信度损失L
1,1
、类别损失L
1,2
、位置损失L
CoU
、负样本损失仅包括置信度损失L2。其计算公式分别为;
[0018]总样损失函数:
[0019]L=L1+L2[0020]正样本损失:
[0021]L1=L
1,1
+L
1,2
+L
CoU
[0022]置信度损失:
[0023][0024]式中S2为输入图像的网格数,B为每个网格生成边界框的数量,λ
coord
为正样本权重参数,特征点落在边界框内即为正样本是p
c
为置信度预测值、置信度标签值为1。
[0025]类别损失:
[0026][0027]式中为类别标签,c
i
为类别预测值。
[0028]位置损失:
[0029][0030][0031][0032][00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于YOLOv5的苹果表面伤损检测的方法,其特征在于,包括如下步骤:步骤1:采集自然环境下的苹果图像形成苹果数据集,利用人工标注,对苹果进行锚框标注及按伤损程度进行类别划分,具体包括按伤损程度划分两类:无损、有损。步骤2:将苹果数据集划分为训练集、验证集和测试集,分别用于模型的训练及测试,训练集用于训练模型和调整参数,验证集用于选择最佳模型和避免过拟合,测试集用于评估模型的性能和泛化能力。步骤3:利用K

means聚类方法对苹果数据集的真实边界框进行聚类,得到不同尺度的先验框,用于不同尺度目标的预测;步骤4:采用YOLOv5模型对苹果数据集进行训练,然后将训练集数据输入Y OLOv5模型,对苹果目标的位置和类别进行预测,模型的Backbone部分对数据进行特征提取并聚合形成特征图,Neck部分采用特征金字塔模块在不同尺度下提取图像的特征,并将其转化为特征向量传入模型Head部分进而对苹果目标的位置和类别进行预测,利用损失函数训练优化模型至收敛聚合,得到并保存最终的模型权重数据,即最优模型权重数据。步骤5:利用训练得到的最优模型权重数据,将测试集数据输入进行检测,产生最终的检测结果。2.根据权利要求1所述的一种基于YOLOv5的苹果表面伤损检测的方法,其特征在于;所述步骤1采用以下方法构建数据集;在自然光照合适的环境下,利用相机在不同拍摄条件下采集苹果图像数据,对苹果数据进行分类,根据表面是存在伤损将其分为:有损和无损。3.根据权利要求1所述的一种基于YOLOv5的苹果表面伤损检测的方法,其特征在于;所述步骤3中利用K

means聚类方法对标记框聚类,得到9种不同尺寸的先验框。4.根据权利要求1所述的一种基于YOLOv5的苹果表面伤损检测的方法,其特征在于;所述步骤4中在训练时对数据采取Mosaic数据增强。5.根据权利要求1所述的一种基于YOLOv5的苹果表面伤损检测的方法,其特征在于;所述步骤4中采用YOLOv5模型进行数据的训练,其网络架构主要包括:Input、Backbone、Neck、Prediction。Input可输入不同尺度的图像,Bac kbone由Focus、CBL、CSP1_x、SPP模块组成,通过以上模块对输入图像进行下采样与特征提取,Neck包含CSP2_x模块进一步提取特征,并通过不同部分进行的上采样得到不同的维度的特征,Prediction运用卷积将输入不同维度的特征图进行预测...

【专利技术属性】
技术研发人员:张永全孙志福赵威袁归陈鸿达
申请(专利权)人:浙江财经大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1