当前位置: 首页 > 专利查询>大连大学专利>正文

基于改进YOLOX模型的樱桃缺陷及分级检测方法技术

技术编号:36035255 阅读:52 留言:0更新日期:2022-12-21 10:38
本发明专利技术公开了一种基于改进YOLOX模型的樱桃缺陷及分级检测方法,首先,采用YOLOX模型对缺陷果进行检测,通过为特征金字塔网络设置适当的融合因子来提高不明显缺陷的检测精度,并将FocalLoss集成到损失函数中。然后,使用YOLOX模型对完好果进行分级,引入注意力机制CBAM来加强网络特征提取。基于上述方案,樱桃表面缺陷的平均检测精度为97.59%,大小和颜色分级的平均检测精度为95.92%。本发明专利技术改进后的YOLOX模型可明显提升樱桃缺陷及分级检测的精度。的精度。

【技术实现步骤摘要】
基于改进YOLOX模型的樱桃缺陷及分级检测方法


[0001]本专利技术属于果品分级
,具体涉及一种基于改进YOLOX模型的樱桃缺陷及分级检测方法。

技术介绍

[0002]果品分级一直是果蔬产品销售中的一个重要环节,并且随着电商行业的日渐壮大,果品能够在全球实现流通销售。如果想要占有较大的市场份额,实现工业化果品分级尤为重要。
[0003]利用图像视觉和神经网络算法对水果进行缺陷及分级检测是目前的研究热点,国内外许多学者对此进行了大量工作。但是,在樱桃分级的实际应用中,由于环境复杂、缺陷不明显、正负样本不均衡等因素极易影响检测效率和精度。因此,如何提高樱桃分级的检测精度和检测速度是应用的关键。

技术实现思路

[0004]为解决现有技术中存在的缺陷,本专利技术提供一种基于改进YOLOX模型的樱桃缺陷及分级检测方法,通过改进多特征融合模块和损失函数,结合注意力机制CBAM,提高对樱桃缺陷及分级检测的精度。
[0005]本专利技术为解决其技术问题所采用的技术方案是:一种基于改进YOLOX模型的樱桃缺陷及分级检测方法,所述改进YOLOX模型包含有CSPDarknet网络、FPN特征金字塔网络以及Yolo Head网络三个部分;其中CSPDarknet作为YOLOX的主干特征提取网络,FPN特征金字塔网络用以解决检测过程中的多尺度问题,Yolo Head网络用于特征点判断;
[0006]所述樱桃缺陷及分级检测方法包括:采用改进YOLOX模型对缺陷果进行检测,为FPN特征金字塔网络配置融合因子,并将交叉熵损失函数Focal Loss集成到损失函数中;采用改进YOLOX模型对完好果进行分级,引入CBAM注意力机制模块。
[0007]进一步的,所述CSPDarknet网络对每张输入的樱桃图片先进行resize,将其大小变为640
×
640,然后通过Focus网络结构对其进行特征提取,之后使用卷积标准化和激活函数对其通道数进行调整,然后通过4次Resblock body结构进行特征提取,在第4个Resblock body结构中加入SPP结构。
[0008]进一步的,所述FPN特征金字塔网络特征融合方式用下式表示:
[0009][0010]其中f
inner
表示通道匹配的1
×
1卷积运算;f
upsample
表示分辨率匹配的2
×
上采样运算;f
layer
表示特征处理的3
×
3卷积运算;α表示融合因子。
[0011]进一步的,融合因子α取值为0.5。
[0012]进一步的,所述将交叉熵损失函数Focal Loss集成到损失函数中,表示为:
[0013][0014][0015]其中,p
t
表示预测样本属于1的概率,γ表示一可调参数,γ≥0;(1

p
t
)
γ
表示调制系数。
[0016]进一步的,所述CBAM注意力机制模块包含有一个通道注意力模块和一个空间注意力模块,卷积层输出的结果先通过一个通道注意力模块,得到加权结果后,再经过一个空间注意力模块,最终进行加权得到结果,其数学表达式为:
[0017][0018][0019]其中,表示元素相乘;F表示输入的特征图;M
C
(F)表示通道注意力模块的输出,M
S
(F')表示空间注意模块的输出;F”表示CBAM注意力机制模块输出的特征图。
[0020]进一步的,所述通道注意模块首先将输入的特征图分别经过平均池化和最大池化操作,然后传入一个具有共享权重的多层感知器MLP,MLP包含一个隐藏层,相当于两个全连接层;最后通过一个Sigmoid激活函数获得通道注意力图,即通道注意力模块的输出;表达式为:
[0021][0022]其中σ表示Sigmoid激活函数,W0、W1表示MLP的权重,W0∈R
C/r
×
C
,W1∈R
C
×
C/r

[0023]进一步的,所述空间注意力模块首先在每一个特征点的通道上取最大池化和平均池化,将这两个结果进行一个堆叠,生成一个通道数为2的特征图;再通过7
×
7的卷积将通道数减少为1,最后通过一个Sigmoid激活函数得到一个空间注意力图,即空间注意模块的输出;表达式为:
[0024][0025]其中,7
×
7表示卷积核的大小。
[0026]本专利技术的有益效果包括:对于缺陷检测网络,使用融合因子配置FPN,提高了不明显缺陷樱桃的检测能力,并且将Focal loss集成到损失函数中,改善了各类间样本不平衡的问题,平均检测精度的值达到了97.59%,相比原始网络提高了5.75%。对于樱桃分级检测网络,采取融合注意力机制的方法,指引模型关注方向,平均检测精度达到了95.92%,相比原始网络提升了6.99%。因此,本专利技术对樱桃缺陷及分级检测的准确度得到了明显提升。
附图说明
[0027]图1是缺陷检测中樱桃类型图;
[0028]图2是樱桃大小颜色类型图;
[0029]图3是樱桃图像采集硬件设备结构示意图;
[0030]图4是樱桃缺陷及分级检测系统流程图;
[0031]图5是YOLOX模型结构图;
[0032]图6是Yolo Head结构图;
[0033]图7是FPN结构图;
[0034]图8是融合因子的变化对实验结果的影响图;
[0035]图9是不同优化策略模型Eval mAP图;
[0036]图10是模型损失对比图;
[0037]图11是CBAM模块结构图;
[0038]图12是通道注意模块结构图;
[0039]图13是空间注意模块结构图;
[0040]图14是损失函数曲线图。
具体实施方式
[0041]下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0042]此外,下面所描述的本专利技术不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
[0043]基于改进YOLOX模型的樱桃缺陷及分级检测方法,目的是实现工业化条件下樱桃的快速分级。首先,采用YOLOX模型对缺陷果进行检测,通过为特征金字塔网络设置适当的融合因子来提高不明显缺陷的检测精度,并将Focal Loss集成到损失函数中。然后,使用YOLOX模型对完好果进行分级,引入注意力机制CBAM来加强网络特征提取。基于上述方案,樱桃表面缺陷的平均检测精度为97.59%,大小和颜色分级的平均检测精度为95.92%。本专利技术改进后的YOLOX模型可明显提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOX模型的樱桃缺陷及分级检测方法,其特征在于,所述改进YOLOX模型包含有CSPDarknet网络、FPN特征金字塔网络以及Yolo Head网络三个部分;其中CSPDarknet作为YOLOX的主干特征提取网络,FPN特征金字塔网络用以解决检测过程中的多尺度问题,Yolo Head网络用于特征点判断;所述樱桃缺陷及分级检测方法包括:采用改进YOLOX模型对缺陷果进行检测,为FPN特征金字塔网络配置融合因子,并将交叉熵损失函数Focal Loss集成到损失函数中;采用改进YOLOX模型对完好果进行分级,引入CBAM注意力机制模块。2.根据权利要求1所述的基于改进YOLOX模型的樱桃缺陷及分级检测方法,其特征在于,所述CSPDarknet网络对每张输入的樱桃图片先进行resize,将其大小变为640
×
640,然后通过Focus网络结构对其进行特征提取,之后使用卷积标准化和激活函数对其通道数进行调整,然后通过4次Resblock body结构进行特征提取,在第4个Resblock body结构中加入SPP结构。3.根据权利要求1所述的基于改进YOLOX模型的樱桃缺陷及分级检测方法,其特征在于,所述FPN特征金字塔网络特征融合方式用下式表示:其中f
inner
表示通道匹配的1
×
1卷积运算;f
upsample
表示分辨率匹配的2
×
上采样运算;f
layer
表示特征处理的3
×
3卷积运算;α表示融合因子。4.根据权利要求3所述的基于改进YOLOX模型的樱桃缺陷及分级检测方法,其特征在于,融合因子α取值为0.5。5.根据权利要求3所述的基于改进YOLOX模型的樱桃缺陷及分级检测方法,其特征在于,所述将交叉熵损失函数Focal Loss集成到损失函数中,表示为:Loss集成到损失函数中,表...

【专利技术属性】
技术研发人员:裴悦琨刘敬宇
申请(专利权)人:大连大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1