一种基于改进YOLOv8s的疏果前石榴果实检测方法技术

技术编号:39242018 阅读:12 留言:0更新日期:2023-10-30 11:54
本发明专利技术公开了一种基于改进YOLOv8s的疏果前石榴果实检测方法,该方法包括:采集多张石榴的原始图像并使用“makesense”进行标注处理,生成“.txt”文件;对原始图像进行扩充,分别增强和减弱亮度、色度、对比度和锐度,同时添加高斯噪声,得到构建的数据集;通过添加注意力机制CBAM和小目标检测层来构建改进的YOLOv8s网络;定义损失函数Loss;将构建的数据集随机按7:3的比例划分训练集和验证集;使用训练集来训练改进的YOLOv8检测模型,同时开启在线数据增强和标签平滑并保存权重文件,通过验证集验证改进的YOLOv8s检测模型效果。采用该方法对数据集检测精度达到了99.1%,更好的提取了目标特征的同时,提升了目标检测的精度。提升了目标检测的精度。提升了目标检测的精度。

【技术实现步骤摘要】
一种基于改进YOLOv8s的疏果前石榴果实检测方法


[0001]本专利技术涉及人工智能领域图像处理
,具体涉及一种基于改进YOLOv8s的疏果前石榴果实检测方法。

技术介绍

[0002]人工智能的发展,为我们的生产生活带来了极大的便利,在不同领域的应用广泛。目标检测技术发展迅速,在农业、食品加工等领域具有广泛的应用。石榴是一种常见的水果,需要在其生长过程中进行疏果。现在很多果园实现了自动化和智能化管理,在疏果前采用电子仪器快速准确地检测石榴果实,有助于实现自动疏果。
[0003]目前采用的传统检测方法是利用大小不同的滑动窗口选择出图像中可能存在目标的候选区域,然后使用手工设计的特征对这些区域进行特征提取,最后将图像特征送到分类器中进行分类输出结果。由于果园中的环境复杂,如光照、小果的遮挡和聚集,特别是石榴小果与背景之间的极端相似性,采用传统检测方法会存在检测流程复杂、需要时间长以及检测结果精确度低的问题。虽然现在也出现基于YOLO(You Only Live Once)算法的目标检测方法,但是由于石榴小果的个头小,与背景之间的极端相似性,仍然存在检测结果精确度低的问题。

技术实现思路

[0004]本专利技术提供一种基于改进YOLOv8s的疏果前石榴果实检测方法,目的是解决
技术介绍
中存在的上述问题。
[0005]本专利技术提供的技术解决方案如下:
[0006]一种基于改进YOLOv8s的疏果前石榴果实检测方法,其特殊之处在于,包括以下步骤:
[0007]采集多张石榴的原始图像并使用“makesense”进行标注处理,生成“.txt”文件;
[0008]对所述原始图像进行扩充,分别增强和减弱亮度、色度、对比度和锐度,同时添加高斯噪声,得到构建的数据集;
[0009]对YOLOv8s引入CBAM注意力机制、添加小目标检测层来构建改进的YOLOv8s网络;
[0010]定义损失函数Loss;
[0011]将构建的数据集随机按7:3的比例划分训练集和验证集;
[0012]将所述训练集输入到改进的YOLOv8s检测网络中进行训练并保存权重文件,训练时开启数据增强与标签平滑,通过所述验证集验证改进的YOLOv8s检测模型效果。
[0013]进一步地,所述采集多张石榴的原始图像并使用“makesense”进行标注处理,生成“.txt”文件,具体为:
[0014]在石榴果园中对石榴进行多角度、多距离拍摄,采集大量的石榴图片,得到石榴的原始图像,对所述原始图像中的石榴果实采用“makesense”进行标注处理,标签命名为“pomegranate”,生成.txt文件。
[0015]进一步地,所述对所述原始图像进行扩充,分别增强和减弱亮度、色度、对比度和锐度,同时添加高斯噪声,得到数据集,具体为:
[0016]将所述原始图像的亮度、色度和对比度均增强1.2倍,锐度增强2倍,亮度、色度、对比度分别减弱40%,锐度减弱90%,添加方差为0.01的高斯噪声,得到构建的数据集。
[0017]进一步地,所述对YOLOv8s引入CBAM注意力机制、添加小目标检测层来构建改进的YOLOv8s网络,包括以下步骤:
[0018]在Backbone主干网络中的SPPF层前添加注意力机制(CBAM)模块;
[0019]在原有的三种尺寸的检测层的基础上在Neck层引入160
×
160的小目标检测层来预测像素点大于4
×
4的目标。
[0020]进一步地,所述定义损失函数Loss,具体为:
[0021]通过CIOU_Loss表达式定义损失函数,CIOU_Loss的表达式为:
[0022][0023]其中,Loss表示训练回归的损失函数,表示两个边界框中心的距离损失,α是权重函数,v是表示长宽比的相似性度量,p2(b,b
gt
)分别代表了预测框和真实框的中心点的欧氏距离,c代表能同时包含预测框和真实框的最小闭包区域的对角线距离,
[0024]α和v的公式分别表示如下:
[0025][0026][0027]其中w
gt
和h
gt
表示真实框的宽高;w和h表示预测框的宽高。
[0028]进一步地,所述数据增强包括mixup、mosaic和copy paste,所述mixup、mosaic以及copy paste的参数均设置为0.5;
[0029]所述标签平滑设置为0.3。
[0030]进一步地,所述注意力机制(CBAM)模块包含通道注意力机制(CAM)模块和空间注意力机制(SAM)模块,所述通道注意力机制(CAM)模块可以自适应地调整每个通道的重要性,从而使得网络更加关注重要的通道特征,并且忽略一些无关紧要的通道;所述空间注意力机制(SAM)模块用于根据目标的大小、位置和形状等因素来调整不同的区域的权重,从而更好地探测小目标,并且抑制背景噪声。
[0031]进一步地,所述空间注意力机制(SAM)模块中的空间注意力机制可以通过第一函数定义,所述第一函数表示为:
[0032]SA(X)=σ(MLP
sa
(MAX(X))
×
X)
[0033]其中,MAX(X)表示对特征图X进行最大池化操作,得到空间维度上的全局最大值;MLP
sa
(
·
)表示一个多层感知机模型,用于对全局最大值进行变换,得到空间维度上向量φ;σ(
·
)表示一个sigmoid函数,用于将空间注意力映射到[0,1]之间;
×
表示矩阵乘积运算,用于对每个像素元素进行加权。
[0034]进一步地,所述通道注意力机制(CAM)模块中的通道注意力机制(CAM)可以通过第
二函数定义,所述第二函数表示为:
[0035]CA(X)=σ(MLP
ca
(AVE(X))
×
X)
[0036]其中,AVE(X)表示对特征图X进行平均池化操作,得到通道维度上的全局平均值;MLP
ca
(
·
)表示一个多层感知机模型,用于对全局平均值进行变换,得到通道维度上向量θ;σ(
·
)表示一个sigmoid函数,用于将通道注意力映射到[0,1]之间;
×
表示矩阵乘积运算,用于对每个通道的特征进行加权。
[0037]与现有技术相比,本专利技术的有益效果是:
[0038]本专利技术提供了一种基于改进YOLOv8s的疏果前石榴果实检测方法,通过引入注意力机制CBAM模块和添加160
×
160的小目标检测层来构建改进的YOLOv8s模型,改进的YOLOv8s模型的检测网络在原有的三种尺寸的检测层的基础上在Neck层引入160
×
160的小目标检测层来预测像素点大于4
×
4的目标,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv8s的疏果前石榴果实检测方法,其特征在于,包括以下步骤:采集多张石榴的原始图像并使用“makesense”进行标注处理,生成“.txt”文件;对所述原始图像进行扩充,分别增强和减弱亮度、色度、对比度和锐度,同时添加高斯噪声,构建数据集;对YOLOv8s引入CBAM注意力机制、添加小目标检测层来构建改进的YOLOv8s网络;定义损失函数Loss;将构建的数据集随机按7:3的比例划分训练集和验证集;将所述训练集输入到改进的YOLOv8s检测网络中进行训练并保存权重文件,训练时开启数据增强与标签平滑,通过所述验证集验证改进的YOLOv8s检测模型效果。2.根据权利要求1所述的基于改进YOLOv8s的疏果前石榴果实检测方法,所述采集多张石榴的原始图像并使用“makesense”进行标注处理,生成“.txt”文件,其特征在于,具体为:在石榴果园中对石榴进行多角度、多距离拍摄,采集大量的石榴图片,得到石榴的原始图像,对所述原始图像中的石榴果实采用makesense进行标注处理,标签命名为“pomegranate”,生成.txt文件。3.根据权利要求1所述的基于改进YOLOv8s的疏果前石榴果实检测方法,所述对所述原始图像进行扩充,分别增强和减弱亮度、色度、对比度和锐度,同时添加高斯噪声,构建数据集,其特征在于,具体为:将所述原始图像的亮度、色度和对比度均增强1.2倍,锐度增强2倍,亮度、色度、对比度分别减弱40%,锐度减弱90%,添加方差为0.01的高斯噪声,得到构建的数据集。4.根据权利要求1所述的基于改进YOLOv8s的疏果前石榴果实检测方法,所述对YOLOv8s引入CBAM注意力机制、添加小目标检测层来构建改进的YOLOv8s网络,其特征在于,包括以下步骤:在Backbone主干网络中的SPPF层前添加注意力机制(CBAM)模块;在原有的三种尺寸的检测层的基础上在Neck层引入160
×
160的小目标检测层来预测像素点大于4
×
4的目标。5.根据权利要求1所述的基于改进YOLOv8s的疏果前石榴果实检测方法,所述定义损失函数Loss,其特征在于,具体为:通过CIOU_Loss表达式定义损失函数,CIOU_Loss的表达式为:其中,Loss表示训练回归的损失函数,表示两个边界框中心的距离损失,α是权重函数,v是表示长宽比的相似性度量,p2(b,b
gt
)分别代表了预测框和真实框的中心点的欧氏距离,c代表能同时包含预测框和真实框的最小闭包区域的...

【专利技术属性】
技术研发人员:杜雨蓉姚家辉刘心如赵明虎郝红娟邓文萱卢定泽
申请(专利权)人:西安工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1