一种鸭蛋识别定位方法技术

技术编号:38857699 阅读:27 留言:0更新日期:2023-09-17 10:02
本发明专利技术涉及一种鸭蛋识别定位方法。数据采集与预处理:使用羽毛、秸秆、泥沙或其他材料,模拟鸭舍的复杂环境,使用相机进行拍摄,所得数据中包括多角度、多位置、不同距离、不同遮挡形式的鸭蛋图像;对采集的原始图像数据按照6:2:2划分为训练集、验证集、测试集,为丰富现有训练集数据信息,防止模型出现过拟合问题,对训练集样本数据增强;建立YOLOV7目标检测模型对数据进行检测:对模型进行改进和训练,建立优化后的模型;采用优化后的模型对鸭蛋进行识别定位。本发明专利技术通过改进并训练YOLOV7模型,得到最优检测模型YOLOV7_CDS,其F1分数为95.5%,平均精度均值(mAP)为85.2%,为鸭蛋拾取机器人在鸭场中拾取鸭蛋提供技术支持。在鸭场中拾取鸭蛋提供技术支持。在鸭场中拾取鸭蛋提供技术支持。

【技术实现步骤摘要】
一种鸭蛋识别定位方法


[0001]本专利技术属于养殖
,具体涉及到一种鸭蛋识别定位方法。

技术介绍

[0002]蛋鸭养殖总体呈“小规模、大群体”的特点,巡检和捡蛋均依赖人工,劳动强度大、人工成本高,工作环境差。故迫切需要一种可以代替人工,在鸭场进行鸭蛋拾取的机器人。开发鸭蛋拾取机器人的关键技术,是使其能够在不同干扰、遮挡覆盖等复杂环境下,对鸭蛋进行快速、准确检测和定位。
[0003]鸭蛋是一种特殊的目标检测对象,鸭场中,鸭蛋往往成簇出现,重叠、遮挡等情况普遍,给检测带来困难。鸭场环境复杂恶劣,常有泥土、秸秆等遮挡鸭蛋,同时亦有大量颜色相近的鸭羽覆盖,目标检测难度大,因此,对禽舍中鸭蛋自动识别的问题还需要进行深入研究。

技术实现思路

[0004]鉴于现有技术存在的问题,本专利技术提供一种鸭蛋识别定位方法。
[0005]本专利技术为解决上述技术问题所采用的技术方案为:
[0006]一种鸭蛋识别定位方法,包括以下步骤:
[0007]1)数据采集与预处理:使用羽毛、秸秆、泥沙或其他材料,模拟鸭舍的复杂环境,使用相机进行拍摄,所得数据中包括多角度、多位置、不同距离、不同遮挡形式的鸭蛋图像,采集分辨率为4000
×
3000像素的JPG格式图像2600张;
[0008]2)数据集划分:对采集的原始图像数据(2600张)按照6:2:2划分为训练集(1560张)、验证集(520张)、测试集(520张),为丰富现有训练集数据信息,防止模型出现过拟合等问题,对训练集样本使用如下数据增强方法:2.1)添加12%的高斯噪声。2.2)添加2.5%的椒盐噪声。2.3)设置图像增益a=0.3及a=0.5,改变图像亮度。经数据增强后,共得训练集数据7800张,为保证模型的准确性和环境适应性,训练集中包含各类影响识别的图片,具体分类包括遮挡和密集度两大类因素,其中遮挡分为无遮挡、相互遮挡、泥土遮挡、羽毛遮挡,密集度分为稀疏、中等、簇拥;
[0009]3)建立YOLOV7目标检测模型对数据进行检测:
[0010]4)对模型进行改进和训练,建立优化后的模型;
[0011]5)采用优化后的模型对鸭蛋进行识别定位。
[0012]优选地,所述步骤1)中,预处理方法为:
[0013]使用MakeSense软件,对鸭蛋图像进行标注,得到包含鸭蛋中心点坐标(x,y),标注框高度h、宽度w信息的txt文件;
[0014]选择对原始图像添加12%的高斯噪声、2.5%的椒盐噪声,通过增加冗余信息,降低图像平滑性;同时,为模拟鸭场的昏暗环境,在RGB通道利用转换公式:
[0015]g(i,j)=af(i,j)+b
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0016]式中g(i,j)为转换后图像像素灰度;f(i,j)为原始图像像素灰度;a为图像增益;b为图像偏置;
[0017]分别设置a=0.3,b=10;a=0.5,b=10;使得原始图像亮度降低,并且,在训练过程中,使用Mosaic方法,将多张图像随机裁剪并拼接,丰富待检测物体的背景。
[0018]优选地,所述步骤2)中,对训练集样本使用如下数据增强方法:2.1)添加12%的高斯噪声,2.2)添加2.5%的椒盐噪声,2.3)设置图像增益a=0.3及a=0.5,改变图像亮度。
[0019]优选地,所述步骤4)中,采用卷积注意力模块、深度可分离卷积网络、空间金字塔池化结构对模型进行改进和训练;卷积注意力模块包含通道注意力、空间注意力2个模块。
[0020]通道注意力模块,对输入尺寸为H
×
W
×
C的特征图,分别进行全局平均池化和全局最大池化,得到2个1
×1×
C的特征图,新的特征图,再经2层全连接网络后,进行相加,接着通过σ函数得到权重系数,权重系数与输入的特征图相乘,最终得到输出特征图,其计算方法如公式(2);
[0021]空间注意力模块,将通道注意力模块输出的特征图,作为输入,进行最大池化和平均池化,得到的2个H
×
W
×
1特征图在通道维度进行拼接,成为H
×
W
×
2,接着经过卷积降为一个通道,并通过σ函数生成空间权重系数,将输入特征图与权重相乘,即得到输出的特征图,其计算方法如公式(3)所示;
[0022]Mc(Fm)=σ(MLP(AvgPool(Fm))+MLP(MaxPool(Fm)))
ꢀꢀ
(2);
[0023]Ms(Fm)=σ(f7×7([AvgPool(Fm);MaxPool(Fm))])
ꢀꢀꢀ
(3);
[0024]式中Mc为通道注意力图,Ms为空间注意力图;Fm为输入特征图;σ为Sigmoid函数;f7×7为7
×
7卷积;MLP为Multilayer Perceptron神经网络;深度可分离卷积网络由深度卷积和逐点卷积两部分组成,第一部分为3
×
3的深度卷积,第二部分为1
×
1的逐点卷积,其浮点预算量(Floating Point Operations Per Second,FLOPs)公式如(4),对比标准卷积浮点运算量,计算公式如(5):
[0025]FLOPs1=Ci
×
K2×
Ho
×
Wo+Ci
×
Ho
×
Wo
×
Co
ꢀꢀꢀ
(4)
[0026]FLOPs2=Ci
×
K2×
Ho
×
Wo
×
Co
ꢀꢀꢀꢀꢀ
(5)
[0027]式中Ci、Co分别为输入、输出通道数,K为卷积核大小,Ho、Wo分别为输出特征图高度、宽度。二者浮点运算量之比为:当Co为4,K为3时,深度可分离卷积浮点运算量减少约空间金字塔池化结构:采用统一步长、不同尺寸卷积核,实现对图像区域的不同敏感性,最后通过Concat拼接并进行1
×
1卷积,使得特征融合,增强所得特征图表达能力,提高检测准确率;对空间金字塔池化结构进行改进,将每次池化后的输出作为下一个池化的输入,在保持原有优点的基础上,提升模型效率。
[0028]优选地,所述步骤4)中,改进模型过程中的评价指标为检测精度和检测速度两方面的指标进行评价。
[0029]1)检测精度,评估模型预测是否准确,计算公式如(3)所示;召回率(Recall),评估模型检测出目标数据的能力,计算公式如(4)所示;F1分数(F1 Score)是精确度与召回率的调和平均,是避免精确度或召回率出现单一极大值,用于综合反映整体的指标,计算公式如(5)所示;平均精度均值(mAP,Mean Average Precision)是衡量预测目标位置及类别算法的指标,对目标检测模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种鸭蛋识别定位方法,其特征在于,包括以下步骤:1)数据采集与预处理:使用羽毛、秸秆、泥沙或其他材料,模拟鸭舍的复杂环境,使用相机进行拍摄,所得数据中包括多角度、多位置、不同距离、不同遮挡形式的鸭蛋图像;2)数据集划分:对采集的原始图像数据划分为训练集、验证集、测试集,为丰富现有训练集数据信息,防止模型出现过拟合问题,对训练集样本数据增强,训练集中包含各类影响识别的图片,具体分类包括遮挡和密集度两大类因素,其中遮挡分为无遮挡、相互遮挡、泥土遮挡、羽毛遮挡,密集度分为稀疏、中等、簇拥;3)建立YOLOV7目标检测模型对数据进行检测:4)对模型进行改进和训练,建立优化后的模型;5)采用优化后的模型对鸭蛋进行识别定位。2.根据权利要求1所述的鸭蛋识别定位方法,其特征在于,所述步骤1)中,预处理方法为:使用MakeSense软件,对鸭蛋图像进行标注,得到包含鸭蛋中心点坐标(x,y),标注框高度h、宽度w信息的txt文件;选择对原始图像添加12%的高斯噪声、2.5%的椒盐噪声,通过增加冗余信息,降低图像平滑性;同时,为模拟鸭场的昏暗环境,在RGB通道利用转换公式:g(i,j)= a f(i,j) + b
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)式中g(i,j)为转换后图像像素灰度;f(i,j)为原始图像像素灰度;a为图像增益;b为图像偏置;分别设置a=0.3,b=10;a=0.5,b=10;使得原始图像亮度降低,并且,在训练过程中,使用Mosaic方法,将多张图像随机裁剪并拼接,丰富待检测物体的背景。3.根据权利要求1所述的鸭蛋识别定位方法,其特征在于,所述步骤2)中,对训练集样本使用如下数据增强方法:2.1)添加12%的高斯噪声,2.2)添加2.5%的椒盐噪声,2.3)设置图像增益a=0.3及a=0.5,改变图像亮度。4.根据权利要求1所述的鸭蛋识别定位方法,其特征在于,所述步骤4)中,采用卷积注意力模块、深度可分离卷积网络、空间金字塔池化结构对模型进行改进和训练;卷积注意力模块包含通道注意力、空间注意力2个模块。通道注意力模块,对输入尺寸为H
×
W
×
C的特征图,分别进行全局平均池化和全局最大池化,得到2个1
×1×
C的特征图,新的特征图,再经2层全连接网络后,进行相加,接着通过σ函数得到权重系数,权重系数与输入的特征图相乘,最终得到输出特征图,其计算方法如公式(2);空间注意力模块,将通道注意力模块输出的特征图,作为输入,进行最大池化和平均池化,得到的2个H
×
W
×
1特征图在通道维度进行拼接,成为H
×
W
×
2,接着经过卷积降为一个通道,并通过σ函数生成空间权重系数,将输入特征图与权重相乘,即得到输出的特征图,其计算方法如公式(3)所示;Mc(Fm)=σ(MLP(AvgPool(Fm))+MLP(MaxPool(Fm)))
ꢀꢀꢀꢀ
(2);Ms(Fm)=σ(f7×7([AvgPool(Fm);MaxPool(Fm))])
ꢀꢀꢀꢀ
(3);式中Mc为通道注意力图,Ms为空间注意力图;Fm为输入特征图;σ为Sigmoid函数;f7×7为7
×
7卷积;MLP为Multilayer Perceptron神经网络;深度可分离卷积网络由深度卷积和逐
点卷积两部分组成,第一部分为3
×
3的深度卷积,第二部分为1
×
1的逐点卷积,其浮点预算量公式如(4),对比标准卷积浮点运算量,计算公式如(5):FLOPs1=Ci
×
K2×
Ho
×
Wo+Ci
×
Ho
×
Wo
×
Co
ꢀꢀꢀꢀꢀ
(4)...

【专利技术属性】
技术研发人员:祝志慧何昱廷李沃霖马美湖王树才
申请(专利权)人:华中农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1