一种基于计算机视觉半监督伪标签学习的小麦头检测方法技术

技术编号:30523645 阅读:36 留言:0更新日期:2021-10-27 23:08
本发明专利技术公开了一种基于计算机视觉半监督伪标签学习的小麦头检测方法,其特征在于,所述方法包括:训练不同的小麦头检测模型和半监督伪标签学习策略。这种方法具有在各种场景下小麦识别的高鲁棒性和高精确度,能实现智能识别小麦头、以减少人力的消耗、提高识别效率。提高识别效率。提高识别效率。

【技术实现步骤摘要】
一种基于计算机视觉半监督伪标签学习的小麦头检测方法


[0001]本专利技术涉及人工智能、智慧农业
,具体是一种基于计算机视觉半监督伪标签学习的小麦头检测方法。

技术介绍

[0002]小麦是全球性的粮食作物,随着我国对农业现代化的推进,用现代人工智能技术来提高小麦产量,辅助农业生产管理成为一个重要的探索性问题。传统农业的种植完全依靠人力的工作,这是一个极其耗时耗力的过程,而且整个过程无法持续保持高效工作且不出错,另外,传统农业由于无法实时监管农作物的生长情况,一定程度上也影响了农作物的产量。在推进农业现代化的过程中,利用智能化算法来实现自动监测小麦的生长情况,能够促使传统农业加快迈向现代化种植、智能化管理的新农业时代。在计算机视觉领域,尽管经过众多学者的多年研究,目标检测算法有了很大的进步,但在实际场景中仍然具有很大的挑战,诸如不同地域的小麦品种不同、性状多样、生长周期不一致等,因此构建一个能够在不同场景都保持高鲁棒性和高精确度的检测模型至关重要。

技术实现思路

[0003]本专利技术的目的是针对现有技术的不足,而提供一种基于计算机视觉半监督伪标签学习的小麦头检测方法。这种方法具有在各种场景下小麦识别的高鲁棒性和高精确度,能实现智能识别小麦头、以减少人力的消耗、提高识别效率。
[0004]实现本专利技术目的的技术方案是:
[0005]一种基于计算机视觉半监督伪标签学习的小麦头检测方法,所述方法包括:训练不同的小麦头检测模型和半监督伪标签学习策略,其中,
[0006]1)训练不同的小麦头检测模型为:训练不同的基于监督训练方式的第一小麦头检测模型和第二小麦头检测模型,训练小麦头检测模型所使用的数据集是全球小麦头检测数据集,它是由七个国家的九个研究所主导完成的数据集,包括东京大学、法国国家农业科学研究所、法国营养与环境研究所、法国技术研究机构Arvalis、瑞士苏黎世联邦理工学院、加拿大萨斯喀彻温大学、澳大利亚昆士兰大学、中国南京农业大学和英国洛桑研究所,全球小麦头检测数据集用于小麦头检测的通用解决方案,用来估计小麦头的数量和大小,在野外图像中进行准确的小麦头检测十分具有挑战性,小麦的重叠、外界因素,如风吹会造成照片模糊不清,以及许多不可预知的问题都会使识别单个小麦头变得困难,此外,小麦的外观会因成熟度、颜色、基因型和头部方向、种植密度而存在巨大差异,同时还要考虑世界各地域种植不同的小麦品种,为了让小麦检测模型在不同检测环境下具备更好的泛化性能,选取全球小麦头检测数据集中来自欧洲地区的法国、英国和瑞士、北美地区的加拿大的3000多张图像作为训练数据集,选取全球小麦头检测数据集中来自澳大利亚,日本和中国的1000张不同地域不同品种的小麦头图像作为测试数据集,第一小麦头检测模型以yolov5s为基准模型,训练过程如下:
[0007]1‑
1)训练样本从全球小麦头检测数据集的训练集部分进行批量选取,每批次随机读取n张图片,n的数值任意选择;
[0008]1‑
2)读取图片后进行尺度缩放为640
×
640像素尺寸;
[0009]1‑
3)对所有批量图片进行数据增广,包括变换颜色空间、图片旋转、随机平移、翻转、Mosaic、仿射变换;
[0010]1‑
4)经过数据增广后的图片批量输入yolov5s网络模型,预测得到图片中的目标类别和位置信息,包括目标物体类别、预测边界框中心点坐标、宽、高,接着把第一小麦头检测模型的预测值与输入图片的目标标签通过损失函数进行损失计算,计算得到的损失值会通过反向传播算法将梯度回传给网络,进行网络参数的迭代更新,通过这样的学习模式,让模型迭代地去学习识别目标物体,不断拟合真实数据的分布,旨在训练得到一个最佳性能的识别模型,其中,第一小麦头检测模型的分类损失函数采用Focal loss损失函数,如公式(1)所示:
[0011][0012]其中,L
cls
代表分类损失函数,α和γ是损失函数的超参数,γ用于调节容易样本与困难样本的损失,使得损失函数能够更关注困难样本,α用于平衡正负样本的不均匀性,代表第一小麦头检测模型的分类预测值,介于0到1之间,
[0013]分类损失函数的作用在于不断地对目标物体类别的预测进行优化,回归损失函数则是不断地对目标物体位置坐标的预测进行优化,不断拟合预测的边界框的中心点坐标和宽、高,但是,回归任务只对正样本进行优化,不对负样本进行迭代优化,因为负样本不存在目标框,第一小麦头检测模型采用GIoU损失函数作为回归损失函数,如公式(2)所示:
[0014][0015]其中,L
loc
代表回归损失函数,A代表预测边界框的面积,B代表目标真实标注框的面积,C代表能够将A和B包围的最小矩形的面积,IoU
AB
代表预测边界框A和目标真实标注框的面积交并比,C/(A∪B)代表最小包围矩形C的面积减去A预测框与B真实标注框面积的并集的差值;
[0016]第二小麦头检测模型以EfficientDet作为基准模型,对于以往的多尺度特征融合方法,例如特征金字塔网络、路径聚合网络等方法只是对特征进行简单的相加,然而不同特征的分辨率是不同的,它们对融合后的特征的贡献程度也是不同的,因此EfficientDet引入了加权双向特征金字塔网络,结合可学习的权重来感知不同特征的重要性,同时多次进行自上而下和自下而上的多尺度特征融合,第二小麦头检测模型包括特征提取子网络、加权双向特征金字塔子网络和分类回归子网络,组成网络的移动翻转瓶颈卷积子模块和双向特征金字塔子模块定义如下:
[0017]移动翻转瓶颈卷积子模块的输入是通道维度是C的特征向量,首先经过一个1
×
1卷积层进行升维、并顺序经过批归一化层、swish激活函数、5
×
5深度可分离卷积层、批归一化层、swish激活函数,然后分成两个分支,第一个分支设有全局平均池化层、1
×
1卷积层、swish激活函数、1
×
1卷积层、sigmoid激活函数,第二个分支设有1
×
1卷积层进行降维、批归一化层、dropout函数,最后将模块的输入向量和第二分支的输出向量进行残差连接作为
模块的最终输出;
[0018]双向特征金字塔子模块的输入是特征提取网络的C3、C4、C5三层特征层的输出向量以及C5特征向量经过两次池化的C6、C7特征向量,首先C7特征向量进行上采样与C6特征向量进行相加并经过一个3
×
3卷积层得到中间特征向量1,中间特征向量1进行上采样与C5特征向量进行相加并经过一个3
×
3卷积层得到中间特征向量2,中间特征向量2进行上采样与C4特征向量进行相加并经过一个3
×
3卷积层得到中间特征向量3,中间特征向量3进行上采样与C3特征向量进行相加并经过一个3
×
3卷积层得到P3特征向量,P3特征向量进行下采样与C4层的中间特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于计算机视觉半监督伪标签学习的小麦头检测方法,其特征在于,所述方法包括:训练不同的小麦头检测模型和半监督伪标签学习策略,其中,1)训练不同的小麦头检测模型为:训练不同的基于监督训练方式的第一小麦头检测模型和第二小麦头检测模型,训练小麦头检测模型所使用的数据集是全球小麦头检测数据集,全球小麦头检测数据集用来估计小麦头的数量和大小,选取全球小麦头检测数据集中来自欧洲地区的法国、英国和瑞士、北美地区的加拿大的3000多张图像作为训练数据集,选取全球小麦头检测数据集中来自澳大利亚,日本和中国的1000张不同地域不同品种的小麦头图像作为测试数据集,第一小麦头检测模型以yolov5s为基准模型,训练过程如下:1

1)训练样本从全球小麦头检测数据集的训练集部分进行批量选取,每批次随机读取n张图片,n的数值任意选择;1

2)读取图片后进行尺度缩放为640
×
640像素尺寸;1

3)对所有批量图片进行数据增广,包括变换颜色空间、图片旋转、随机平移、翻转、Mosaic、仿射变换;1

4)经过数据增广后的图片批量输入yolov5s网络模型,预测得到图片中的目标类别和位置信息,包括目标物体类别、预测边界框中心点坐标、宽、高,接着把第一小麦头检测模型的预测值与输入图片的目标标签通过损失函数进行损失计算,计算得到的损失值会通过反向传播算法将梯度回传给网络,进行网络参数的迭代更新,其中,第一小麦头检测模型的分类损失函数采用Focal loss损失函数,如公式(1)所示:其中,L
cls
代表分类损失函数,α和γ是损失函数的超参数,代表第一小麦头检测模型的分类预测值,介于0到1之间,第一小麦头检测模型采用GIoU损失函数作为回归损失函数,如公式(2)所示:其中,L
loc
代表回归损失函数,A代表预测边界框的面积,B代表目标真实标注框的面积,C代表能够将A和B包围的最小矩形的面积,IoU
AB
代表预测边界框A和目标真实标注框的面积交并比,C/(A∪B)代表最小包围矩形C的面积减去A预测框与B真实标注框面积的并集的差值;第二小麦头检测模型以EfficientDet作为基准模型,第二小麦头检测模型包括特征提取子网络、加权双向特征金字塔子网络和分类回归子网络,组成网络的移动翻转瓶颈卷积子模块和双向特征金字塔子模块定义如下:移动翻转瓶颈卷积子模块的输入是通道维度是C的特征向量,首先经过一个1
×
1卷积层进行升维、并顺序经过批归一化层、swish激活函数、5
×
5深度可分离卷积层、批归一化层、swish激活函数,然后分成两个分支,第一个分支设有全局平均池化层、1
×
1卷积层、swish激活函数、1
×
1卷积层、sigmoid激活函数,第二个分支设有1
×
1卷积层进行降维、批归一化层、dropout函数,最后将模块的输入向量和第二分支的输出向量进行残差连接作为模块的最终输出;
双向特征金字塔子模块的输入是特征提取网络的C3、C4、C5三层特征层的输出向量以及C5特征向量经过两次池化的C6、C7特征向量,首先C7特征向量进行上采样与C6特征向量进行相加并经过一个3
×
3卷积层得到中间特征向量1,中间特征向量1进行上采样与C5特征向量进行相加并经过一个3
×
3卷积层得到中间特征向量2,中间特征向量2进行上采样与C4特征向量进行相加并经过一个3
×
3卷积层得到中间特征向量3,中间特征向量3进行上采样与C3特征向量进行相加...

【专利技术属性】
技术研发人员:钟必能张子凯郑耀宗梁启花李先贤
申请(专利权)人:广西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1