一种基于深度目标检测的待采摘水果识别和定位方法技术

技术编号：20486422 阅读：31 留言：0更新日期：2019-03-02 19:35

本发明专利技术公开一种基于深度目标检测的待采摘水果识别和定位方法，包括以下步骤：图像采集。图像标注。数据集准备。特征提取，使用深度卷积神经网络CNN首先提取图像中的水果特征；使用VGG16作为特征提取的卷积神经网络。模型训练，对于所有训练样本首先提取每个卷积层上的特征图，对于抽取得到的特征图生成预测框，计算预测框中目标的类别，计算预测框和真实标注框之间的距离，在训练的过程中联合类别损失和预测框偏移损失作为训练的目标损失函数。基于上述完整的一次计算过程完成一次训练，当训练次数达到预定阈值或者损失小于预定阈值训练结束。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度目标检测的待采摘水果识别和定位方法
本专利技术涉及一种待采摘水果识别和定位方法，尤其涉及一种一种基于深度目标检测的待采摘水果识别和定位方法。
技术介绍
水果采摘作业所处自然环境的复杂性导致水果采摘仍然依靠人力，水果采摘环节所需的劳动力占整个生产过程投入劳动力的一半以上。随着我国农业从业人口的不断下降和人工成本的不断上升，水果自动化采摘对于解决水果产业中劳动力不足，保证水果适时采摘，提高采摘品质等方面具有重要的意义。因此，研究水果的自动采摘技术迫在眉睫。在水果的自然生长环境下快速而可靠的发现水果目标并确定待采摘水果的位置是实现自动采摘的关键技术。近年来，很多水果检测识别和定位算法相继提出。有基于超红图像和2R-G-B色差增强苹果特征，利用自适应阈值分割方法从图像中提取苹果区域；有研究了基于区域生长和颜色特征分割的方法，通过支持向量机识别提取的苹果颜色和形状特征，但是对于叶面遮挡引起的平均误差率较大；有应用残差变换绝对值和块匹配方法检测潜在的柑橘果实像素，构建一个支持向量机实现了较高的识别精确率，但是对于遮挡以及光照不均匀水果的识别表现不佳。在水果的自然生长环境下，果树的枝叶与果实、果实与果实之间存在复杂的相互位置关系，导致果实被枝叶或其他果实随机遮挡。现有算法的思路主要是针对待采摘水果的纹理、颜色和形态等人工设计并抽取特征，当在自然条件下遮挡情况和光照条件随场景变化而变化，与之对应的待采摘水果的特征也随之变化，因此基于人工特征设计的水果特征提取算法鲁棒性有待提高；自然生产条件下，获取的水果图像通常都存在遮挡或者光照不均匀等复杂背景，上述的水果识别...

【技术保护点】
1.一种基于深度目标检测的待采摘水果识别和定位方法，其特征在于，包括以下步骤：步骤1图像采集本图像采集基于普通的RGB图像实现，图像采集目标是实际自然生长环境下的待采摘水果；图像通过普通的单反相机获取，成像时模拟人工采摘的视角，保持相机的高度和水果目标基本持平，水果目标保持在图像中心位置；步骤2图像标注对步骤1中采集的原始数据进行人工标注；人工的将图像中的待采摘水果通过最小外接矩形标出，记录框处目标水果的类别，记录最小外接矩形在图片中左上角和右上角的顶点坐标；数据记录标注的格式与目前广泛使用的ImageNet图像数据集的标注格式相同；步骤3数据集准备将步骤1的原始图像和步骤2对应的标记数据共同作为一条可训练数据，将所有的可训练数据组成原始的数据集；将原始数据按照5:3:2的比例，人为随机的切分为3个子集，分别作为后续的检测模型的训练集、验证集和测试集；训练集、验证集和测试集基于原始的数据集，且三个子集合之间在图像空间上独立分布没有重复；步骤4网络训练对于步骤3中划分的训练集，使用深度卷积神经网络(Convolutionsl Neural Network，CNN)首先提取图像中的水果特征...

【技术特征摘要】
1.一种基于深度目标检测的待采摘水果识别和定位方法，其特征在于，包括以下步骤：步骤1图像采集本图像采集基于普通的RGB图像实现，图像采集目标是实际自然生长环境下的待采摘水果；图像通过普通的单反相机获取，成像时模拟人工采摘的视角，保持相机的高度和水果目标基本持平，水果目标保持在图像中心位置；步骤2图像标注对步骤1中采集的原始数据进行人工标注；人工的将图像中的待采摘水果通过最小外接矩形标出，记录框处目标水果的类别，记录最小外接矩形在图片中左上角和右上角的顶点坐标；数据记录标注的格式与目前广泛使用的ImageNet图像数据集的标注格式相同；步骤3数据集准备将步骤1的原始图像和步骤2对应的标记数据共同作为一条可训练数据，将所有的可训练数据组成原始的数据集；将原始数据按照5:3:2的比例，人为随机的切分为3个子集，分别作为后续的检测模型的训练集、验证集和测试集；训练集、验证集和测试集基于原始的数据集，且三个子集合之间在图像空间上独立分布没有重复；步骤4网络训练对于步骤3中划分的训练集，使用深度卷积神经网络(ConvolutionslNeuralNetwork，CNN)首先提取图像中的水果特征；使用VGG16作为特征提取的卷积神经网络，VGG16网络包含13个卷积(Conv)层、13个激活(Relu)层及4个池化(Pooling)层；设计扩边填充(Padding)处理，在卷积计算过程中对图像边缘进行像素值的补0，保证了Conv层输入和输出矩阵大小一致；对于输入的原始图像通过大小为3*3的卷积核进行卷积运算提取特征图(Featuremap)，卷积计算公式如式(1)所示；式中表示在第l卷积层的第j个特征图，表示在第l-1卷积层的第j个特征图...

【专利技术属性】
技术研发人员：邓杨敏，李亨，吕继团，
申请(专利权)人：江苏德劭信息科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人