一种基于机器视觉的立体定位方法技术

技术编号：41309417 阅读：7 留言：0更新日期：2024-05-13 14:53

本发明专利技术公开了一种基于机器视觉的立体定位方法，构建柑橘的训练和验证图像数据集，并且对所述图像数据中柑橘的脐部位置进行标注；构建卷积神经网络模型；通过柑橘的训练和验证图像数据集对卷积神经网络模型进行训练；采集当前作业的图像数据，并且根据训练好的卷积神经网络模型确定柑橘所在位置以及柑橘的脐部位置；根据所述柑橘的脐部位置确定采摘控制指令；机械臂根据所述采摘控制指令执行采摘动作。本发明专利技术利用深度学习的图像分析技术，实现了柑橘的脐部位置的高效识别和定位，解决了传统方法中的光照、遮挡、背景等干扰因素的问题；本发明专利技术控制机械从底部抓取柑橘的方式，实现了柑橘的无损采摘，提高了柑橘的采摘质量，避免了对柑橘的表皮造成损伤。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像目标检测，具体涉及一种基于机器视觉的立体定位方法。

技术介绍

1、柑橘是一种广泛种植和消费的水果，具有丰富的营养和多种功效。柑橘的采摘是柑橘生产的重要环节，直接影响柑橘的产量和品质。传统的柑橘采摘方式主要是人工采摘，存在以下几个问题：

2、1.人工成本高，人力资源紧缺，采摘效率低，难以满足大规模柑橘园的需求。

3、2.人工采摘容易对柑橘的表皮造成损伤，影响柑橘的外观和保鲜性，降低柑橘的市场价值。

4、3.人工采摘存在安全风险，柑橘树的高度和密度可能导致采摘工人的摔伤和划伤。

技术实现思路

1、有鉴于此，本专利技术的主要目的在于提供一种基于机器视觉的立体定位方法。

2、为达到上述目的，本专利技术的技术方案是这样实现的：

3、本专利技术实施例提一种基于机器视觉的立体定位方法，所述方法包括：

4、构建柑橘的训练和验证图像数据集，并且对所述图像数据中柑橘的脐部位置进行标注；

5、构建卷积神经网络模型；

6、通过柑橘的训练和验证图像数据集对卷积神经网络模型进行训练；

7、采集当前作业的图像数据，并且根据训练好的卷积神经网络模型确定柑橘所在位置以及柑橘的脐部位置；

8、根据所述柑橘的脐部位置确定采摘控制指令；

9、机械臂根据所述采摘控制指令执行采摘动作。

10、上述方案中，所述构建柑橘的训练和验证图像数据集，具体包括：

12、对原始图像数据进行预处理，包括裁剪、缩放、旋转、翻转、调整亮度、对比度、色彩饱和度操作。

13、上述方案中，所述对所述图像数据中柑橘的脐部位置进行标注，具体包括：采用矩形框或者多边形框对预处理后的原始图像数据进行标注，在原始图像数据中标出柑橘的脐部位置。

14、上述方案中，所述采集当前作业的图像数据，并且根据训练好的卷积神经网络模型确定柑橘所在位置以及柑橘的脐部位置，具体包括：

15、通过一层卷积层对当前作业的图像数据进行特征提取，获得输出结果s；

16、采用多次深度可分离卷积层记作k对输出结果s进行特征提取并且融合；

17、将融合后的结果进行最大池化层，再将其转化为一维数据进行全连接层得到离图片中心最近的位置信息作为最后结果。

18、上述方案中，所述通过一层卷积层对当前作业的图像数据进行特征提取，获得输出结果s，具体包括：根据sm×o1×w3×h3＝f(xm×n1×w1×h1*c1n1×o1×w2×h2)得到输出结果s；其中m为样本数量、n为输入通道数、o为输出通道数、w为特征的宽、h为特征的高、x为输入样本、s为输出结果、c为卷积核、*为卷积符号、f()为进行bn标准化后通过leaky-relu激活函数得到的结果。

19、上述方案中，所述采用多次深度可分离卷积层记作k对输出结果s进行特征提取并且融合，具体包括：根据sm×oj×wj×hj＝k(xm×ni×wi×hi)进行特征提取，其中，i∈(2,3,...,n)；根据k(x)＝f(f(xm×ni×wi×hi*c1×oi×3×3)*cn×oj×1×1)进行融合，其中，i,j分别表示输入和输出的层数且i＝j。

20、上述方案中，所述将融合后的结果进行最大池化层，再将其转化为一维数据进行全连接层得到离图片中心最近的位置信息作为最后结果，具体包括：根据y＝line(maxpool(x))、s`＝y*l＝[s1,s2,...,sn]得到最后结果，其中maxpool()对其进行最大池化，line()将二维特征转为一维特征，再通过l对其进行全连接层得到最后的位置信息。

21、上述方案中，所述方法还包括：根据l(θ)＝(s`-s)2/(2×m)确定损失函数，所述损失函数用于衡量模型预测的脐部位置与真实标注的脐部位置之间的差异。

22、与现有技术相比，本专利技术利用深度学习的图像分析技术，实现了柑橘的脐部位置的高效识别和定位，解决了传统方法中的光照、遮挡、背景等干扰因素的问题。

本文档来自技高网...

【技术保护点】

1.一种基于机器视觉的立体定位方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种基于机器视觉的立体定位方法，其特征在于，所述构建柑橘的训练和验证图像数据集，具体包括：

3.根据权利要求2所述的一种基于机器视觉的立体定位方法，其特征在于，所述对所述图像数据中柑橘的脐部位置进行标注，具体包括：采用矩形框或者多边形框对预处理后的原始图像数据进行标注，在原始图像数据中标出柑橘的脐部位置。

4.根据权利要求3所述的一种基于机器视觉的立体定位方法，其特征在于，所述采集当前作业的图像数据，并且根据训练好的卷积神经网络模型确定柑橘所在位置以及柑橘的脐部位置，具体包括：

5.根据权利要求4所述的一种基于机器视觉的立体定位方法，其特征在于，所述通过一层卷积层对当前作业的图像数据进行特征提取，获得输出结果S，具体包括：根据SM×O1×W3×H3＝f(XM×N1×W1×H1*C1N1×O1×W2×H2)得到输出结果S；其中M为样本数量、N为输入通道数、O为输出通道数、W为特征的宽、H为特征的高、X为输入样本、S为输出结果、C为卷积核、*为卷积符

6.根据权利要求5所述的一种基于机器视觉的立体定位方法，其特征在于，所述采用多次深度可分离卷积层记作K对输出结果S进行特征提取并且融合，具体包括：根据SM×Oj×Wj×Hj＝k(XM×Ni×Wi×Hi)进行特征提取，其中，i∈

7.根据权利要求6所述的一种基于机器视觉的立体定位方法，其特征在于，所述将融合后的结果进行最大池化层，再将其转化为一维数据进行全连接层得到离图片中心最近的位置信息作为最后结果，具体包括：根据y＝line(maxpool(x))、S`＝y*l＝[s1,s2,...,sn]得到最后结果，其中maxpool()对其进行最大池化，line()将二维特征转为一维特征，再通过l对其进行全连接层得到最后的位置信息。

8.根据权利要求7所述的一种基于机器视觉的立体定位方法，其特征在于，所述方法还包括：根据L(θ)＝(S`-S)2/(2×M)确定损失函数，所述损失函数用于衡量模型预测的脐部位置与真实标注的脐部位置之间的差异。

...

【技术特征摘要】

1.一种基于机器视觉的立体定位方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种基于机器视觉的立体定位方法，其特征在于，所述构建柑橘的训练和验证图像数据集，具体包括：

5.根据权利要求4所述的一种基于机器视觉的立体定位方法，其特征在于，所述通过一层卷积层对当前作业的图像数据进行特征提取，获得输出结果s，具体包括：根据sm×o1×w3×h3＝f(xm×n1×w1×h1*c1n1×o1×w2×h2)得到输出结果s；其中m为样本数量、n为输入通道数、o为输出通道数、w为特征的宽、h为特征的高、x为输入样本、s为输出结果、c...

【专利技术属性】
技术研发人员：刘晋胜，周靖，方世豪，李基照，许展沛，刘桂林，李家焕，
申请(专利权)人：广东石油化工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人