【技术实现步骤摘要】
一种基于特征金字塔的圣女果检测识别方法
[0001]本申请涉及计算机视觉图像识别
,更具体涉及深度学习领域中的基于卷积神经网络的目标检测方法。
技术介绍
[0002]圣女果作为我国主要的蔬菜作物之一,被广泛种植。成熟圣女果采摘需要消耗大量的人力、财力,而智能采摘机器人是减少生产成本、解放劳动力和提高作业效率的有效途径。果蔬的精准识别及定位是构建智能采摘视觉系统的先决条件之一,故所以圣女果的快速精准识别方法研究具有较大的研究意义和应用价值。
[0003]目前基于深度神经网络的圣女果检测识别方法在算法性能及准确度上都优于传统检测方法。按照检测识别的处理过程差异,基于深度神经网络的圣女果检测方法可分为两阶段检测方法和一阶段检测方法。两阶段方法拥有较高的准确度,但检测速度慢、计算成本高,而一阶段方法的优点在于检测速度快,但准确度不如两阶段方法。由于圣女果生长环境复杂,果实易被叶片遮挡,且果实密集粘连程度高、果实小,严重影响目标检测及定位的准确度,因此圣女果检测识别方法研究需重点解决以下问题:1)遮挡目标的特征缺失问题; ...
【技术保护点】
【技术特征摘要】
1.一种基于特征金字塔的圣女果检测识别方法,包括如下步骤:步骤1、构建主干网络,以核大小为1
×
1卷积、核大小为3
×
3卷积以及核大小为1
×
1卷积组成残差块结构为基础,利用残差结构较强的特征提取能力来获取不同尺度的圣女果特征图;主干网络分为5层,第一层C1由核大小为7
×
7卷积层、BN归一化层和Mish激活函数构成,C2至C5则分别由3、4、6、3个上述残差块组成;步骤2、构建混合膨胀卷积组件,由主干网络得到的C3、C4、C5特征图经过核大小为1
×
1卷积操作保留原有特征的同时统一通道数为256,此外C3、C4会分别进行核大小3
×
1、1
×
3卷积操作来捕捉图像中横向和纵向的特征,以此来增强模型的推理能力,改善目标遮挡问题;将上述C3、C4、C5处理后得到统一大小的特征图进行特征融合,并通过由三个膨胀率大小不同的3
×
3卷积层串联构成的混合膨胀卷积模块,以此增大特征感受野;为避免膨胀卷积出现网格效应,保证了信息的完整性,该组膨胀率的设计满足下式:M
i
=max[M
i+1
‑
2r
i
,M
i+1
‑
2(M
i+1
‑
r
i
),r
i
]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,膨胀率依次为[r1,...,r
i
,...,r
n
],M
i
定义为第i层两个非零值之间的最大距离,i∈[1,n]且M
n
=r
n
,式(1)的目地是让M2≤K,才能保证没有网格效应;步骤3、构建特征金字塔,特征层C3、C4、C5输入至混合膨胀卷积组件中得到输出特征f为基础;输出特征f经两次核大小为1
×
1卷积操作得到特征金字塔最顶层P7;输出特征f经一次核大小为3
×
3卷积操作得到特征金字塔P6;C5经核大小为1
×
1卷积操作得到的C5
’
与输出特征f统一通道数后融合得到特征f1,f1再经核大小为3
×
3卷积操作得到特征金字塔P5;C4经核大小为1
×
1卷积操作得到的C4
’
与特征f1两倍上采样结果进行特征融合得到f2,再由f2经核大小为3
×
3卷积操作得到特征金字塔P4;C3经核大小为1
×
1卷积操作得到的C3
’
与特征f2两倍上采样结果进行特征融合得到f3,再由f3经核大小为3
×
3卷积操作得到特征金字塔P3;步骤4、构建检测子网络,由目标分类子网络和边界框回归子网络构成,两个子网络都是由3个卷积核大小为3
×
3的卷积层构成的全连接结构,以特征金字塔的输出作为输入;分类子网络预测先验框和目标类别在每个位置上存在真实目标的概率,边界框回归子网会将每个先验框的4个空间位置的偏移量回归到附近的真实目标上;步骤5、使用K
‑
means聚类方法,确定合适的检测框尺寸,K
‑
means聚类步骤如下:S1.设定9个聚类中心点(即9组先验框宽高);S2.计算圣女果图像数据集中真实目标的标注框尺寸与每一个聚类中心点的距离d:d(box,centroid)=1
‑
IoU(box,centroid)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中,IoU为标注框与聚类中心宽高的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。