一种基于协调注意力机制的跨尺度大核卷积玉米叶片病害分割模型的构建方法及系统技术方案

技术编号:45296136 阅读:3 留言:0更新日期:2025-05-16 14:38
本发明专利技术属于智能农业领域,公开了一种基于协调注意力机制的跨尺度大核卷积玉米叶片病害分割模型的构建方法,该网络构造了大核卷积协同注意力模块(LK‑COA),其中利用大核卷积对全局建模获得全局特征,然后通过COA注意力提取更多的微小斑点,聚焦病斑分割。该模块叠加聚合具有获取局部边缘特征和细节特征的能力,同时增强了对小斑点的提取,缓解了斑点粘连现象。CSDecoder解码器设计用于将富含细节和边缘信息的浅层特征与语义特征较强的深层特征融合,然后进行精确恢复,最终输出精细分割结果。

【技术实现步骤摘要】

本专利技术属于但不限于智能农业领域,尤其涉及一种基于协调注意力机制的跨尺度大核卷积玉米叶片病害分割模型的构建方法及系统


技术介绍

1、玉米是我国重要的粮食作物之一,也是畜牧业和轻工业的重要原料。然而,受到气候变化和环境因素的影响,玉米叶片病害的发生频率逐年上升。叶片上的病害不仅会损害光合作用,影响玉米植株的生长,还会威胁到玉米的品质和产量,给种植者带来严重的经济损失。及时和准确地检测和诊断植物病害对于有效的疾病管理至关重要。传统的玉米叶片病害诊断方法依赖于人工观察症状和斑点,并结合专家的经验。然而,在大规模农场中,人工诊断的效率低、准确性差,且劳动强度大,操作难度高。因此,借助计算机视觉技术对玉米叶片病害进行自动化分析,不仅能提高病害诊断的效率,还能帮助种植者更准确地进行病害防治,从而显著提高玉米产量和质量。对于田间玉米叶部病害背景复杂,病害面积小且纹理丰富,病害症状相似等问题,严重影响了病害分割的准确性。

2、卷积神经网络(cnn)作为深度学习核心架构之一,经历了显著演变,已成为农业领域的通用框架。随后,基于cnn的分割网络开始出现,例如u-net(ronneberger等人,2015),pspnet(赵等,2017年)、segnet(sun等人,2019)和不同版本的deeplab(chen等人,2014年、2017年、2019年)。越来越多的研究者利用这些模型的强迁移能力和高精度来分析作物叶片和病害,并取得了良好的效果。其中,deeplab系列中的deeplab v3+以其强大的上下文信息处理能力和多尺度特征提取,适合于复杂场景下的精确分割,尤其是在大范围、具有丰富背景信息的图像中表现突出。u-net因其对细节的高保真恢复能力和在小样本数据上的优异表现,在需要精准分割的任务中(如小病斑、精细结构)尤为有效,且计算开销较低,适合资源受限的环境。近年来,一些改进的网络结合了deeplab和u-net优势,既能处理多尺度上下文信息,又能把握精准的细节恢复与边界精确度,而且具备高效计算与低资源消耗。其中,divyanth等(2023)从美国普渡大学农学研究与教育中心收集了1050片玉米病斑叶片,考察了segnet、u-net和deeplabv 3+的优缺点,最终选择u-net和deeplabv 3+分别用于玉米叶片和病斑的分割。yong yang(2023)等结合u-net优点提出改进的deeplabv3+模型,在编码阶段实现多尺度语义信息的提取,在解码阶段获得更丰富的空间信息,使得分割精度更高。然而,cnn在处理长距离的特征依赖和空间变换关系方面存在很大的局限性。全局特征的提取依赖堆叠的网络层数量。但层数越深,网络退化现象越严重。因此,基于cnn的分割网络很难在网络复杂度和精度之间取得平衡。

3、为了能够深入捕获全局特征同时更好的提取局部特征,一些研究人员开始应用自注意来代替卷积以实现全局特征提取,提出transformer模型。vit(dosovitskiy等人,2010)首先在计算机视觉领域采用了transformer,它摒弃了卷积层的使用,采用了纯粹的注意力机制。其他学者已经基于这种结构扩展了图像分割的领域,诸如语义分割模型segformer(xie等人,2021)和poolformer(yu等人,2022年)。这些模型验证了改进的transformer在分割任务中具有优于基于cnn的模型的上级性能。transformer可以在提供具有复杂背景的高分辨率(hr)自然图像时显式地对全局上下文信息进行建模。但没有考虑跨分辨率的信息传递,导致无法生成高质量的分割图像,导致网络的分割性能较差。事实上,全局特征图能够获得更多的粒度信息,同时包含更少的语义细节,特别是对于玉米叶病边缘。局部特征通常包含更强的语义表征信息,特别是对于那些难以分割的小目标疾病区域。因此,同时维护全局特征和局部特征对于构建玉米叶片病害分割模型起着重要作用。


技术实现思路

1、针对现有技术存在的问题,本专利技术提供了一种用于玉米叶片病害精确分割的轻量级基于协调注意力机制的跨尺度大核卷积分割网络lkcaformer。

2、本专利技术是这样实现的,一种用于玉米叶片病害精确分割的轻量级基于协调注意力机制的跨尺度大核卷积分割网络lkcaformer,该lkcaformer由两个主要部分组成:

3、(1)基于多层级大核卷积cnn和注意力模块的具有强大特征提取能力的编码器lk-coat;该编码器由三层lk-coa模块组成,每层超大卷积核的卷积操作提供全局特征,之后使用跳跃连接,将上层特征和得到的全局特征传入新设计协调注意力块中优化详细特征和特征聚合,以实现相同特征尺度下的粗特征表示和细特征表示;该编码器既提供了具有丰富局部细节和边缘信息的浅层特征,又提供了具有丰富全局语义的的深层特征,能够在下采样过程中准确提取叶片和病变的特征;

4、(2)跨尺度注意力解码器csdecoder;设计3个解码器分别接受编码器传入的包含高层次语义信息的低分辨率特征图计算细粒度高频全局信息的相似度权重,与上层解码器输出的不同尺度粗粒度低频特征图进行注意力计算,从而得到细粒度和粗粒度融合的高频特征图;之后将得到的特征图进行上采样操作,并且拼接起来,输入到mlp进行非线性处理,以弥补卷积操作对捕捉信息敏感度不足;之后融合浅层特征与深层特征,将聚合的特征图直接前馈到轻量级分割头。

5、进一步,该lkcaformer具体包括:

6、输入到网络的叶子图像的大小为512×512×3;在编码器中,输入图像首先通过由两个堆叠的3×3深度卷积组成的特征提取头进行有效的特征提取,其输出1/4原始图像大小的特征图,表示为f0;这减少了初始输入编码器的参数计数。然后,通过三层编码器获取原始图像{1/8,1/16,1/32}的特征图f1,f2,f3。每个特征提取的超大卷积核为k={(7,9,11),(11,13,15),(15,17,19)},通道维度为{32,64,128,160};在解码器阶段,将从编码器各层获得的特征图f1,f2,f3传递到解码器网络进行特征融合并上采样到f0空间大小,并与f0进行特征拼接,最后经过一个简单分割头模块输出512×512×ncls的分割结果;ncls表示预先设计的类别数,编码器包括一个特征提取头,三组大核卷积操作及协同注意力模块。

7、进一步,所述编码器为lk-coat编码器,通过大核卷积操作对全局信息建模,使用协同注意力机制捕捉局部特征,允许模型学习局部和全局特征之间的交互,从而获得更丰富的特征表示,并增强边缘纹理特征的提取,实现玉米叶片细粒度病害区域分割;

8、给定一个特征图f∈rc×h×w,其中c是输入通道的数量,h和w分别表示特征图的高度和宽度;为了减轻较大内核大小下深度卷积的高计算成本问题,将具有大内核的深度卷积分解为具有小内核的深度卷积,然后是具有相当大内核的扩展深度卷积;lk-coa模块的输出可通过使用等式1-5;

9、

10、其中本文档来自技高网...

【技术保护点】

1.一种基于协调注意力机制的跨尺度大核卷积玉米叶片病害分割模型的构建方法,其特征在于,包括以下步骤:

2.如权利要求1所述的用于玉米叶片病害精确分割的方法,其特征在于,输入叶片图像的大小为512×512×3,编码器首先通过由两个堆叠的三乘三深度卷积组成的特征提取头提取特征,输出为原图大小四分之一的特征图,从而有效减少编码器的参数数量。

3.如权利要求1所述的用于玉米叶片病害精确分割的方法,其特征在于,所述编码器由三层大核卷积和协同注意力模块组成,所述大核卷积通过将大内核分解为多个小内核卷积以及扩展深度卷积的方式,降低计算成本;同时结合协同注意力机制捕捉叶片边缘的高频特征以及病害斑点的细粒度特征。

4.如权利要求1所述的用于玉米叶片病害精确分割的方法,其特征在于,解码器包括三个跨尺度注意力解码模块,每个模块接收相同级别的编码器特征以及来自先前解码器的特征,通过注意力机制计算细粒度高频信息的相似度权重,并与粗粒度低频信息融合后上采样至原始空间大小。

5.如权利要求1所述的用于玉米叶片病害精确分割的方法,其特征在于,跨尺度注意力机制通过在输入特征图中引入核大小为正方形的深度卷积计算空间区域内的加权值,利用通道间的信息交互优化特征图的全局与局部特征提取能力,并通过卷积建立像素间的关系,降低高分辨率图像处理的内存开销。

6.如权利要求1所述的用于玉米叶片病害精确分割的方法,其特征在于,结合交叉熵损失和Dice损失设计损失函数,其中:

7.如权利要求1所述的用于玉米叶片病害精确分割的方法,其特征在于,通过设计的轻量级分割头模块将解码器输出的融合特征进行非线性处理,并直接生成与输入图像大小一致的分割结果图,所述分割结果包括多个预定义类别,每个类别表示一种病害类型或健康区域。

8.一种用于玉米叶片病害精确分割的轻量级分割系统,其特征在于,包括:

9.根据权利要求8所述的系统,其特征在于,所述编码器模块采用大核卷积操作对输入图像进行全局建模,并结合协同注意力机制捕捉空间和通道维度的局部特征。

10.根据权利要求8所述的系统,其特征在于,所述解码器模块利用跨尺度注意力机制对高级语义特征和低级空间特征进行交互融合,并通过逐步上采样恢复图像的原始分辨率,生成病害区域的精确分割图。

...

【技术特征摘要】

1.一种基于协调注意力机制的跨尺度大核卷积玉米叶片病害分割模型的构建方法,其特征在于,包括以下步骤:

2.如权利要求1所述的用于玉米叶片病害精确分割的方法,其特征在于,输入叶片图像的大小为512×512×3,编码器首先通过由两个堆叠的三乘三深度卷积组成的特征提取头提取特征,输出为原图大小四分之一的特征图,从而有效减少编码器的参数数量。

3.如权利要求1所述的用于玉米叶片病害精确分割的方法,其特征在于,所述编码器由三层大核卷积和协同注意力模块组成,所述大核卷积通过将大内核分解为多个小内核卷积以及扩展深度卷积的方式,降低计算成本;同时结合协同注意力机制捕捉叶片边缘的高频特征以及病害斑点的细粒度特征。

4.如权利要求1所述的用于玉米叶片病害精确分割的方法,其特征在于,解码器包括三个跨尺度注意力解码模块,每个模块接收相同级别的编码器特征以及来自先前解码器的特征,通过注意力机制计算细粒度高频信息的相似度权重,并与粗粒度低频信息融合后上采样至原始空间大小。

5.如权利要求1所述的用于玉米叶片病害精确分割的方法,其特征在于,跨尺度注意力机制通过在输入...

【专利技术属性】
技术研发人员:姜新华胡健高聚林于晓芳白洁
申请(专利权)人:内蒙古农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1