当前位置: 首页 > 专利查询>台州学院专利>正文

一种基于上下文校正掩码的自适应多尺度MLP网络的全自动辣椒叶片分割方法技术

技术编号:38328668 阅读:21 留言:0更新日期:2023-07-29 09:11
本发明专利技术属于计算机视觉的农作物叶片分割领域,具体是一种基于上下文校正掩码的自适应多尺度MLP网络(Adaptive multi

【技术实现步骤摘要】
一种基于上下文校正掩码的自适应多尺度MLP网络的全自动辣椒叶片分割方法


[0001]本专利技术属于计算机视觉的农作物叶片分割领域,具体是一种基于上下文校正掩码的自适应多尺度MLP网络(Adaptive multi

scale MLP network with context correction mask)的全自动辣椒叶片分割方法。
技术背景
[0002]中国是辣椒的最大生产国和消费国,种植面积占世界辣椒种植面积的37%。辣椒已经成为我们日常生活中重要的蔬菜。然而,辣椒是一种敏感脆弱的植物,辣椒叶片易受病害的侵袭,容易引起辣椒叶片的正面病害。植物叶片的特征可以反映生长情况,如叶面积、叶形状、叶数等。辣椒叶病直接反映辣椒的生长状况,直接导致辣椒产量和品质的下降。此外,辣椒叶病的发生也逐年增加。病叶图像是疾病检测与识别的主要依据。因此,病叶图像分割是疾病自动检测与识别的关键步骤,也是植物监测系统的必要组成部分。
[0003]传统的植物叶片分割方法包括基于分水岭的分割方法和基于阈值的分割方法,但却都采用半自动分割方式。分割费时费力,且分割准确定低,存在分割不足或过分割的问题。还有一些研究利用叶片形状特征进行分割。形状特征对识别部分闭塞的叶片有一定的帮助作用,但不适用于不规则和复杂的叶片研究。基于深度学习的方法在植物叶片分割中显示出比传统方法更强的优势。但是,由于背景、明暗度和角度的影响,在实际应用中这些模型的性能会有显著的下降。由于背景特征的存在导致训练的模型性能欠佳,当去除图像的背景特征时,疾病识别精度更高。在图像分割领域,具有对称编码器

解码器的U

Net已经成为最成功的网络框架之一。U

Net由特征信息的收缩路径和实现定位的对称扩展路径组成,在相同分辨率的编码器和解码器之间,通过跳跃链接将高层信息传递给网络。但是U

Net使用固定的小尺度卷积层来提取图像特征,无法获得全局和长期的语义信息。尽管基于Transformer的网络在提取全局信息方面显示出巨大的潜力。然而,由于其高计算要求,多层感知机(MLP)已被探索为自注意力机制的替代方法。有研究证明简单的基于MLP的架构可以在大规模的视觉任务中达到相当的性能。

技术实现思路

[0004]本专利技术的目的是提出一个用于辣椒叶分割的基于上下文校正掩码的自适应多尺度MLP网络。所提出的模型包括编码器模块、自适应多尺度MLP模块(AM

MLP)和解码器模块。
[0005]本专利技术的技术方案如下:
[0006]一种基于上下文校正掩码的自适应多尺度MLP网络的全自动辣椒叶片分割方法,其特征在于:由数据预处理、特征学习和预测三个部分组成。所述数据预处理包括对采集到的辣椒叶图像进行数据集划分和数据增强,方法包括直方图均衡用以提高对比度;灰度转换按一定变换关系改变每一个像素灰度值,使图像更加清晰;采用旋转、平移等技术,使数据集的数据得到扩充,并减小过拟合;所述特征学习即将经过预处理的辣椒叶图像输入到
基于上下文校正掩码的自适应多尺度MLP网络中得到权重文件,该模型包括编码器、解码器和自适应多尺度MLP模块(AM

MLP)。AM

MLP模块融合了编码器和解码器对应层的特征,以减少编码器和解码器之间的特征差异;所述预测包含加载权重文件,将待分割的辣椒叶图像输入到基于上下文校正掩码的自适应多尺度MLP网络中,实现对辣椒叶的准确分割,具体包括以下步骤:
[0007]步骤1、将所有的辣椒叶原数据拆分为训练集和验证集,训练集的数据个数定义为n,验证集的数据个数定义为m;
[0008]步骤2、将预处理过的图像传入编码器网络,经过5个卷积层进行特征提取得到特征映射F1;
[0009]步骤3、将编码器中第1层到第5层的多尺度特征融合到MP

Mask模块中,生成粗掩码F2;
[0010]步骤4、将F1和F2输入到到上下文关系解码器(CRD)中,学习第5层的边缘信息,得到特征映射F3;
[0011]步骤5、将每个编码器的输出特征映射输入到自适应多尺度MLP模块(AM

MLP),用于获取全局特征和局部特征;
[0012]步骤6、将上下文关系解码器输出的特征映射F3和AM

MLP模块获取的多尺度信息输入到解码器网络中,进行上采样生成掩码,再输入到CRD模块中并进行上采样得到特征映射F4;
[0013]步骤7、重复步骤6,得到最终辣椒叶分割模型。
[0014]本专利技术提供的一种基于上下文校正掩码的自适应多尺度MLP网络的全自动辣椒叶片分割方法,其特征在于:所述步骤3中,所述多路径掩码算法(MP

mask),提取出精确的边界信息,为CRD模块生成掩码。对于编码器中从第5层到第2层的特征映射F
i
,它们首先通过一个1
×
1卷积运算来抑制通道数,输出特征的通道数与编码器中第1层的通道数相同,我们使用速率为2的上采样操作,即:
[0015][0016]其中up(
·
)表示上采样算子,Conv1×1(
·
)是1
×
1卷积运算。然后我们将生成的特征和之前的特征映射F
i
‑1连接起来,最终的特征映射被写成:
[0017][0018]其中,σ(
·
)表示ReLU激活函数,e表示逐像素相乘操作。
[0019]第三,我们对4个上采样特征映射和编码器中第一层的特征映射进行加法运算,多尺度融合特征映射(MSFF)被写成:
[0020][0021]最后,我们将MSFF映射F
cat
和第一层的特征映射连接起来,生成的特征映射发送到3
×
3卷积块中。为了获得前景和背景区域的掩码,我们使用一个输出通道和一个下采样操作进行1
×
1卷积运算,可以写成:
[0022][0023][0024]其中,dn(
·
)表示下采样操作符,Conv3×3(
·
)是一个3
×
3卷积运算。
[0025]本专利技术提供的一种基于上下文校正掩码的自适应多尺度MLP网络的全自动辣椒叶片分割方法。其特征在于:所述步骤4中,所述多尺度上下文关系解码器算法(CRD)来增强分割目标边界特征和上下文信息。特别地,高特征映射F
i+1
首先采用非线性插值以2的速率进行上采样操作,并通过Sigmod激活函数。将新特征映射发送到1
×
1卷积块,输出通道号为1,可以写成:
[0026]F
up
=up(F
i+1
)
[0027]F
mask
=Conv1×1(σ(F
up
))
[0028]然后,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于上下文校正掩码的自适应多尺度MLP网络的全自动辣椒叶片分割方法,其特征在于:由数据预处理、特征学习和预测三个部分组成。所述数据预处理包括对采集到的辣椒叶图像进行数据集划分和数据增强,方法包括直方图均衡用以提高对比度;灰度转换按一定变换关系改变每一个像素灰度值,使图像更加清晰;采用旋转、平移等技术,使数据集的数据得到扩充,并减小过拟合;所述特征学习即将经过预处理的辣椒叶图像输入到基于上下文校正掩码的自适应多尺度MLP网络中得到权重文件,该模型包括编码器、解码器和自适应多尺度MLP模块(AM

MLP)。AM

MLP模块融合了编码器和解码器对应层的特征,以减少编码器和解码器之间的特征差异;所述预测包含加载权重文件,将待分割的辣椒叶图像输入到基于上下文校正掩码的自适应多尺度MLP网络中,实现对辣椒叶的准确分割,具体包括以下步骤:步骤1、将所有的辣椒叶原数据拆分为训练集和验证集,训练集的数据个数定义为n,验证集的数据个数定义为m;步骤2、将预处理过的图像传入编码器网络,经过5个卷积层进行特征提取得到特征映射F1;步骤3、将编码器中第1层到第5层的多尺度特征融合到MP

Mask模块中,生成粗掩码F2;步骤4、将F1和F2输入到到上下文关系解码器(CRD)中,学习第5层的边缘信息,得到特征映射F3;步骤5、将每个编码器的输出特征映射输入到自适应多尺度MLP模块(AM

MLP),用于获取全局特征和局部特征;步骤6、将上下文关系解码器输出的特征映射F3和AM

MLP模块获取的多尺度信息输入到解码器网络中,进行上采样生成掩码,再输入到CRD模块中并进行上采样得到特征映射F4;步骤7、重复步骤6,得到最终辣椒叶分割模型。2.根据权利要求1所述的一种基于上下文校正掩码的自适应多尺度MLP网络的全自动辣椒叶片分割方法,其特征在于:所述步骤3中,所述多路径掩码算法(MP

mask),用于提取出精确的边界信息,为CRD模块生成掩码。对于编码器中从第5层到第2层的特征映射F
i
,它们首先通过一个1
×
1卷积运算来抑制通道数,输出特征的通道数与编码器中第1层的通道数相同,我们使用速率为2的上采样操作,即:其中up(
·
)表示上采样算子,Conv1×1(
·
)是1
×
1卷积运算。然后我们将生成的特征和之前的特征映射F
i
‑1连接起来,最终的特征映射被写成:其中,σ(
·
)表示ReLU激活函数,e表示逐像素相乘操作。第三,我们对4个上采样特征映射和编码器中第一层的特征映射进行加法运算,多尺度融合特征映射(MSFF)被写成:最后,我们将MSFF映射F
cat
和第一层F
1out
的特征映射连接起来,生成的特征映射F
1en
输入
到带有3
×
3卷积块中。为了获得前景和背景区域的掩码,我们使用一个输出通道和一个下采样操作进行1
×
1卷积运算,可以写成:F
1en
=F
cat
e F
1out
其中,dn(
·
)表示下采样操作,Conv3×3(
·
)是一个3
×
3卷积运算。3.根据权利要求1所述的一种基于上下文校正掩码的自适应多尺度MLP网络的全自动辣椒叶片分割方法,其特征在于:所述步骤4中,所述多尺度上下文关系解码器算法(CRD)来增强分割目标边界特征和上下文信息。特别地,高特征映射F
i+1
首先采用非线性插值以...

【专利技术属性】
技术研发人员:刘花香付有瑶方江雄胡辉李鑫杨杰顾华奇廖明刘海燕贺心刚江侯涛
申请(专利权)人:台州学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1