【技术实现步骤摘要】
一种用于农作物病害识别的轻量级注意力机制网络
[0001]本专利技术涉及深度学习领域,尤其是涉及一种用于农作物病害识别的轻量级注意力机制网络,属于深度学习模型在农作物病害识别领域的应用。
技术介绍
[0002]农作物的病害影响着农作物的生长,降低农作物的产量,影响品质。由于农业具有重要的地位,农作物病害对农作物又有着严重的危害,因此快速准确的识别农作物的病害变得尤为重要。
[0003]要解决农作物病害问题,一个关键的方面是快速精准的识别农作物的病害,然后再对症下药。农作物病害不好判别,对农作物病害准确高效的判断是主要的挑战。近些年,深度学习技术得到较快发展,其应用领域广泛。在图像识别领域,卷积神经网络网络取得十分不错的效果,能够有效提取图像的特征,对图像进行分类。研究人员提出各种各样的卷积神经网,比如VGGNet、GoogLeNet、ResNet等。VGGNet是一个相对较深的模型,网络结构也相对简单,并取得不错的效果。GoogLeNet中采用Inception模块进行搭建,该模块采用多分支的结构,使用多个卷积层提取 ...
【技术保护点】
【技术特征摘要】
1.一种用于农作物病害识别的轻量级注意力机制网络,其特征在于以MobileViT模型为基础加入的改进的注意力机制,在MobileViT模型的部分MobileViT块中加入通道注意力机制,在MobileViT模型的最后加入通道注意力机制和空间注意力机制;所述通道注意力机制基于CBAM注意力机制,还包括一维卷积;通道注意力机制用于分析图像通道间的关系,给每个通道一个权重,来获取关键信息,从而提升网络的性能;所述空间注意力机制基于CBAM注意力机制,还包括多分支网络结构、空洞卷积;所述多分支网络结构由不同大小的卷积核构建,所述空洞卷积层用于增加感受野;空间注意力机制用于分析图像空间之间的关系,给每个像素点一个权重,从而在空间维度获取重要的信息。2.如权利要求1所述一种用于农作物病害识别的轻量级注意力机制网络,其特征在于所述以MobileViT模型为基础加入的改进的注意力机制,使用PlantVillage公开数据集所有的数据进行训练测试,训练的方法具体如下:采用公开数据集PlantVillage训练模型,PlantVillage是一个公开的农作病害数据集,包含38个类别;将PlantVillage数据集随机按照6︰2︰2的比例划分成训练集、验证集和测试集;其中训练集用于模型的训练,验证集用于在训练过程中检验模型状态,测试集用于最后测试模型的效果;在模型训练过程中,训练集中的每个样本由输入图像和该图像对应的真实类别标签构成;将训练集中的样本数据输入到模型中,得到模型的预测输出,模型的输出为一个向量,假设有C个类别,那么会输出一个总共有C个元素的向量,每个位置代表这个类别的概率;输入图像的真实标签也为一个包含C个元素的向量,该向量的元素只有一个是1,其他都为0,为1的那个位置代表图像的真实类别标签;将模型输出的结果(即预测的标签)与输入图像的真实标签进行比较,通过交叉熵损失函数计算损失,交叉熵损失函数的计算公式为其中C为类别的个数,p
c
为取值为0或1的变量(如果c为真实类别,那么p
c
=1,否则p
c
=0),q
c
为模型预测类别c的概率;计算完损失之后,通过反向传播,计算模型参数的梯度,并采用AdamW优化器更新网络模型参数;在实际训练过程中,采用mini
‑
batch的方式,即每次输入一批样本数据到模型中,具体的训练过程如下所示:(1)输入一批图像样本数据到模型中;(2)通过模型计算出这批数据的预测类别;(3)将模型输出得到的预测类别和真实类别比较,通过交叉熵损失函数计算损失;(4)进行反向传播操作,计算模型参数的梯度,采用AdamW优化器更新网络模型参数;(5)重复上述步骤,当达到训练设定的次数时结束。3.如权利要求1所述一种用于农作物病害识别的轻量级注意力机制网络,其特征在于所述改进的注意力机制具体包括以下步骤:1)构建通道注意力机制,用于分析图像通道间的关系,给每个通道一个权重,获取关键信息,从而提升网络的性能;2)构建空间注意力机制,给每个像素点一个权重,对于输入的图像,通过全局平均池化和最大池化将通道信息进行压缩,使用不同大小的卷积核构建多分支网络,以更好的融合信息,提升网络的表征能力,捕获农作物病害信息;使用空洞卷积以增加感受野;将压缩后
的图像通过多个卷积核进行处理,结果相加融合,再通过sigmoid计算得到注意力分数;3)构建用于农作物病害识别的轻量级注意力机制网络,采用MobileViT模型作为基础模型,在MobileViT模型的部分MobileViT块中加入通道注意力机制,在MobileViT模型的最后加入通道注意力和空间注意力机制,实现更好地捕获通道信息和空间信息。4.如权利要求3所述一种用于农作物病害识别的轻量级注意力机制网络,其特征在于在步骤1)中,所述构建通道注意力机制的具体步骤为:假设输入的图像为其中H,W,C分别为图像的高、宽和通道数;通过全局平均池化和最大池化操作压缩图像的空间信息,分别得到通过全局平均池化和最大池化操作压缩图像的空间信息,分别得到其中和分别表示通道注意力机制中对图像在通道采用全局平均池化和最大池化得到的结果;在通道注意力中,全局平均池化的计算过程是针对图像的每个通道,每...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。