改进的Vision Transformer昆虫细粒度识别方法技术

技术编号:39940612 阅读:34 留言:0更新日期:2024-01-08 22:31
本发明专利技术涉及一种改进的Vision Transformer昆虫细粒度识别方法。首先,本发明专利技术采用了Vision Transformer框架,其独特的自注意力机制使其在图像分类任务中天然关注昆虫的区分部位,并且相较于传统卷积方法更加全局,最终通过层级结构捕捉层间重要特征提高性能。其次,本发明专利技术针对生态图像复杂背景问题,提出了改进的MLP结构,以增强不同自注意力头(Head)之间的聚合鲁棒表示能力。最后,提出了一种自监督任务损失优化模型收敛,鼓励模型从图像内学习空间关系,从而使得模型训练更加鲁棒。

【技术实现步骤摘要】

本专利技术昆虫分类学领域、计算机视觉方向图像分类领域以及森林保护领域,具体涉及一种改进的vision transformer昆虫细粒度识别方法。


技术介绍

1、昆虫是生态系统中的关键组成部分,对生态研究、农业和作物保护、疾病传播控制等方面具有重要作用。昆虫准确识别对于维护生态平衡、改善农业生产、保护人类健康、维护生物多样性和环境保护等方面都具有重要的意义。传统昆虫种类鉴定是由专家通过肉眼观察昆虫的形态特征来完成的。然而,这是一项费时费力且容易出错的工作,并且需要专业背景的支撑,成本较高。此外,部分昆虫(如蝴蝶)种类之间的相似性较高,使得识别任务变得更加困难。

2、在生物分类任务中,昆虫学家通常使用分类学检索表或dna测序方法对昆虫进行分类,该方法依赖于人工处理,且必须由训练有素的专业人员完成[1],不可避免产生局限性。在计算机分类任务中,昆虫识别方法主要可分为传统机器学习方法和深度学习方法两大类。在传统的机器学习方法中,采用人工设计的特征提取算子提取图像的固定特征,并使用分类算法对提取的特征进行分类,例如使用灰度共生矩阵提取特征后使用加权knn本文档来自技高网...

【技术保护点】

1.一种改进的Vision Transformer昆虫细粒度识别方法,其特征在于,首先,采用Vision Transformer框架处理图像数据,能够在每一层中同时对图像的所有位置进行处理,实现全局视野;其次,针对生态图像复杂背景问题,提出改进的MLP结构,以增强不同自注意力头之间的聚合鲁棒表示能力;最后,提出一种自监督任务损失优化模型收敛,鼓励模型从图像内学习空间关系,使得模型训练更加鲁棒。

2.根据权利要求1所述的改进的Vision Transformer昆虫细粒度识别方法,其特征在于,在模型训练前,对图像数据进行分类标注,并按照7:3比例划分训练集和测试集,训练集用来训...

【技术特征摘要】

1.一种改进的vision transformer昆虫细粒度识别方法,其特征在于,首先,采用vision transformer框架处理图像数据,能够在每一层中同时对图像的所有位置进行处理,实现全局视野;其次,针对生态图像复杂背景问题,提出改进的mlp结构,以增强不同自注意力头之间的聚合鲁棒表示能力;最后,提出一种自监督任务损失优化模型收敛,鼓励模型从图像内学习空间关系,使得模型训练更加鲁棒。

2.根据权利要求1所述的改进的vision transformer昆虫细粒度识别方法,其特征在于,在模型训练前,对图像数据进行分类标注,并按照7:3比例划分训练集和测试集,训练集用来训练模型,测试集用来评估模型性能;采用数据增强方法对训练集样本进行扩充。

3.根据权利要求2所述的改进的vision transformer昆虫细粒度识别方法,其特征在于,测试集评估模型性能,即测试过程中,首先,将测试集样本进行数据归约;然后,将归约后的数据输入到已经训练好的模型中进行分类,模型根据学到的特征和权重对每个测试样本进行分类预测;最后,将模型预测的结果与测试集样本的真实标签进行比对,输出测试分类结果。

4.根据权利要求1所述的改进的vision ...

【专利技术属性】
技术研发人员:黄世国李建祥李小林陈淑武
申请(专利权)人:福建农林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1