基于注意力机制的改进B-CNN鲨鱼种群细粒度分类方法技术

技术编号:42682672 阅读:42 留言:0更新日期:2024-09-10 12:32
本发明专利技术涉及计算机视觉中的细粒度水下鲨鱼图像分类领域,具体的说是基于注意力机制的改进B‑CNN鲨鱼种群细粒度分类方法,包括对鲨鱼图像数据预处理,将预处理后的鲨鱼图像数据输入到DM‑BCNN模型中进行训练,确定最佳的迭代次数后输出最佳的实验结果,对于DM‑BCNN模型,本发明专利技术特征提取器从VGG替换为ResNet,加深了网络结构,还提高了特征提取的效率和有效性,同时缓解了深层网络中的梯度消失问题,引入可变形卷积和NAM注意力机制增强了模型对图像几何变形的适应能力和对细粒度特征的关注度,替换原有损失函数为互通道损失函数有助于提升模型对不同通道特征的区分能力,增强对细粒度类别差异的敏感性。

【技术实现步骤摘要】

本专利技术是基于注意力机制的改进b-cnn鲨鱼种群细粒度分类方法,属于计算机视觉中的细粒度水下鲨鱼图像分类领域。


技术介绍

1、bilinear cnn(双线性卷积神经网络)是计算机视觉领域中用于细粒度图像分类的一种模型,尤其适用于弱监督场景。这种模型结构包括两个卷积网络(通常是预训练的vgg),它们分别提取图像的两个特征映射,并通过双线性汇合操作组合这些特征。双线性汇合通过计算两个特征映射的外积并对结果进行平均汇合来实现,生成的双线性特征向量接着用于分类任务。这种方法能够捕捉到图像中的细粒度特征,对于区分外观相似的类别非常重要。

2、尽管bilinear cnn在细粒度图像分类中表现出色,但它在水下鲨鱼分类识别上也存在一些缺陷。首先,双线性汇合产生的特征向量维度很高,这可能导致计算成本高和过拟合的风险。其次,由于模型主要捕捉全局特征的相互关系,加上由于水下图像背景暗淡和复杂,使其更加缺乏对局部特征和部位的解释性。此外,bilinear cnn的性能很大程度上依赖于其使用的基础卷积网络的质量,且高维特征的性质可能导致优化过程中的困难。

<本文档来自技高网...

【技术保护点】

1.基于注意力机制的改进B-CNN鲨鱼种群细粒度分类方法,其特征在于:所述方法包括;

2.根据权利要求1所述的基于注意力机制的改进B-CNN鲨鱼种群细粒度分类方法,其特征在于:所述对鲨鱼图像数据预处理包括对鲨鱼图像调整和裁剪,得到标准化的图像数据。

3.根据权利要求1或2所述的基于注意力机制的改进B-CNN鲨鱼种群细粒度分类方法,其特征在于:所述将预处理后的鲨鱼图像数据输入到DM-BCNN模型中进行训练包括:

4.根据权利要求3所述的基于注意力机制的改进B-CNN鲨鱼种群细粒度分类方法,其特征在于:所述将预处理后的鲨鱼图像数据输入到DRAM_ResNe...

【技术特征摘要】

1.基于注意力机制的改进b-cnn鲨鱼种群细粒度分类方法,其特征在于:所述方法包括;

2.根据权利要求1所述的基于注意力机制的改进b-cnn鲨鱼种群细粒度分类方法,其特征在于:所述对鲨鱼图像数据预处理包括对鲨鱼图像调整和裁剪,得到标准化的图像数据。

3.根据权利要求1或2所述的基于注意力机制的改进b-cnn鲨鱼种群细粒度分类方法,其特征在于:所述将预处理后的鲨鱼图像数据输入到dm-bcnn模型中进行训练包括:

4.根据权利要求3所述的基于注意力机制的改进b-cnn鲨鱼种群细粒度分类方法,其特征在于:所述将预处理后的鲨鱼图像数据输入到dram_resnet中进行处理包括:

5.根据...

【专利技术属性】
技术研发人员:蒋飞李雅琴闵卓卢晓莲
申请(专利权)人:武汉轻工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1