当前位置: 首页 > 专利查询>常州大学专利>正文

一种基于深层聚合掩码的细粒度图像识别方法技术

技术编号:42147334 阅读:20 留言:0更新日期:2024-07-27 00:02
本发明专利技术涉及图像识别技术领域,尤其涉及一种基于深层聚合掩码的细粒度图像识别方法,包括,获取模型训练用的细粒度数据集,按比列划分训练集、验证集、测试集;对训练集的图像进行预处理;通过深层聚合掩码生成网络对训练集的图像的不同尺度的语义及空间信息进行融合,生成与原图尺寸相同的掩码模板;经过深层聚合掩码生成网络增强后的图像送入到Vit模型中;使用测试集测试基于深层聚合掩码的细粒度图像识别模型的性能,得到最终的模型识别正确率。本发明专利技术通过DLAM对图像的不同尺度的语义及空间信息进行融合,对原图特征进行增强,细化了显著判别区域的特征粒度,再将增强后的图片输入后续的Vit网络进行特征提取及识别,有效提高了模型识别的准确率。

【技术实现步骤摘要】

本专利技术涉及图像识别,尤其涉及一种基于深层聚合掩码的细粒度图像识别方法


技术介绍

1、图像识别一般可以分为两大类,分别是粗粒度图像识别和细粒度图像识别。粗粒度图像识别也可以称之为传统的计算机图像识别,对象主要是指的是不同类别的目标进行识别,是对具有明显类别区分度的品类的识别。在这种情况下,所要识别的目标对象具有明显的外观差异,不同类别的个体之间差异较大,而同一类别内的差别很小,因此识别起来非常容易。随着计算机技术的日益成熟,人们已经不仅仅满足于对图像的粗粒度识别分类,对图像识别有了更高的追求,想要知道对象的更精细划分,由此引出了细粒度图像识别这一概念。

2、细粒度图像识别旨在区分出待识别物体中某一大类的不同小类,是对目标子类更精细的划分。由于同一品种下大致特征相似,类间差异性大,而所处的背景却五花八门,加之不同光照、遮挡、姿态变化等因素的影响,给细粒度图像识别带来了巨大的挑战。

3、目前,针对细粒度图像识别任务已经提出了模型或网络vision transformer,但是vision transformer模型(vit模型)在特本文档来自技高网...

【技术保护点】

1.一种基于深层聚合掩码的细粒度图像识别方法,其特征在于,包括以下步骤,

2.根据权利要求1所述的基于深层聚合掩码的细粒度图像识别方法,其特征在于,在步骤S3中,所述深层聚合掩码生成网络包括分层深度聚合和迭代深度聚合,所述分层深度聚合用于对于同一阶段内不同通道或节点进行深度融合,所述迭代深度聚合对不同阶段以残差连接的方式进行融合。

3.根据权利要求2所述的基于深层聚合掩码的细粒度图像识别方法,其特征在于,所述深层聚合掩码生成网络中先通过分层深度聚合模块依次对网络输入原图x进行4倍、8倍、16倍、32倍下采样,再通过迭代深度聚合模块对不同阶段以残差连接的方式进行融合...

【技术特征摘要】

1.一种基于深层聚合掩码的细粒度图像识别方法,其特征在于,包括以下步骤,

2.根据权利要求1所述的基于深层聚合掩码的细粒度图像识别方法,其特征在于,在步骤s3中,所述深层聚合掩码生成网络包括分层深度聚合和迭代深度聚合,所述分层深度聚合用于对于同一阶段内不同通道或节点进行深度融合,所述迭代深度聚合对不同阶段以残差连接的方式进行融合。

3.根据权利要求2所述的基于深层聚合掩码的细粒度图像识别方法,其特征在于,所述深层聚合掩码生成网络中先通过分层深度聚合模块依次对网络输入原图x进行4倍、8倍、16倍、32倍下采样,再通过迭代深度聚合模块对不同阶段以残差连接的方式进行融合,并且融合方式采样自底向上的方式。

4.根据权利要求3所述的基于深层聚合掩码的细粒度图像识别方法,其特征在于,所述分层深度聚合中,节点间以树结构的方式排列,并对相同深度的节点以残差连接的方式进行融合,且聚合节点的输出特征将作为下一阶段的输入,分层深度聚合函数其中,n为聚合节点,r和l的定义如下式表示:

5.根据权利要求3所述的基于深层聚合掩码的细粒度图像识别方法,其特征在于,所述迭代深度聚合用于对多尺度的一系列特征层x1,…,xn进行迭代深度聚合的函数i,用如下式表示:其中,n代表聚合节点。

6.根据权利要求5所述的基于深层聚合掩码的细粒度图像识别方法,其特征在于,所述迭代深度聚合采用单层卷积、批量归一化、非线性层组合的结构,对同一阶段的不同卷积块以残差连接的方式进行聚合,其表达形式如下式所示:n(x1,…,xn)=σ(batchnorm(∑wixi+b)+xn),其中,σ为非线性激活操作,wi与b为卷积操作的权重。

7.根据权利...

【专利技术属性】
技术研发人员:李一芒鲁昊黄小虎
申请(专利权)人:常州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1