一种结合注意力互斥正则的图像分类方法技术

技术编号:37289376 阅读:17 留言:0更新日期:2023-04-21 00:12
本发明专利技术公开一种结合注意力互斥正则的图像分类方法,涉及图像处理技术领域,包括:导入图像;提取图像特征;提取图像特征包括挑选注意力图中指定数目的若干注意力通道;对图像特征进行分类;对图像特征进行分类包括利用图像分类模型的最终损失函数更新模型参数。优点在于,通过限制模型关注各注意力通道互不重叠的多个关键候选通道,引导模型关注图像目标的不同区域、并整合不同关键区域的信息,提高模型的性能,继而提高图像分类的准确性。继而提高图像分类的准确性。继而提高图像分类的准确性。

【技术实现步骤摘要】
一种结合注意力互斥正则的图像分类方法


[0001]本专利技术涉及图像处理
,具体涉及一种结合注意力互斥正则的图像分类方法。

技术介绍

[0002]图像分类是根据不同类别图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。目前的图像分类方法,通常采用神经网络模型作为手段,但是在神经网络模型的训练过程中,神经网络模型对图片多个目标区域的关注仍不够理想,例如图3中的第二列模型只关注单个区域等,模型性能有待优化。

技术实现思路

[0003]为了解决以上问题的一个或多个,提供一种结合注意力互斥正则的图像分类方法。
[0004]根据本专利技术的一个方面,提供了一种结合注意力互斥正则的图像分类方法,包括:
[0005]导入图像;
[0006]提取图像特征;
[0007]对图像特征进行分类;
[0008]所述对图像特征进行分类包括利用图像分类模型的最终损失函数更新模型参数。其有益效果是:结合注意力互斥正则的图像分类方法的训练阶段同时也是构建图像分类模型的过程,而在测试阶段,图像输入该模型后,可以得知所输入的图像类别。
[0009]在一些实施方式中,所述导入图像包括将用于训练的图像数据集输入图像分类模型中。所导入的训练图像数据集需包括不同类别的训练图像。其有益效果是:让图像分类模型在训练阶段学习不同类别的训练图像模式。
[0010]在一些实施方式中,所述提取图像特征包括将一张训练图像通过CNN网络提取图像特征,从而得到特征图。由于需根据所提取的图像特征进行区分不同类别的训练图像。其有益效果是:有助于区分不同类别的训练图像。
[0011]在一些实施方式中,所述提取图像特征包括先将所述特征图转为注意力图,挑选注意力图中指定数目的注意力通道。注意力图对应的是关注训练图像上的哪些区域。其有益效果是:有利于体现对训练图像不同区域的关注。
[0012]在一些实施方式中,所述提取图像特征还包括:
[0013]判断注意力通道是否为候选关键通道和限制候选关键注意力通道关注互不重叠的区域。其有益效果是:可以更好地根据图像特征来对图像进行分类。
[0014]在一些实施方式中,所述判断注意力通道是否为候选关键通道包括:
[0015]选取一个值作为阈值,若注意力通道的权重大于该阈值,则判断该注意力通道为候选关键通道。注意力通道所对应的权重越大说明注意力通道对应的训练图像区域越重要。其有益效果是:有助于选取候选关键区域。
[0016]在一些实施方式中,所述限制注意力通道关注互不重叠的区域包括:
[0017]计算注意力互斥正则损失函数,所述注意力互斥正则损失函数根据以下公式进行计算:
[0018][0019]其中,L
AME
为注意力互斥正则损失函数,M
c1
为注意力热区域图的第一注意力通道,M
c2
为注意力热区域图的第二注意力通道,W为注意力热区域图的宽,H为注意力热区域图的高。不同的注意力通道对应图像不同的区域。其有益效果是:可以关注到不同的区域,有利于整合各候选关键区域的信息。
[0020]在一些实施方式中,所述对图像特征进行分类还包括:
[0021]对所述注意力图和特征图执行特征融合操作得到图像的最终特征;
[0022]对图像的最终特征执行多分类操作,得到输入图像的类别;
[0023]计算图像分类模型的最终损失函数。其有益效果是:根据所得到的图像特征对图像分类。
[0024]在一些实施方式中,图像分类模型的最终损失函数包括注意力互斥正则损失函数和交叉熵损失函数。其有益效果是:计算总损失函数可以用于更新图像分类模型的参数。
[0025]根据本申请的另一个方面,提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时所述的一种结合注意力互斥正则的图像分类方法的步骤。其有益效果是:运用所述计算机程序对训练图像进行分类。
[0026]本专利技术的结合注意力互斥正则的图像分类方法,模型关注到图像目标的不同区域,通过限制模型关注各注意力通道互不重叠的多个关键候选区域,并整合各候选关键区域的信息,提高模型的性能,继而提高图像分类的准确性。
附图说明
[0027]图1为本专利技术一实施方式的结合注意力互斥正则的图像分类方法的训练流程示意图;
[0028]图2为本专利技术一实施方式的结合注意力互斥正则的图像分类方法的测试流程示意图;
[0029]图3为运用本专利技术方法与现有技术对相同原始图像得出的注意力热区域图的对比图。
具体实施方式
[0030]下面结合附图对本专利技术作进一步详细的说明。
[0031]图1

2示意性地显示了根据本专利技术的一种实施方式的结合注意力互斥正则的图像分类方法。如图所示,该方法包括:
[0032]导入图像;
[0033]提取图像特征;
[0034]提取图像特征包括挑选注意力图中指定数目的若干注意力通道;
[0035]对图像特征进行分类;
[0036]对图像特征进行分类包括利用图像分类模型的最终损失函数更新模型参数。
[0037]导入图像为将筛选好的图像数据集导入训练模型。图像数据集的类别包括但不限于:汽车类、鸟类和飞机类图像。
[0038]提取图像特征为将图像数据集里的其中一张图像通过骨干网络提取特征,得到特征图。可选的,骨干网络可以为VGG网络或Resnet网络或其他CNN网络。
[0039]本实施例中训练图像尺寸为200
×
200,由于图像为RGB格式,因此图像在模型训练过程时实则是200
×
200
×
3的矩阵。
[0040]由于图像所对应的矩阵计算量较大,因此通过层层卷积操作压缩成尺寸较小的特征图。压缩后特征图所对应的矩阵大小为图像所对应矩阵大小的本实施例中将图像经过上述处理后压缩成一个7
×7×
256矩阵的特征图。
[0041]挑选注意力图中指定数目的若干注意力通道包括:
[0042]将特征图依次经过卷积层和RELU激活函数层得到注意力图。卷积层的卷积核的步幅为1,数目为64,卷积核的尺寸为3
×
3。
[0043]注意力图所对应的实则为一个三维矩阵,三维矩阵具有长度、宽度和高度。注意力图通道数目为注意力图所对应三维矩阵的高度。
[0044]将注意力图的各个注意力通道权重作为概率,挑选指定数目的若干注意力通道。所挑选的注意力通道数目需小于特征图的通道数目。注意力通道数目取值范围为3至10,所选取的数值必须为整数。各注意力通道体现为训练图像的不同区域。若注意力通道权重越大说明该注意力通道越重要。
[0045]提取图像特征还包括判断注意力通道是否为候选关键通道和限制候选关键注意力通道关注互不重叠的区域。
[0046]判断注意力通道是否为候选关键通道进一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结合注意力互斥正则的图像分类方法,其特征在于,包括:导入图像;提取图像特征;对图像特征进行分类;所述对图像特征进行分类包括利用图像分类模型的最终损失函数更新模型参数。2.根据权利要求1所述的一种结合注意力互斥正则的图像分类方法,其特征在于,所述导入图像包括将用于训练的图像数据集输入图像分类模型中。3.根据权利要求1所述的一种结合注意力互斥正则的图像分类方法,其特征在于,所述提取图像特征包括将一张训练图像通过CNN网络提取图像特征,从而得到特征图。4.根据权利要求1所述的一种结合注意力互斥正则的图像分类方法,其特征在于,所述提取图像特征包括先将所述特征图转为注意力图,挑选注意力图中指定数目的注意力通道。5.根据权利要求1所述的一种结合注意力互斥正则的图像分类方法,其特征在于,所述提取图像特征还包括:判断注意力通道是否为候选关键通道和限制候选关键注意力通道关注互不重叠的区域。6.根据权利要求5所述的一种结合注意力互斥正则的图像分类方法,其特征在于,所述判断注意力通道是否为候选关键通道包括:选取一个值作为阈值,若注意力通道的权重大于该阈值,则判断该注意力通道为候选关键通道。7.根...

【专利技术属性】
技术研发人员:陆靖桥宾炜麦广柱陶彦百罗志鹏陈银
申请(专利权)人:广东省新黄埔中医药联合创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1