图像多标签分类方法、装置、电子设备及介质制造方法及图纸

技术编号:27590791 阅读:15 留言:0更新日期:2021-03-10 10:08
本发明专利技术涉及图像处理技术,揭露一种图像多标签分类方法,包括:根据原始图像集得到训练图像集、测试图像集及多标签图像集,对训练图像集处理执行一系列计算处理,得到分类向量,对根据所述分类向量对所述训练图像集进行预测,得到预测标记,根据预测标记和多标签图像集的损失值对卷积神经网络进行优化,得到初始多标签分类模型,利用测试图像集对初始多标签分类模型进行调整,得到标准多标签分类模型,利用所述标准多标签分类模型对待分类图像进行分类处理,得到图像分类结果。本发明专利技术还涉及区块链技术,所述多标签图像集等可以存储在区块链节点中。本发明专利技术还揭露一种图像多标签分类装置、电子设备及存储介质。本发明专利技术可提高标签识别准确度。识别准确度。识别准确度。

【技术实现步骤摘要】
图像多标签分类方法、装置、电子设备及介质


[0001]本专利技术涉及图像处理
,尤其涉及一种图像多标签分类方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]图像分类技术是当前应用较为广泛的人工智能技术之一,图像分类是从预先设定好的指定类别集中为图像分配标签的过程。
[0003]在艺术品图片中不同的区域对于属性的分类重要性可能不同,如判断一件瓷器的材质时用到了图片整体的特征,而在区分它的年代时主要依靠局部的花纹的特征。但是通用的图像标签分类方法无法有效地对图片不同区域的特征分配权重,因此在类别较多的情况下准确度不够,容易产生错识别和漏识别标签。

技术实现思路

[0004]本专利技术提供一种图像多标签分类方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高标签识别的准确度。
[0005]为实现上述目的,本专利技术提供的一种图像多标签分类方法,包括:
[0006]获取原始图像集,将所述原始图像集按照预设比例划分得到训练图像集和测试图像集,并获取所述训练图像集和所述测试图像集的多种类别的标签标记,生成多标签图像集;
[0007]将所述训练图像集输入至预设的卷积神经网络进行运算,得到图像特征向量,将所述图像特征向量依次经过卷积神经网络的全连接网络和预设的激活函数执行降维以及数据映射处理,得到注意力权重参数;
[0008]根据所述注意力权重参数,对所述图像特征向量进行加权平均处理,得到分类向量;
[0009]根据所述分类向量对所述训练图像集进行标签预测处理,得到预测标记,计算所述预测标记和所述多标签图像集之间的损失值,并根据所述损失值对所述卷积神经网络进行优化,得到初始多标签分类模型;
[0010]利用所述测试图像集对所述初始多标签分类模型进行验证调整,得到标准多标签分类模型;
[0011]利用所述标准多标签分类模型对待分类图像进行分类处理,得到图像分类结果。
[0012]可选地,所述获取原始图像集,包括:
[0013]获取待处理图像,对所述待处理图像进行图像增强处理,得到原始图像;
[0014]利用预设的矩形框对所述原始图像进行裁剪,得到原始图像集。
[0015]可选地,所述将所述训练图像集输入至预设的卷积神经网络进行运算,得到图像特征向量,包括:
[0016]根据所述卷积神经网络中预设的卷积核的大小,按照从上往下,从左往右的顺序
划分所述训练图像集中的训练图像,得到多个训练子图像;
[0017]将所述预设的卷积核中的像素值与所述训练子图像中的像素值相乘,得到像素乘积值;
[0018]对所述像素乘积值进行求和,得到目标像素值,并将所述目标像素值转换为向量,得到图像特征向量。
[0019]可选地,所述将所述图像特征向量依次经过卷积神经网络的全连接网络和预设的激活函数,得到注意力权重参数,包括:
[0020]利用下述公式计算所述注意力权重参数:
[0021]u
i
=sigmoid(f
i
*w)
[0022]其中,u
i
为注意力权重参数,sigmoid为激活函数,f
i
表示所述训练图像集中第i张图的图像特征向量,w表示所述全连接层的权重。
[0023]可选地,所述根据所述注意力权重参数,对所述图像特征向量进行加权平均处理,得到分类向量,包括:
[0024]采用下述公式计算所述分类向量:
[0025][0026]其中,F为分类向量,u
i
为注意力权重参数,f
i
表示所述训练图像集中第i张图的图像特征向量,k为所述训练图像集中图像的个数。
[0027]可选地,所述根据所述分类向量对所述训练图像集进行标签预测处理,得到预测标记,计算所述预测标记和所述标签图像集之间的损失值,并根据所述损失值对所述卷积神经网络进行优化,得到初始多标签分类模型,包括:
[0028]利用所述卷积神经网络对所述分类向量进行标签预测处理,得到每个类别的得分;
[0029]将所述得分经过预设的激活函数,生成预测标记;
[0030]将所述预测标记与所述标签图像集进行交叉熵损失函数的计算,得到损失值;
[0031]在所述损失值大于预设权值时,对预设的卷积神经网络的权重进行优化,直到所述损失值小于等于所述预设权值时,得到初始多标签分类模型。
[0032]可选地,所述将所述预测标记与所述标签图像集进行交叉熵损失函数的计算,得到损失值,包括:
[0033][0034]其中,L为交叉熵损失函数值,y为标签图像集,为预测标记,N为标签图像集总数,n表示第n个标签图像。为了解决上述问题,本专利技术还提供一种图像多标签分类装置,所述装置包括:
[0035]数据处理模块,用于获取原始图像集,将所述原始图像集按照预设比例划分得到训练图像集和测试图像集,并获取所述训练图像集和所述测试图像集的多种类别的标签标记,生成多标签图像集,将所述训练图像集输入至预设的卷积神经网络进行运算,得到图像
特征向量,将所述图像特征向量依次经过卷积神经网络的全连接网络和预设的激活函数,得到注意力权重参数,根据所述注意力权重参数,对所述图像特征向量进行加权平均处理,得到分类向量;
[0036]模型训练模块,用于根据所述分类向量对所述训练图像集进行标签预测处理,得到预测标记,计算所述预测标记和所述多标签图像集之间的损失值,并根据所述损失值对所述卷积神经网络进行优化,得到初始多标签分类模型,利用所述测试图像集对所述初始多标签分类模型进行验证调整,得到标准多标签分类模型;
[0037]分类模块,利用所述标准多标签分类模型对待分类图像进行分类处理,得到图像分类结果。
[0038]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0039]至少一个处理器;以及,
[0040]与所述至少一个处理器通信连接的存储器;其中,
[0041]所述存储器存储有可被所述至少一个处理器执行的计算机程序指令,所述计算机程序指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的图像多标签分类方法。
[0042]为了解决上述问题,本专利技术还提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的图像多标签分类方法。
[0043]本专利技术实施例首先将原始图像集划分为训练图像集和测试图像集,并获取所述训练图像集和所述测试图像集的多种类别的标签标记,生成多标签图像集,其中,得到的训练图像集可以用于训练模型,保证模型训练的精确性,测试图像集用于后续对模型进行验证,防止模型过拟合,进一步地,本专利技术实施例通过计算注意力权重参数,并根据所述注意力权重参数得到分类向量,以实现对图片不同区域的特征分配权重,提高图像分类的准确性。因此本专利技术提出的图像分割方法、装置及计算机可读存储介质,可以提高标签本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像多标签分类方法,其特征在于,所述方法包括:获取原始图像集,将所述原始图像集按照预设比例划分得到训练图像集和测试图像集,并获取所述训练图像集和所述测试图像集的多种类别的标签标记,生成多标签图像集;将所述训练图像集输入至预设的卷积神经网络进行运算,得到图像特征向量,将所述图像特征向量依次依次经过卷积神经网络的全连接网络和预设的激活函数执行降维以及数据映射处理,得到注意力权重参数;根据所述注意力权重参数,对所述图像特征向量进行加权平均处理,得到分类向量;根据所述分类向量对所述训练图像集进行标签预测处理,得到预测标记,计算所述预测标记和所述多标签图像集之间的损失值,并根据所述损失值对所述卷积神经网络进行优化,得到初始多标签分类模型;利用所述测试图像集对所述初始多标签分类模型进行验证调整,得到标准多标签分类模型;利用所述标准多标签分类模型对待分类图像进行分类处理,得到图像分类结果。2.如权利要求1所述的图像多标签分类方法,其特征在于,所述获取原始图像集,包括:获取待处理图像,对所述待处理图像进行图像增强处理,得到原始图像;利用预设的矩形框对所述原始图像进行裁剪,得到原始图像集。3.如权利要求1所述的图像多标签分类方法,其特征在于,所述将所述训练图像集输入至预设的卷积神经网络进行运算,得到图像特征向量,包括:根据所述卷积神经网络中预设的卷积核的大小,按照从上往下,从左往右的顺序划分所述训练图像集中的训练图像,得到多个训练子图像;将所述预设的卷积核中的像素值与所述训练子图像中的像素值相乘,得到像素乘积值;对所述像素乘积值进行求和,得到目标像素值,并将所述目标像素值转换为向量,得到图像特征向量。4.如权利要求1所述的图像多标签分类方法,其特征在于,所述将所述图像特征向量依次依次经过卷积神经网络的全连接网络和预设的激活函数,得到注意力权重参数,包括:利用下述公式计算所述注意力权重参数:u
i
=sigmoid(f
i
*w)其中,u
i
为注意力权重参数,sigmoid为激活函数,f
i
表示所述训练图像集中第i张图的图像特征向量,w表示所述全连接层的权重。5.如权利要求4所述的图像多标签分类方法,其特征在于,所述根据所述注意力权重参数,对所述图像特征向量进行加权平均处理,得到分类向量,包括:采用下述公式计算所述分类向量:其中,F为分类向量,u
i
为注意力权重参数,f
i
表...

【专利技术属性】
技术研发人员:谢雨洋
申请(专利权)人:深圳赛安特技术服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1