一种标签分类的方法、装置、电子设备和存储介质制造方法及图纸

技术编号:38202394 阅读:10 留言:0更新日期:2023-07-21 16:46
本发明专利技术实施例提供了一种标签分类的方法、装置、电子设备和存储介质,方法包括:获取样本图像数据集,迭代执行以下步骤:多个样本图像依次输入至多标签分类模型,以得到样本预测概率向量和样本特征映射图;根据样本预测概率向量,确定各个类别的标签;在每次迭代完成后,计算类别的特征聚类直径;在迭代次数满足预设次数时,获取前N次的特征聚类直径,以调整损失函数中的权重参数,从而调整样本图像中类别的标签。本发明专利技术通过在损失函数中设定一个权重参数,并通过获取前N次迭代得到的特征聚类直径,对权重参数进行调整,通过调整后的权重参数和损失函数,实现根据训练效果调整样本图像中类别的标签,从而实现尽可能地挖掘潜在的标签信息。息。息。

【技术实现步骤摘要】
一种标签分类的方法、装置、电子设备和存储介质


[0001]本专利技术涉及图像处理
,特别是涉及一种标签分类的方法、一种标签分类的装置、一种电子设备和一种计算机可读存储介质。

技术介绍

[0002]近几年多标签学习的一个趋势是开始关注如何在有限的监督下构建更好的学习模型,与此相关的多标签学习问题包括两类:缺失标签的多标签学习(MLML)和部分标注的多标签学习(PML)。其中,前者侧重未标记,后者侧重难标记。
[0003]在相关技术中,图像之间特征相关性存在一个同一个类别的不同实例图像还包含其他类别的问题,导致无法准确的度量图像之间的特征相关性和标签相关性。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种标签分类的方法、一种标签分类的装置、一种电子设备和一种计算机可读存储介质。
[0005]为了解决上述问题,第一方面,本专利技术实施例公开了一种标签分类的方法,所述方法包括:
[0006]获取样本图像数据集和标签数据集;所述样本图像数据集包括多个样本图像;
[0007]迭代执行以下步骤:
[0008]将所述标签数据集输入至多标签分类模型,以及将所述样本图像数据集中多个样本图像依次输入至多标签分类模型,以得到与多个样本图像一一对应的样本预测概率向量和样本特征映射图;
[0009]根据所述样本预测概率向量,确定样本图像中各个类别的标签;所述标签包括正标签、负标签和缺失标签;
[0010]在每次迭代完成后,根据所述样本特征映射图,计算每一个类别的特征聚类直径;
[0011]在迭代次数满足预设次数时,获取前N次迭代得到的特征聚类直径;
[0012]根据前N次迭代得到的特征聚类直径,调整针对缺失标签的权重参数,所述权重参数用于衡量缺失标签的可信度;
[0013]根据所述权重参数和损失函数,确定所述样本图像中类别的分类损失值,以调整所述样本图像中所述类别的标签。
[0014]可选地,所述根据所述样本特征映射图,计算每一个类别的特征聚类直径,包括:
[0015]根据所述样本特征映射图,确定所述样本图像中类别的标签为正标签和缺失标签的特征向量;
[0016]将所述特征向量,通过K均值聚类算法,计算每一个类别的特征聚类直径。
[0017]可选地,所述多标签分类模型包括卷积隐藏层和全连接隐藏层,所述将所述标签数据集输入至多标签分类模型,以及将所述样本图像数据集中多个样本图像依次输入至多
标签分类模型,以得到与多个样本图像一一对应的样本预测概率向量和样本特征映射图,包括:
[0018]将所述标签数据集输入至所述多标签分类模型的卷积隐藏层,以及将所述样本图像数据集中多个样本图像依次输入至所述多标签分类模型的卷积隐藏层,通过所述多标签分类模型的卷积隐藏层生成与所述样本图像一一对应的所述样本特征映射图,并将所述样本特征映射图输入至所述多标签分类模型的全连接隐藏层,以输出与所述样本图像一一对应的所述样本预测概率向量,所述样本预测概率向量包括各个类别的分类预测概率值。
[0019]可选地,所述根据所述样本预测概率向量,确定样本图像中各个类别的标签,包括:
[0020]若所述分类预测概率值大于预设概率阈值,且类别的标签值为0,则确定所述样本图像中类别的标签为缺失标签。
[0021]可选地,当N为2时,所述前N次迭代得到的特征聚类直径包括第一特征聚类直径和第二特征聚类直径;所述权重参数的取值为0或1,所述根据前N次迭代得到的特征聚类直径,调整针对缺失标签的权重参数,包括:
[0022]若所述样本图像中类别的标签为所述缺失标签,且第二特征聚类直径小于或者等于第一特征聚类直径,则保持针对缺失标签的权重参数不变;
[0023]若所述样本图像中类别的标签为所述缺失标签,且第二特征聚类直径大于第一特征聚类直径,则将针对缺失标签的权重参数调整为,与上一权重参数不同的另一权重参数。
[0024]可选地,所述根据所述样本特征映射图,生成所述样本图像中类别的标签为正标签和缺失标签的特征向量,包括:
[0025]根据类激活可视化方式和阈值分割方式,确实所述样本图像中类别的标签为正标签和缺失标签的特征区域;
[0026]根据所述样本图像中类别的标签为正标签和缺失标签的特征区域,生成所述样本图像中类别的标签为正标签和缺失标签的特征向量。
[0027]可选地,所述根据所述权重参数和损失函数,确定所述样本图像的分类损失值,以调整所述样本图像的标签,包括:
[0028]若所述权重参数为1,则选定第一损失函数公式进行计算得到第一分类损失值;
[0029]根据所述第一分类损失值,将所述样本图像中所述类型的标签由缺失标签调整为负标签;
[0030]若所述权重参数为0,则选定第二损失函数公式进行计算得到第二分类损失值;
[0031]根据所述第二分类损失值,将所述样本图像中所述类型的标签由缺失标签调整为正标签;
[0032]其中,第一损失函数公式为:
[0033][0034]第二损失函数公式为:
[0035][0036]其中,i表示样本图像中的第i个类别,c表示样本图像的类别数量;Y为标签值;Y
i
=1为正标签;Y
i
=0为负标签或缺失标签;y
i
表示样本图像中第i个类别的输出概率值;L1表示第一分类损失值;L2表示第二分类损失值。
[0037]第二方面,本专利技术实施例还公开了一种标签分类的装置,所述装置包括:
[0038]数据集获取模块,用于获取样本图像数据集和标签数据集;所述样本图像数据集包括多个样本图像;
[0039]向量与特征图生成模块,用于迭代执行以下步骤:将所述标签数据集输入至多标签分类模型,以及将所述样本图像数据集中多个样本图像依次输入至多标签分类模型,以得到与多个样本图像一一对应的样本预测概率向量和样本特征映射图;
[0040]标签确定模块,用于根据所述样本预测概率向量,确定样本图像中各个类别的标签;所述标签包括正标签、负标签和缺失标签;
[0041]聚类直径计算模块,用于在每次迭代完成后,根据所述样本特征映射图,计算每一个类别的特征聚类直径;
[0042]聚类直径获取模块,用于在迭代次数满足预设次数时,获取前N次迭代得到的特征聚类直径;
[0043]权重参数调整模块,用于根据前N次迭代得到的特征聚类直径,调整针对缺失标签的权重参数,所述权重参数用于衡量缺失标签的可信度;
[0044]标签调整模块,用于根据所述权重参数和损失函数,确定所述样本图像中类别的分类损失值,以调整所述样本图像中所述类别的标签。
[0045]可选地,所述聚类直径计算模块,包括:
[0046]特征向量确定子模块,用于根据所述样本特征映射图,确定所述样本图像中类别的标签为正标签和缺失本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标签分类的方法,其特征在于,所述方法包括:获取样本图像数据集和标签数据集;所述样本图像数据集包括多个样本图像;迭代执行以下步骤:将所述标签数据集输入至多标签分类模型,以及将所述样本图像数据集中多个样本图像依次输入至多标签分类模型,以得到与多个样本图像一一对应的样本预测概率向量和样本特征映射图;根据所述样本预测概率向量,确定样本图像中各个类别的标签;所述标签包括正标签、负标签和缺失标签;在每次迭代完成后,根据所述样本特征映射图,计算每一个类别的特征聚类直径;在迭代次数满足预设次数时,获取前N次迭代得到的特征聚类直径;根据前N次迭代得到的特征聚类直径,调整针对缺失标签的权重参数,所述权重参数用于衡量缺失标签的可信度;根据所述权重参数和损失函数,确定所述样本图像中类别的分类损失值,以调整所述样本图像中所述类别的标签。2.根据权利要求1所述的方法,其特征在于,所述根据所述样本特征映射图,计算每一个类别的特征聚类直径,包括:根据所述样本特征映射图,确定所述样本图像中类别的标签为正标签和缺失标签的特征向量;将所述特征向量,通过K均值聚类算法,计算每一个类别的特征聚类直径。3.根据权利要求1所述的方法,其特征在于,所述多标签分类模型包括卷积隐藏层和全连接隐藏层,所述将所述标签数据集输入至多标签分类模型,以及将所述样本图像数据集中多个样本图像依次输入至多标签分类模型,以得到与多个样本图像一一对应的样本预测概率向量和样本特征映射图,包括:将所述标签数据集输入至所述多标签分类模型的卷积隐藏层,以及将所述样本图像数据集中多个样本图像依次输入至所述多标签分类模型的卷积隐藏层,通过所述多标签分类模型的卷积隐藏层生成与所述样本图像一一对应的所述样本特征映射图,并将所述样本特征映射图输入至所述多标签分类模型的全连接隐藏层,以输出与所述样本图像一一对应的所述样本预测概率向量,所述样本预测概率向量包括各个类别的分类预测概率值。4.根据权利要求3所述的方法,其特征在于,所述根据所述样本预测概率向量,确定样本图像中各个类别的标签,包括:若所述分类预测概率值大于预设概率阈值,且类别的标签值为0,则确定所述样本图像中类别的标签为缺失标签。5.根据权利要求1所述的方法,其特征在于,当N为2时,所述前N次迭代得到的特征聚类直径包括第一特征聚类直径和第二特征聚类直径;所述权重参数的取值为0或1,所述根据前N次迭代得到的特征聚类直径,调整针对缺失标签的权重参数,包括:若所述样本图像中类别的标签为所述缺失标签,且第二特征聚类直径小于或者等于第一特征聚类直径,则保持针对缺失标签的权重参数不变;若所述样本图像中类别的标签为所述缺失标签,且第二特征聚类直径大于第一特征聚类直径,则将针对缺失标签的权重参数调整为,与上一权重参数不同的另一权重参数。
6.根据权利要求2所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:沈艳梅宿栋栋刘伟阚宏伟
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1