一种图像分类方法及装置制造方法及图纸

技术编号:37531202 阅读:13 留言:0更新日期:2023-05-12 15:57
本发明专利技术提供一种图像分类方法及装置,涉及业务支撑技术领域。该方法包括:获取证件图像集,证件图像集包括携带有分类标签的第一图像集和未携带分类标签的第二图像集;根据图像指纹算法,获取聚类训练样本集,聚类训练样本集是基于第一图像集和第二图像集中部分图像的图像特征得到的;利用聚类训练样本集训练初始聚类模型,得到图像聚类模型;利用分类训练样本集训练初始分类模型,得到图像分类模型,分类训练样本集是基于所述第一图像集得到的;对图像聚类模型和图像分类模型进行迭代更新处理,得到目标图像聚类模型和目标图像分类模型;根据目标图像聚类模型和目标图像分类模型,对待分类图像进行分类。对待分类图像进行分类。对待分类图像进行分类。

【技术实现步骤摘要】
一种图像分类方法及装置


[0001]本专利技术涉及业务支撑
,特别是指一种图像分类方法及装置。

技术介绍

[0002]目前在对图像进行分类时,往往需要利用大量携带有正确标签的训练样本对分类模型进行训练才能获得较佳的模型,从而用于后续的图像分类,在带有标签的训练样本较少时模型效果较差。

技术实现思路

[0003]本专利技术的目的是提供一种图像分类方法及装置,以解决现有技术在对图像进行分类时需要利用大量携带有正确标签的训练样本的问题。
[0004]为达到上述目的,本专利技术的实施例提供一种图像分类方法,包括:
[0005]获取证件图像集,所述证件图像集包括携带有分类标签的第一图像集和未携带分类标签的第二图像集;
[0006]根据图像指纹算法,获取聚类训练样本集,所述聚类训练样本集是基于所述第一图像集和第二图像集中部分图像的图像特征得到的;
[0007]利用所述聚类训练样本集训练初始聚类模型,得到图像聚类模型;
[0008]利用分类训练样本集训练初始分类模型,得到图像分类模型,所述分类训练样本集是基于所述第一图像集得到的;
[0009]对所述图像聚类模型和所述图像分类模型进行迭代更新处理,得到目标图像聚类模型和目标图像分类模型;
[0010]根据所述目标图像聚类模型和目标图像分类模型,对待分类图像进行分类。
[0011]可选地,所述对所述图像聚类模型和所述图像分类模型进行迭代更新处理,得到目标图像聚类模型和目标图像分类模型,包括:
>[0012]循环执行以下步骤,直到达到预设停止条件;
[0013]利用图像分类模型更新所述聚类训练样本集,利用更新后的聚类训练样本集训练所述图像聚类模型;
[0014]利用图像聚类模型更新所述分类训练样本集,利用更新后的分类训练样本集训练所述图像分类模型。
[0015]可选地,所述利用图像聚类模型更新所述分类训练样本集,包括:
[0016]根据所述图像聚类模型,获取所述第二图像集中的每张证件图像的第一伪标签,并基于携带第一伪标签的证件图像,得到第三图像集;
[0017]根据所述第三图像集中第一伪标签与聚类中心的关系,更新所述分类训练样本集,其中,所述聚类中心对应至少一个目标分类标签,所述目标分类标签是基于业务需求确定的。
[0018]可选地,所述根据所述第三图像集中第一伪标签与聚类中心的关系,更新所述分
类训练样本集,包括:
[0019]在所述第三图像集中,选取第一目标证件图像,其中,所述第一目标证件图像的第一伪标签与聚类中心的汉明距离小于第一预设阈值;
[0020]将所述第一目标证件图像添加至所述聚类训练样本集,得到更新后的分类训练样本集。
[0021]可选地,所述利用图像分类模型更新所述聚类训练样本集,包括:
[0022]根据所述图像分类模型,获取所述第二图像集中的每张证件图像的第二伪标签,并基于携带第二伪标签的证件图像,得到第四图像集;
[0023]在所述第四图像集中,选取第二目标证件图像,所述第二目标证件图像的第二伪标签的置信度高于第二预设阈值;
[0024]将所述第二目标证件图像添加至所述分类训练样本集,得到更新后的聚类训练样本集。
[0025]可选地,所述预设停止条件包括:
[0026]所述聚类训练样本集合中证件图像的第一伪标签的置信度高于第三预设阈值,且所述分类训练样本集中证件图像的第二伪标签的置信度高于第四预设阈值;
[0027]其中,所述证件图像的第一伪标签是基于所述图像聚类模型得到的,所述证件图像的第二伪标签是基于所述图像分类模型得到的。
[0028]本专利技术实施例还提供了一种图像分类装置,包括:
[0029]第一获取模块,用于获取证件图像集,所述证件图像集包括携带有分类标签的第一图像集和未携带分类标签的第二图像集;
[0030]第二获取模块,用于根据图像指纹算法,获取聚类训练样本集,所述聚类训练样本集是基于所述第一图像集和第二图像集中部分图像的图像特征得到的;
[0031]第三获取模块,用于利用所述聚类训练样本集训练初始聚类模型,得到图像聚类模型;
[0032]第四获取模块,用于利用分类训练样本集训练初始分类模型,得到图像分类模型,所述分类训练样本集是基于所述第一图像集得到的;
[0033]处理模块,用于对所述图像聚类模型和所述图像分类模型进行迭代更新处理,得到目标图像聚类模型和目标图像分类模型;
[0034]分类模块,用于根据所述目标图像聚类模型和目标图像分类模型,对待分类图像进行分类。
[0035]可选地,所述处理模块用于循环执行以下步骤,直到达到预设停止条件;
[0036]利用图像分类模型更新所述聚类训练样本集,利用更新后的聚类训练样本集训练所述图像聚类模型;
[0037]利用图像聚类模型更新所述分类训练样本集,利用更新后的分类训练样本集训练所述图像分类模型。
[0038]可选地,所述处理模块包括:
[0039]第一获取子模块,用于根据所述图像聚类模型,获取所述第二图像集中的每张证件图像的第一伪标签,并基于携带第一伪标签的证件图像,得到第三图像集;
[0040]第一更新子模块,用于根据所述第三图像集中第一伪标签与聚类中心的关系,更
新所述分类训练样本集,其中,所述聚类中心对应至少一个目标分类标签,所述目标分类标签是基于业务需求确定的。
[0041]可选地,所述第一更新子模块包括:
[0042]选取单元,用于在所述第三图像集中,选取第一目标证件图像,其中,所述第一目标证件图像的第一伪标签与聚类中心的汉明距离小于第一预设阈值;
[0043]更新单元,用于将所述第一目标证件图像添加至所述聚类训练样本集,得到更新后的分类训练样本集。
[0044]可选地,所述处理模块包括:
[0045]第二获取子模块,用于根据所述图像分类模型,获取所述第二图像集中的每张证件图像的第二伪标签,并基于携带第二伪标签的证件图像,得到第四图像集;
[0046]选取子模块,用于在所述第四图像集中,选取第二目标证件图像,所述第二目标证件图像的第二伪标签的置信度高于第二预设阈值;
[0047]更新子模块,用于将所述第二目标证件图像添加至所述分类训练样本集,得到更新后的聚类训练样本集。
[0048]可选地,所述预设停止条件包括:
[0049]所述聚类训练样本集合中证件图像的第一伪标签的置信度高于第三预设阈值,且所述分类训练样本集中证件图像的第二伪标签的置信度高于第四预设阈值;
[0050]其中,所述证件图像的第一伪标签是基于所述图像聚类模型得到的,所述证件图像的第二伪标签是基于所述图像分类模型得到的。
[0051]本专利技术实施例还提供了一种图像分类设备,包括:收发机和处理器;
[0052]所述处理器用于:获取证件图像集,所述证件图像集本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像分类方法,其特征在于,所述方法包括:获取证件图像集,所述证件图像集包括携带有分类标签的第一图像集和未携带分类标签的第二图像集;根据图像指纹算法,获取聚类训练样本集,所述聚类训练样本集是基于所述第一图像集和第二图像集中部分图像的图像特征得到的;利用所述聚类训练样本集训练初始聚类模型,得到图像聚类模型;利用分类训练样本集训练初始分类模型,得到图像分类模型,所述分类训练样本集是基于所述第一图像集得到的;对所述图像聚类模型和所述图像分类模型进行迭代更新处理,得到目标图像聚类模型和目标图像分类模型;根据所述目标图像聚类模型和目标图像分类模型,对待分类图像进行分类。2.根据权利要求1所述的方法,其特征在于,所述对所述图像聚类模型和所述图像分类模型进行迭代更新处理,得到目标图像聚类模型和目标图像分类模型,包括:循环执行以下步骤,直到达到预设停止条件;利用图像分类模型更新所述聚类训练样本集,利用更新后的聚类训练样本集训练所述图像聚类模型;利用图像聚类模型更新所述分类训练样本集,利用更新后的分类训练样本集训练所述图像分类模型。3.根据权利要求2所述的方法,其特征在于,所述利用图像聚类模型更新所述分类训练样本集,包括:根据所述图像聚类模型,获取所述第二图像集中的每张证件图像的第一伪标签,并基于携带第一伪标签的证件图像,得到第三图像集;根据所述第三图像集中第一伪标签与聚类中心的关系,更新所述分类训练样本集,其中,所述聚类中心对应至少一个目标分类标签,所述目标分类标签是基于业务需求确定的。4.根据权利要求3所述的方法,其特征在于,所述根据所述第三图像集中第一伪标签与聚类中心的关系,更新所述分类训练样本集,包括:在所述第三图像集中,选取第一目标证件图像,其中,所述第一目标证件图像的第一伪标签与聚类中心的汉明距离小于第一预设阈值;将所述第一目标证件图像添加至所述聚类训练样本集,得到更新后的分类训练样本集。5.根据权利要求2所述的方法,其特征在于,所述利用图像分类模型更新所述聚类训练样本集,包括:根据所述图像分类模型,获取所述第二图像集中的每张证件图像的第二伪标签,并基于携带第二伪标签的证件图像,得到第四图像集;在所述第四图像集中,选取第二目标证件图像,所述第二目标证件图像的第二伪标签的置信度高于第二预设阈值;将所述第二目标证件图像添加至所述分类训练样本集,得到更新后的聚类训练样本集。6.根据权利要求2所述的方法,其特征在于,所述预设停止条件包括:
所述聚类训练样本集合中证件图像的第一伪标签的置信度高于第三预设阈值,且所述分类训练样本集中证件图像的第二伪标签的置信度高于第四预设阈值;其中,所述证件图像的第一伪标签是基于所述图像聚类模型得到的,所述证件图像的第二伪标签是基于所述图像分类模型得到的。7.一种图像分类装置,其特征在于,包括:第一获取模块,用于获取证件图像集,所述证件图像集包括携带有分类标签的第一图像集和未携带分类标签的第二图像集;第二获取模块,用于根据图像指纹算法,获取聚类训练样本集,所述聚类训练样本集是基于所述第一图像集和第二图像集中部分图像的图像特征得到的;第三获取模块,用于利用所述聚类训练样本集训练初始聚类模型,得到图像聚类模型;第四获取模块,用于利用分类训练样本集训练初始分类模型,得到图像分类模型,所述分类训练样本集是基于所述第一图像集得到的;处理...

【专利技术属性】
技术研发人员:刘清晨
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1