图像分类模型的训练方法、系统及移动终端技术方案

技术编号:37253269 阅读:14 留言:0更新日期:2023-04-20 23:30
本发明专利技术实施例公开了一种图像分类模型的训练方法、装置、设备及存储介质,其中,所述方法包括:获取训练数据集,训练数据集包括有标签样本和无标签样本;基于预设的特征提取网络,提取有标签样本和/或无标签样本的图像特征;基于图像特征,计算每一个无标签样本到决策边界的置信度,其中决策边界是根据有标签样本计算得到的;基于置信度从第二数据集包含的无标签样本选择至少一个无标签样本作为查询样本,并将查询样本作为人工标注的样本发送给预设的用户进行标注,获取针对查询样本标注的标签;基于查询样本及其标签对图像分类模型进行训练,以对图像分类模型进行优化训练。采用本发明专利技术,可降低图像分类模型训练的标注成本。可降低图像分类模型训练的标注成本。可降低图像分类模型训练的标注成本。

【技术实现步骤摘要】
图像分类模型的训练方法、系统及移动终端


[0001]本专利技术涉及工业视觉自动化检测
,尤其涉及一种图像分类模型的训练方法、装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]图像分类是根据图像信息中所反映的不同特征将不同类别的目标区分开来的一种图像处理方法。图像分类的关键问题是基于已标注类别的图片训练具有较高分类准确率的分类器模型。在工业视觉自动化检测中,可以通过采集产品的图像来对图像进行分类识别,例如缺陷识别等,能极大的提高成产效率。
[0003]在图像分类的相关方案中,需要获取大量的标注图片来对分类器进行训练,但是,由于图片标注的代价较高(需由领域专家进行人工标注),费时费力,导致分类器的训练效率较低。

技术实现思路

[0004]基于此,有必要针对上述问题,提出了一种图像分类模型的训练方法、系统及移动终端。
[0005]在本专利技术的第一部分,提供了一种图像分类模型的训练方法,所述方法包括:
[0006]获取训练数据集,所述训练数据集包括第一数据集和第二数据集,其中,第一数据集为有标签样本的训练数据集,第二数据集为无标签样本的训练数据集;
[0007]基于预设的特征提取网络,提取所述有标签样本和/或无标签样本的图像特征;
[0008]基于图像特征计算每一个无标签样本到决策边界的置信度,基于置信度从第二数据集包含的无标签样本选择至少一个无标签样本作为查询样本,并将查询样本作为人工标注的样本发送给预设的用户进行标注,获取针对查询样本标注的标签,其中;决策边界是根据有标签样本计算得到的;
[0009]基于查询样本及其标签对所述图像分类模型进行训练,以对所述图像分类模型进行优化训练。
[0010]可选的,所述基于预设的特征提取网络,提取所述有标签样本和/或无标签样本的图像特征的步骤,还包括:基于自监督网络,对所述有标签样本和/或无标签样本进行预训练处理,提取所述有标签样本和/或无标签样本的图像特征;其中,对于有标签样本获取其图像特征,并根据分类结果获取每个分类下的所有有标签样本的图像特征的平均值作为特征平均值;对于无标签样本获取其图像特征,并将获取到的图像特征与每个分类下的特征平均值进行混合插值,以得到无标签样本的混合图像特征;
[0011]所述基于图像特征计算每一个无标签样本到决策边界的置信度,基于置信度从第二数据集包含的无标签样本选择至少一个无标签样本作为查询样本的步骤,还包括:基于图像分类模型对所述混合图像特征进行预测,获取与该无标签样本对应的伪标签;基于预设的损失函数计算混合图像特征与伪标签之间的损失值,基于损失值最大化在所述无标签
样本中选择查询样本。
[0012]可选的,所述基于图像特征,计算每一个无标签样本到决策边界的置信度的步骤,还包括:基于有标签样本的图像特征,计算决策边界;对于每一个无标签样本,计算该无标签样本的图像特征到决策边界法向量上的投影的距离,根据计算得到的距离确定该无标签样本到决策边界的置信度,其中,距离与置信度之间呈负相关关系;
[0013]所述基于置信度从第二数据集包含的无标签样本选择至少一个无标签样本作为查询样本的步骤,还包括:基于损失值最大化在所述无标签样本中选择至少一个候选样本;基于置信度在所述至少一个候选样本中选择查询样本,其中,查询样本的置信度小于未选择的候选样本。
[0014]可选的,所述将查询样本作为人工标注的样本发送给预设的用户进行标注,获取针对查询样本标注的标签的步骤之后,还包括:将获得了标签的查询样本合并到所述第一数据集的有标签样本,基于合并之后的有标签样本对所述图像分类模型进行训练。
[0015]可选的,所述基于查询样本及其标签对所述图像分类模型进行训练,以对所述图像分类模型进行优化训练的步骤之后,还包括:获取对图像分类模型进行训练的准确度,判断该准确度是否达到预设的精度阈值,若是,则停止对所述图像分类模型的训练,完成对所述图像分类模型的优化训练。
[0016]可选的,所述方法还包括:获取待识别图像,将所述待识别图像输入所述图像分类模型,获取所述图像分类模型的输出结果作为所述待识别图像的图像分类结果。
[0017]在本专利技术的第二部分,提供了一种图像分类模型的训练装置,所述装置包括:
[0018]训练数据获取模块,用于获取训练数据集,所述训练数据集包括第一数据集和第二数据集,其中,第一数据集为有标签样本的训练数据集,第二数据集为无标签样本的训练数据集;
[0019]特征提取模块,用于基于预设的特征提取网络,提取所述有标签样本和/或无标签样本的图像特征;
[0020]样本筛选模块,用于基于图像特征计算每一个无标签样本到决策边界的置信度,基于置信度从第二数据集包含的无标签样本选择至少一个无标签样本作为查询样本;其中;决策边界是根据有标签样本计算得到的;
[0021]样本标注模块,用于将查询样本作为人工标注的样本发送给预设的用户进行标注,获取针对查询样本标注的标签,
[0022]模型优化训练模块,用于基于查询样本及其标签对所述图像分类模型进行训练,以对所述图像分类模型进行优化训练。
[0023]可选的,所述特征提取模块还用于:
[0024]基于自监督网络,对所述有标签样本和/或无标签样本进行预训练处理,提取所述有标签样本和/或无标签样本的图像特征;其中,对于有标签样本获取其图像特征,并根据分类结果获取每个分类下的所有有标签样本的图像特征的平均值作为特征平均值;对于无标签样本获取其图像特征,并将获取到的图像特征与每个分类下的特征平均值进行混合插值,以得到无标签样本的混合图像特征;
[0025]所述样本筛选模块还用于:基于图像分类模型对所述混合图像特征进行预测,获取与该无标签样本对应的伪标签;基于预设的损失函数计算混合图像特征与伪标签之间的
损失值,基于损失值最大化在所述无标签样本中选择查询样本;其中,基于有标签样本的图像特征,计算决策边界;对于每一个无标签样本,计算该无标签样本的图像特征到决策边界法向量上的投影的距离,根据计算得到的距离确定该无标签样本到决策边界的置信度,其中,距离与置信度之间呈负相关关系;基于损失值最大化在所述无标签样本中选择至少一个候选样本;基于置信度在所述至少一个候选样本中选择查询样本,其中,查询样本的置信度小于未选择的候选样本。
[0026]在本专利技术的第三部分,提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行如前所述的图像分类模型的训练方法。
[0027]在本专利技术的第四部分,提供了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器有可执行代码,当所述可执行代码在所述处理器上运行以实现如前所述的图像分类模型的训练方法。
[0028]采用本专利技术实施例,具有如下有益效果:
[0029]采用了上述图像分类模型的训练方法、装置、计算机设备及计算机可读存储介质之后,在对图像分类模型进行训练的过程本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分类模型的训练方法,其特征在于,所述方法包括:获取训练数据集,所述训练数据集包括第一数据集和第二数据集,其中,第一数据集为有标签样本的训练数据集,第二数据集为无标签样本的训练数据集;基于预设的特征提取网络,提取所述有标签样本和/或无标签样本的图像特征;基于图像特征计算每一个无标签样本到决策边界的置信度,基于置信度从第二数据集包含的无标签样本选择至少一个无标签样本作为查询样本,并将查询样本作为人工标注的样本发送给预设的用户进行标注,获取针对查询样本标注的标签,其中;决策边界是根据有标签样本计算得到的;基于查询样本及其标签对所述图像分类模型进行训练,以对所述图像分类模型进行优化训练。2.根据权利要求1所述的图像分类模型的训练方法,其特征在于,所述基于预设的特征提取网络,提取所述有标签样本和/或无标签样本的图像特征的步骤,还包括:基于自监督网络,对所述有标签样本和/或无标签样本进行预训练处理,提取所述有标签样本和/或无标签样本的图像特征;其中,对于有标签样本获取其图像特征,并根据分类结果获取每个分类下的所有有标签样本的图像特征的平均值作为特征平均值;对于无标签样本获取其图像特征,并将获取到的图像特征与每个分类下的特征平均值进行混合插值,以得到无标签样本的混合图像特征;所述基于图像特征计算每一个无标签样本到决策边界的置信度,基于置信度从第二数据集包含的无标签样本选择至少一个无标签样本作为查询样本的步骤,还包括:基于图像分类模型对所述混合图像特征进行预测,获取与该无标签样本对应的伪标签;基于预设的损失函数计算混合图像特征与伪标签之间的损失值,基于损失值最大化在所述无标签样本中选择查询样本。3.根据权利要求2所述的图像分类模型的训练方法,其特征在于,所述基于图像特征,计算每一个无标签样本到决策边界的置信度的步骤,还包括:基于有标签样本的图像特征,计算决策边界;对于每一个无标签样本,计算该无标签样本的图像特征到决策边界法向量上的投影的距离,根据计算得到的距离确定该无标签样本到决策边界的置信度,其中,距离与置信度之间呈负相关关系;所述基于置信度从第二数据集包含的无标签样本选择至少一个无标签样本作为查询样本的步骤,还包括:基于损失值最大化在所述无标签样本中选择至少一个候选样本;基于置信度在所述至少一个候选样本中选择查询样本,其中,查询样本的置信度小于未选择的候选样本。4.根据权利要求1所述的图像分类模型的训练方法,其特征在于,所述将查询样本作为人工标注的样本发送给预设的用户进行标注,获取针对查询样本标注的标签的步骤之后,还包括:将获得了标签的查询样本合并到所述第一数据集的有标签样本,基于合并之后的有标
签样本对所述图像分类模型进行训练。5.根据权利要求1所述的图像分类模型的训练方法,其特征在于,所述基于查询样本及其标签对所述图像分类模型进行训练,以对所述图像分类模...

【专利技术属性】
技术研发人员:乔乔
申请(专利权)人:深圳新视智科技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1