图像识别模型训练方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:36890801 阅读:12 留言:0更新日期:2023-03-15 21:55
本申请涉及一种图像识别模型训练方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取第一训练集和第二训练集;所述第一训练集中包括多张未标注图像,所述第二训练集中包括多张标注图像;基于所述第一训练集中的未标注图像,对初始编码器和第一解码器进行训练,得到所述初始编码器对应的中间编码器;基于所述第二训练集中的标注图像,对所述中间编码器和第二解码器进行训练,得到所述中间编码器对应的目标编码器和所述第二解码器对应的目标解码器;基于所述目标编码器和所述目标解码器,得到目标图像识别模型。采用本方法能提高图像识别模型的准确性。法能提高图像识别模型的准确性。法能提高图像识别模型的准确性。

【技术实现步骤摘要】
图像识别模型训练方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种图像识别模型训练方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着计算机技术的发展,出现了图像识别技术,图像识别技术是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。
[0003]传统技术中,使用少量的已标注图像对图像识别模型进行训练,由于用于训练的已标注图像的数量较少,导致图像识别模型不准确。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高图像识别模型准确性的图像识别模型训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种图像识别模型训练方法。所述方法包括:
[0006]获取第一训练集和第二训练集;所述第一训练集中包括多张未标注图像,所述第二训练集中包括多张标注图像;
[0007]基于所述第一训练集中的未标注图像,对初始编码器和第一解码器进行训练,得到所述初始编码器对应的中间编码器;
[0008]基于所述第二训练集中的标注图像,对所述中间编码器和第二解码器进行训练,得到所述中间编码器对应的目标编码器和所述第二解码器对应的目标解码器;
[0009]基于所述目标编码器和所述目标解码器,得到目标图像识别模型。
[0010]在一个实施例中,所述基于所述第二训练集中的标注图像,对所述中间编码器和第二解码器进行训练包括:
[0011]获取所述第二训练集中的目标标注图像,以及所述目标标注图像中标注块对应的标注向量;
[0012]从所述目标标注图像中获取多个图像块;
[0013]基于所述中间编码器和第二解码器,分别对每个所述图像块进行编解码,得到每个所述图像块对应的预测向量;
[0014]针对每一个所述图像块,计算所述标注向量和所述图像块对应的预测向量之间的误差,得到所述图像块对应的图像损失;
[0015]从各个所述图像块对应的图像损失中确定最小的图像损失,基于所述最小的图像损失,对所述中间编码器的中间编码参数和第二解码器的解码参数进行调整。
[0016]在一个实施例中,所述基于所述中间编码器和第二解码器,分别对每个所述图像块进行编解码,得到每个所述图像块对应的预测向量包括:
[0017]通过所述中间编码器,分别对每一个所述图像块进行特征提取,得到每个所述图像块对应的特征矩阵;
[0018]通过所述第二解码器,分别对每一个所述图像块对应的特征矩阵进行预测,得到每个所述图像块对应的预测向量。
[0019]在一个实施例中,所述标注向量中包括标注分类向量和标注位置向量;所述针对每一个所述图像块,计算所述标注向量和所述图像块对应的预测向量之间的误差,得到所述图像块对应的图像损失包括:
[0020]针对每一个所述图像块,基于所述图像块对应的预测向量,得到所述图像块对应的预测分类向量和预测位置向量;
[0021]计算所述标注分类向量和所述预测分类向量之间的交叉熵损失,得到所述图像块对应的分类误差;
[0022]计算所述标注位置向量和所述预测位置向量之间的回归损失,得到所述图像块对应的位置误差;
[0023]基于所述图像块对应的分类误差和位置误差,得到所述图像块对应的图像损失。
[0024]在一个实施例中,所述基于所述第一训练集中的未标注图像,对初始编码器和第一解码器进行训练包括:
[0025]获取所述第一训练集中的目标未标注图像;
[0026]对所述目标未标注图像进行划分,得到多个尺寸相同的候选训练图像块;所述多个尺寸相同的候选训练图像块组成所述目标未标注图像;
[0027]从多个所述候选训练图像块中确定目标训练图像块;
[0028]通过所述初始编码器和第一解码器,将所述目标训练图像块还原成所述目标未标注图像对应的预测图像;
[0029]计算所述目标未标注图像与对应的所述预测图像之间的均方根误差,基于所述均方根误差对所述初始编码器的初始编码参数和第一解码器的解码参数进行调整。
[0030]在一个实施例中,所述通过所述初始编码器和第一解码器,将所述目标训练图像块还原成所述目标未标注图像对应的预测图像包括:
[0031]通过所述初始编码器对所述目标训练图像块进行特征提取,得到所述目标训练图像块对应的特征矩阵;
[0032]将同一替换矩阵作为非目标训练图像块对应的特征矩阵;所述替换矩阵与所述目标训练图像块对应的特征矩阵的行数和列数相同,并且所述替换矩阵中每一个数据元素均相同;
[0033]基于所述目标训练图像块对应的特征矩阵,通过所述第一解码器分别对各个所述非目标训练图像块对应的替换矩阵进行预测,得到各个所述非目标训练图像块对应的预测矩阵;
[0034]基于各个所述目标训练图像块对应的特征矩阵,以及各个所述非目标训练图像块对应的预测矩阵,通过所述第一解码器恢复出目标未标注图像对应的预测图像。
[0035]在一个实施例中,所述获取第一训练集和第二训练集包括:
[0036]获取多张待训练的原始图像;
[0037]对部分所述待训练的原始图像进行标注,得到原始标注图像和原始未标注图像;
[0038]将所述原始标注图像和原始未标注图像中的三原色转换成对应的色调、饱和度和亮度,得到所述原始标注图像对应的标注图像,以及所述原始未标注图像对应的未标注图
像;
[0039]基于所述未标注图像得到所述第一训练集,基于所述标注图像得到所述第二训练集。
[0040]第二方面,本申请还提供了一种图像识别模型训练装置。所述装置包括:
[0041]获取模块,用于获取第一训练集和第二训练集;所述第一训练集中包括多张未标注图像,所述第二训练集中包括多张标注图像;
[0042]第一训练模块,用于基于所述第一训练集中的未标注图像,对初始编码器和第一解码器进行训练,得到所述初始编码器对应的中间编码器;
[0043]第二训练模块,用于基于所述第二训练集中的标注图像,对所述中间编码器和第二解码器进行训练,得到所述中间编码器对应的目标编码器和所述第二解码器对应的目标解码器;
[0044]组合模块,用于基于所述目标编码器和所述目标解码器,得到目标图像识别模型。
[0045]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0046]获取第一训练集和第二训练集;所述第一训练集中包括多张未标注图像,所述第二训练集中包括多张标注图像;
[0047]基于所述第一训练集中的未标注图像,对初始编码器和第一解码器进行训练,得到所述初始编码器对应的中间编码器;
[0048]基于所述第二训练集中的标注图像,对所述中间编码器和第二解码器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型训练方法,其特征在于,所述方法包括:获取第一训练集和第二训练集;所述第一训练集中包括多张未标注图像,所述第二训练集中包括多张标注图像;基于所述第一训练集中的未标注图像,对初始编码器和第一解码器进行训练,得到所述初始编码器对应的中间编码器;基于所述第二训练集中的标注图像,对所述中间编码器和第二解码器进行训练,得到所述中间编码器对应的目标编码器和所述第二解码器对应的目标解码器;基于所述目标编码器和所述目标解码器,得到目标图像识别模型。2.根据权利要求1所述的方法,其特征在于,所述基于所述第二训练集中的标注图像,对所述中间编码器和第二解码器进行训练包括:获取所述第二训练集中的目标标注图像,以及所述目标标注图像中标注块对应的标注向量;从所述目标标注图像中获取多个图像块;基于所述中间编码器和第二解码器,分别对每个所述图像块进行编解码,得到每个所述图像块对应的预测向量;针对每一个所述图像块,计算所述标注向量和所述图像块对应的预测向量之间的误差,得到所述图像块对应的图像损失;从各个所述图像块对应的图像损失中确定最小的图像损失,基于所述最小的图像损失,对所述中间编码器的中间编码参数和第二解码器的解码参数进行调整。3.根据权利要求2所述的方法,其特征在于,所述基于所述中间编码器和第二解码器,分别对每个所述图像块进行编解码,得到每个所述图像块对应的预测向量包括:通过所述中间编码器,分别对每一个所述图像块进行特征提取,得到每个所述图像块对应的特征矩阵;通过所述第二解码器,分别对每一个所述图像块对应的特征矩阵进行预测,得到每个所述图像块对应的预测向量。4.根据权利要求2所述的方法,其特征在于,所述标注向量中包括标注分类向量和标注位置向量;所述针对每一个所述图像块,计算所述标注向量和所述图像块对应的预测向量之间的误差,得到所述图像块对应的图像损失包括:针对每一个所述图像块,基于所述图像块对应的预测向量,得到所述图像块对应的预测分类向量和预测位置向量;计算所述标注分类向量和所述预测分类向量之间的交叉熵损失,得到所述图像块对应的分类误差;计算所述标注位置向量和所述预测位置向量之间的回归损失,得到所述图像块对应的位置误差;基于所述图像块对应的分类误差和位置误差,得到所述图像块对应的图像损失。5.根据权利要求1所述的方法,其特征在于,所述基于所述第一训练集中的未标注图像,对初始编码器和第一解码器进行训练包括:获取所述第一训练集中的目标未标注图像;对所述目标未标注图像进行划分,得到多个尺寸相同的候选训练图像块;所述多个尺
寸相同的候选训练图像块组成所述目标...

【专利技术属性】
技术研发人员:郑筠张云翔
申请(专利权)人:深圳供电局有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1