模型训练、图像识别方法、装置、设备及存储介质制造方法及图纸

技术编号:37515070 阅读:12 留言:0更新日期:2023-05-12 15:36
本公开涉及一种模型训练、图像识别方法、装置、设备及存储介质。本公开通过待训练的机器学习模型从历史图像集合中抽取历史知识;并将历史知识传播到历史图像集合中第一子集合内各类样本图像的特征均值上,以及将历史知识传播到历史图像集合中第二子集合内各个样本图像的特征信息上;根据第二子集合内各个样本图像更新后的特征信息和第一子集合内各类样本图像更新后的特征均值之间的相似度,对机器学习模型进行训练,使得训练完成的机器学习模型可以将历史知识传播到新类别图像上,从而增强或补充新类别图像的特征信息,根据新类别图像被增强或补充后的特征信息,可以提高对新类别图像的识别精准度。别图像的识别精准度。别图像的识别精准度。

【技术实现步骤摘要】
模型训练、图像识别方法、装置、设备及存储介质


[0001]本公开涉及信息
,尤其涉及一种模型训练、图像识别方法、装置、设备及存储介质。

技术介绍

[0002]在海量数据和强大算力的支撑下,机器学习模型例如深度模型在图像识别领域取得了巨大的成功。目前的机器学习模型在被训练完成后,为了避免出现灾难性遗忘的问题、以及过拟合问题,通常会对训练完成的机器学习模型进行冻结,即固定训练完成的机器学习模型的参数。
[0003]但是,对训练完成的机器学习模型进行冻结后,会导致该机器学习模型对新类别的图像识别不精准。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种模型训练、图像识别方法、装置、设备及存储介质,以提高对新类别图像的识别精准度。
[0005]第一方面,本公开实施例提供一种模型训练方法,包括:
[0006]通过待训练的机器学习模型从历史图像集合中抽取历史知识;
[0007]通过所述待训练的机器学习模型,计算所述历史图像集合中第一子集合内各类样本图像的特征均值,以及计算所述历史图像集合中第二子集合内各个样本图像的特征信息;
[0008]将所述历史知识传播到所述第一子集合内各类样本图像的特征均值上,得到所述第一子集合内各类样本图像更新后的特征均值,以及将所述历史知识传播到所述第二子集合内各个样本图像的特征信息上,得到所述第二子集合内各个样本图像更新后的特征信息;
[0009]根据所述第二子集合内各个样本图像更新后的特征信息和所述第一子集合内各类样本图像更新后的特征均值之间的相似度,对所述机器学习模型进行训练。
[0010]第二方面,本公开实施例提供一种图像识别方法,包括:
[0011]获取多个历史类别中每个历史类别对应的第一特征均值,每个历史类别对应的第一特征均值是所述历史类别下的多个历史图像的图像特征均值;
[0012]通过训练完成的机器学习模型,计算测试集中待识别图像的目标图像特征,以及计算训练集中每个图像类别下的多个样本图像的图像特征均值,得到所述训练集中每个图像类别对应的第三特征均值,所述机器学习模型是采用如第一方面所述的方法训练得到的;
[0013]根据所述每个历史类别对应的第一特征均值,对所述目标图像特征进行更新,得到更新后的目标图像特征;
[0014]根据所述每个历史类别对应的第一特征均值,对所述训练集中每个图像类别对应
的第三特征均值进行更新,得到所述训练集中每个图像类别对应的更新后的第三特征均值;
[0015]根据所述更新后的目标图像特征和所述训练集中每个图像类别对应的更新后的第三特征均值,确定所述待识别图像中的内容对应的目标类别。
[0016]第三方面,本公开实施例提供一种基于知识传播的小样本类增量图像识别方法,包括:
[0017]获取历史图像集合中的历史知识;
[0018]计算训练集中各类样本图像的特征均值、以及计算测试集中待识别图像的目标图像特征;
[0019]将所述历史知识传播到所述训练集中各类样本图像的特征均值上,得到所述训练集中各类样本图像更新后的特征均值,以及将所述历史知识传播到所述待识别图像的目标图像特征上,得到所述待识别图像更新后的目标图像特征;
[0020]根据所述待识别图像更新后的目标图像特征和所述训练集中各类样本图像更新后的特征均值的相似度,确定所述待识别图像中的内容对应的目标类别。
[0021]第四方面,本公开实施例提供一种电子设备,包括:
[0022]存储器;
[0023]处理器;以及
[0024]计算机程序;
[0025]其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面、第二方面或第三方面所述的方法。
[0026]第五方面,本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现第一方面、第二方面或第三方面所述的方法。
[0027]本公开实施例提供的模型训练、图像识别方法、装置、设备及存储介质,通过待训练的机器学习模型从历史图像集合中抽取历史知识;通过所述待训练的机器学习模型,计算所述历史图像集合中第一子集合内各类样本图像的特征均值,以及计算所述历史图像集合中第二子集合内各个样本图像的特征信息;将所述历史知识传播到所述第一子集合内各类样本图像的特征均值上,得到所述第一子集合内各类样本图像更新后的特征均值,以及将所述历史知识传播到所述第二子集合内各个样本图像的特征信息上,得到所述第二子集合内各个样本图像更新后的特征信息;根据所述第二子集合内各个样本图像更新后的特征信息和所述第一子集合内各类样本图像更新后的特征均值之间的相似度,对所述机器学习模型进行训练,使得训练完成的机器学习模型可以将历史知识传播到新类别图像上,从而增强或补充新类别图像的特征信息,根据新类别图像被增强或补充后的特征信息,可以提高对新类别图像的识别精准度。因此即使冻结该机器学习模型,也可以在新类别图像出现时,通过该训练完成的机器学习模型提高对新类别图像的识别精准度。
附图说明
[0028]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0029]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0030]图1为本公开实施例提供的模型训练方法流程图;
[0031]图2为本公开实施例提供的应用场景的示意图;
[0032]图3为本公开实施例提供的模型训练的示意图;
[0033]图4为本公开另一实施例提供的模型训练方法流程图;
[0034]图5为本公开另一实施例提供的模型推理的示意图;
[0035]图6为本公开另一实施例提供的知识传播模块的示意图;
[0036]图7为本公开实施例提供的模型训练装置的结构示意图;
[0037]图8为本公开实施例提供的图像识别装置的结构示意图;
[0038]图9为本公开实施例提供的电子设备实施例的结构示意图。
具体实施方式
[0039]为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
[0040]在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
[0041]需要说明的是,本申请所涉及的图像数据(包括但不限于历史图像、样本图像、待识别图像等),为经用户授权或者经过各方充分授权的信息和数据,并且相关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其中,所述方法包括:通过待训练的机器学习模型从历史图像集合中抽取历史知识;通过所述待训练的机器学习模型,计算所述历史图像集合中第一子集合内各类样本图像的特征均值,以及计算所述历史图像集合中第二子集合内各个样本图像的特征信息;将所述历史知识传播到所述第一子集合内各类样本图像的特征均值上,得到所述第一子集合内各类样本图像更新后的特征均值,以及将所述历史知识传播到所述第二子集合内各个样本图像的特征信息上,得到所述第二子集合内各个样本图像更新后的特征信息;根据所述第二子集合内各个样本图像更新后的特征信息和所述第一子集合内各类样本图像更新后的特征均值之间的相似度,对所述机器学习模型进行训练。2.根据权利要求1所述的方法,其中,所述历史图像集合包括多个历史类别中每个历史类别下的多个历史图像;通过待训练的机器学习模型从历史图像集合中抽取历史知识,包括:针对所述多个历史类别中的每个历史类别,通过所述待训练的机器学习模型,计算所述历史类别下的多个历史图像的图像特征均值,得到所述历史类别对应的第一特征均值。3.根据权利要求2所述的方法,其中,计算所述历史图像集合中第一子集合内各类样本图像的特征均值,包括:计算所述第一子集合中每个图像类别下的多个样本图像的图像特征均值,得到所述第一子集合中每个图像类别对应的第二特征均值;计算所述历史图像集合中第二子集合内各个样本图像的特征信息,包括:计算所述第二子集合中每个样本图像的图像特征。4.根据权利要求3所述的方法,其中,将所述历史知识传播到所述第一子集合内各类样本图像的特征均值上,得到所述第一子集合内各类样本图像更新后的特征均值,包括:根据所述每个历史类别对应的第一特征均值,对所述第一子集合中每个图像类别对应的第二特征均值进行更新,得到所述第一子集合中每个图像类别对应的更新后的第二特征均值;将所述历史知识传播到所述第二子集合内各个样本图像的特征信息上,得到所述第二子集合内各个样本图像更新后的特征信息,包括:根据所述每个历史类别对应的第一特征均值,对所述第二子集合中每个样本图像的图像特征进行更新,得到所述第二子集合中每个样本图像更新后的图像特征。5.根据权利要求1所述的方法,其中,所述第一子集合包含的图像类别和所述第二子集合包含的图像类别相同,所述第一子集合包含的样本图像和所述第二子集合包含的样本图像不同。6.根据权利要求1所述的方法,其中,根据所述第二子集合内各个样本图像更新后的特征信息和所述第一子集合内各类样本图像更新后的特征均值之间的相似度,对所述机器学习模型进行训练,包括:根据所述第一子集合中每个图像类别对应的更新后的第二特征均值分别与所述第二子集合中每个样本图像更新后的图像特征的相似度、以及所述第二子集合中每个样本图像的实际类别,对所述机器学习模型进行训练。7.根据权利要求4所述的方法,其中,根据所述每个历史类别对应的第一特征均值,对
所述第一子集合中每个图像类别对应的第二特征...

【专利技术属性】
技术研发人员:王烨毛超杰江泽胤子
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1