图像识别模型生成方法、图像识别方法、装置及设备制造方法及图纸

技术编号:39031910 阅读:9 留言:0更新日期:2023-10-10 11:45
本公开实施例提供一种图像识别模型生成方法、图像识别方法、装置及设备,通过获取第一图像数据,并对第一图像数据进行分类增强,得到第一目标数据和第二目标数据,其中,第一图像数据为无标数据,第一目标数据和第二目标数据分别为对第一图像数据进行特征变换后得到的图像数据;基于第一目标数据和第二目标数据,对初始模型进行无监督训练,得到预训练模型;基于目标分类信息对预训练模型进行训练,得到图像识别模型,其中,目标分类信息表征图像的目标类别,图像识别模型用于识别目标类别的图像,可有效提高最终得到的图像识别模型的鲁棒性,提高模型在不同环境下的图像识别效果。果。果。

【技术实现步骤摘要】
图像识别模型生成方法、图像识别方法、装置及设备


[0001]本公开实施例涉及人工智能和机器视觉
,尤其涉及一种图像识别模型生成方法、图像识别方法、装置及设备。

技术介绍

[0002]当前,随机人工智能技术的快速发展,人工智能技术在机器视觉领域有了广泛的应用,机器视觉是一种通过机器代替人眼来做测量和判断的技术,具体而言,即通过采集图像数据,基于图像识别模型对图像数据进行识别,从而获得图像中的信息,实现模拟人眼测量和判断的目的。
[0003]现有技术中,基于神经网络的图像识别模型在实际使用前,需要通过大量图像数据进行训练直至模型收敛,而训练样本通常是有标数据。
[0004]然而,由于有标数据的获取成本高,数据量有限,导致训练后生成的图像识别模型存在鲁棒性较差,在不同环境下的模型表现不稳定的问题。

技术实现思路

[0005]本公开实施例提供一种图像识别模型生成方法、图像识别方法、装置及设备,以克服图像识别模型存在鲁棒性较差,在不同环境下的模型表现不稳定的问题。
[0006]第一方面,本公开实施例提供一种图像识别模型生成方法,包括:
[0007]获取第一图像数据,并对所述第一图像数据进行分类增强,得到第一目标数据和第二目标数据,其中,所述第一图像数据为无标数据,所述第一目标数据和所述第二目标数据分别为对所述第一图像数据进行特征变换后得到的图像数据;基于所述第一目标数据和所述第二目标数据,对初始模型进行无监督训练,得到预训练模型;基于目标分类信息对预训练模型进行训练,得到图像识别模型,其中,所述目标分类信息表征图像的目标类别,所述图像识别模型用于识别所述目标类别的图像。
[0008]第二方面,本公开实施例提供一种图像识别方法,包括:
[0009]获取待识别图像;
[0010]通过训练至收敛的图像识别模型,对所述待识别图像进行识别,得到识别结果,所述识别结果表征所述待识别图像的目标类别,其中,所述图像识别模型是通过如上第一方面以及第一方面各种可能的设计所述的图像识别模型生成方法得到的。
[0011]第三方面,本公开实施例提供一种图像识别模型生成装置,包括:
[0012]获取模块,用于获取第一图像数据,并对所述第一图像数据进行分类增强,得到第一目标数据和第二目标数据,其中,所述第一图像数据为无标数据,所述第一目标数据和所述第二目标数据分别为对所述第一图像数据进行特征变换后得到的图像数据;
[0013]第一训练模块,用于基于所述第一目标数据和所述第二目标数据,对初始模型进行无监督训练,得到预训练模型;
[0014]第二训练模块,用于基于目标分类信息对预训练模型进行训练,得到图像识别模
型,其中,所述目标分类信息表征图像的目标类别,所述图像识别模型用于识别所述目标类别的图像。
[0015]第四方面,本公开实施例提供一种图像识别装置,包括:
[0016]获取模块,用于获取待识别图像;
[0017]识别模块,用于通过训练至收敛的图像识别模型,对所述待识别图像进行识别,得到识别结果,所述识别结果表征所述待识别图像的目标类别,其中,所述图像识别模型是通过如上第一方面以及第一方面各种可能的设计所述的图像识别模型生成方法得到的。
[0018]第五方面,本公开实施例提供一种电子设备,包括:
[0019]处理器,以及与所述处理器通信连接的存储器;
[0020]所述存储器存储计算机执行指令;
[0021]所述处理器执行所述存储器存储的计算机执行指令,以实现如上第一方面以及第一方面各种可能的设计所述的方法,或者,以实现如上第二方面以及第二方面各种可能的设计所述的方法。
[0022]第六方面,本公开实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的方法,或者,以实现如上第二方面以及第二方面各种可能的设计所述的方法。
[0023]第五方面,本公开实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上第一方面以及第一方面各种可能的设计所述的方法,或者,实现如上第二方面以及第二方面各种可能的设计所述的方法。
[0024]本公开实施例提供的图像识别模型生成方法、图像识别方法、装置及设备,通过获取第一图像数据,并对所述第一图像数据进行分类增强,得到第一目标数据和第二目标数据,其中,所述第一图像数据为无标数据,所述第一目标数据和所述第二目标数据分别为对所述第一图像数据进行特征变换后得到的图像数据;基于所述第一目标数据和所述第二目标数据,对初始模型进行无监督训练,得到预训练模型;基于目标分类信息对预训练模型进行训练,得到图像识别模型,其中,所述目标分类信息表征图像的目标类别,所述图像识别模型用于识别所述目标类别的图像,由于首先利用无标数据对模型进行了预训练,生所成的预训练模型具备一定的视觉鲁棒性,之后再针对该预训练模型进行特定类别的图像识别训练,可有效提高最终得到的图像识别模型的鲁棒性,提高模型在不同环境下的图像识别效果。
附图说明
[0025]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0026]图1为现有技术中一种图像识别模型的训练过程示意图;
[0027]图2为本公开实施例提供的图像识别模型生成方法的流程示意图一;
[0028]图3为图2所示实施例中步骤S101的具体实现步骤流程图;
[0029]图4为本公开实施例提供的一种对第一图像数据进行分类增强的过程示意图;
[0030]图5为图2所示实施例中步骤S102的具体实现步骤流程图;
[0031]图6为本公开实施例提供的图像识别模型生成方法的流程示意图二;
[0032]图7为图6所示实施例中步骤S204的具体实现步骤流程图;
[0033]图8为图7所示实施例中步骤S2042的具体实现步骤流程图;
[0034]图9为图6所示实施例中步骤S206的具体实现步骤流程图;
[0035]图10为本公开实施例提供的一种对图像识别模型进行训练的过程示意图;
[0036]图11为本公开实施例提供的一种图像识别方法的流程示意图;
[0037]图12为本公开实施例提供的图像识别模型生成装置的结构框图;
[0038]图13为本公开实施例提供的图像识别装置的结构框图;
[0039]图14为本公开实施例提供的一种电子设备的结构示意图;
[0040]图15为本公开实施例提供的电子设备的硬件结构示意图。
具体实施方式
[0041]为使本公开实施例的目的、技术方案和优点更加清楚,下面将结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型生成方法,其特征在于,包括:获取第一图像数据,并对所述第一图像数据进行分类增强,得到第一目标数据和第二目标数据,其中,所述第一图像数据为无标数据,所述第一目标数据和所述第二目标数据分别为对所述第一图像数据进行特征变换后得到的图像数据;基于所述第一目标数据和所述第二目标数据,对初始模型进行无监督训练,得到预训练模型;基于目标分类信息对预训练模型进行训练,得到图像识别模型,其中,所述目标分类信息表征图像的目标类别,所述图像识别模型用于识别所述目标类别的图像。2.根据权利要求1所述的方法,其特征在于,所述第一图像数据包括无标记的第一图像,所述第一目标数据包括无标记的第一目标图像,所述第二目标数据包括无标记的第二目标图像;对所述第一图像数据进行分类增强,得到第一目标数据和第二目标数据,包括:基于第一增强策略,对所述第一图像进行特征变换,得到所述第一增强策略对应的第一目标图像;基于第二增强策略,对所述第一图像进行特征变换,得到所述第二增强策略对应的第二目标图像。3.根据权利要求2所述的方法,其特征在于,所述第一增强策略包括第一特征信息和对应的第一强度系数,所述第二增强策略包括第二特征信息和对应的第二强度系数;其中,所述第一特征信息和所述第二特征信息表征特征变换的类型;所述第一强度系数和所述第二强度系数表征特征变换的强度;所述第一特征信息或第二特征信息包括以下至少一种:图像剪裁变换、图像尺寸变换、图像色彩变换、图像高斯模糊变换。4.根据权利要求2所述的方法,其特征在于,基于所述第一目标数据和所述第二目标数据,对初始模型进行无监督训练,得到预训练模型,包括:循环执行以下步骤,直至达到第一预设条件时,所述初始模型生成所述预训练模型:将所述第一目标图像和所述第二目标图像输入所述初始模型,得到所述初始模型输出的第一识别结果和第二识别结果,其中,所述第一识别结果表征所述第一目标图像的视觉表示,所述第二识别结果表征所述第二目标图像的视觉表示;基于所述第一识别结果和所述第二识别结果对应的相似度损失函数值,调整所述初始模型的模型参数。5.根据权利要求1所述的方法,其特征在于,基于目标分类信息对预训练模型进行训练,得到图像识别模型,包括:获取所述目标分类信息对应的第二图像数据,其中,所述第二图像数据包括有标记的第二图像、无标记的第三图像;根据所述第二图像数据,对所述预训练模型进行半监督训练,得到所述图像识别模型。6.根据权利要求5所述的方法,其特征在于,所述根据所述第二图像数据,对所述预训练模型进行半监督训练,得到所述图像识别模型,包括:循环执行以下步骤,直至达到第二预设条件时,所述预训练模型生成所述图像识别模型:
将所述第二图像输入所述预训练模型,得到所述第二图像对应的第一损失函数值,所述第一损失函数值对应的损失函数为交叉熵损失函数;将所述第三图像输入所述预训练模型,得到所述第三图像对应的第二损失函数值,其中,所述第二损失函数值对应的损失函数为均方误差损失函数;根据所述第一损失函数值和所述第二损失函数值的加权和,得到整体损失函数值;基于所述整体损失函数值,调整所述预训练模型的模型参数。7.根据权利要求6所述的方法,其特征在于,所述将所述第三图像输入所述预训练模型,得到所述第三图像对应的第二损失函数值,包括:基于第一增强策略和第二增强策略,分别对所述第三图像进行特征变换,得到所述第一增强策略对应的第三目标图像,和所述第二增强策略对应的第四目标图像;将所述第三目标图像和所述第四目标图像输入所述预训练模型,得到所述预训...

【专利技术属性】
技术研发人员:吴捷
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1