图像识别模型生成方法、图像识别方法、装置及设备制造方法及图纸

技术编号：39031910 阅读：9 留言：0更新日期：2023-10-10 11:45

本公开实施例提供一种图像识别模型生成方法、图像识别方法、装置及设备，通过获取第一图像数据，并对第一图像数据进行分类增强，得到第一目标数据和第二目标数据，其中，第一图像数据为无标数据，第一目标数据和第二目标数据分别为对第一图像数据进行特征变换后得到的图像数据；基于第一目标数据和第二目标数据，对初始模型进行无监督训练，得到预训练模型；基于目标分类信息对预训练模型进行训练，得到图像识别模型，其中，目标分类信息表征图像的目标类别，图像识别模型用于识别目标类别的图像，可有效提高最终得到的图像识别模型的鲁棒性，提高模型在不同环境下的图像识别效果。果。果。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别模型生成方法、图像识别方法、装置及设备

[0001]本公开实施例涉及人工智能和机器视觉
，尤其涉及一种图像识别模型生成方法、图像识别方法、装置及设备。

技术介绍

[0002]当前，随机人工智能技术的快速发展，人工智能技术在机器视觉领域有了广泛的应用，机器视觉是一种通过机器代替人眼来做测量和判断的技术，具体而言，即通过采集图像数据，基于图像识别模型对图像数据进行识别，从而获得图像中的信息，实现模拟人眼测量和判断的目的。
[0003]现有技术中，基于神经网络的图像识别模型在实际使用前，需要通过大量图像数据进行训练直至模型收敛，而训练样本通常是有标数据。
[0004]然而，由于有标数据的获取成本高，数据量有限，导致训练后生成的图像识别模型存在鲁棒性较差，在不同环境下的模型表现不稳定的问题。

技术实现思路

[0005]本公开实施例提供一种图像识别模型生成方法、图像识别方法、装置及设备，以克服图像识别模型存在鲁棒性较差，在不同环境下的模型表现不稳定的问题。
[0006]第一方面，本公开实施例提供一种图像识别模型生成方法，包括：
[0007]获取第一图像数据，并对所述第一图像数据进行分类增强，得到第一目标数据和第二目标数据，其中，所述第一图像数据为无标数据，所述第一目标数据和所述第二目标数据分别为对所述第一图像数据进行特征变换后得到的图像数据；基于所述第一目标数据和所述第二目标数据，对初始模型进行无监督训练，得到预训练模型；基于目标分类信息对预训练模型进行训练，得到图...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型生成方法，其特征在于，包括：获取第一图像数据，并对所述第一图像数据进行分类增强，得到第一目标数据和第二目标数据，其中，所述第一图像数据为无标数据，所述第一目标数据和所述第二目标数据分别为对所述第一图像数据进行特征变换后得到的图像数据；基于所述第一目标数据和所述第二目标数据，对初始模型进行无监督训练，得到预训练模型；基于目标分类信息对预训练模型进行训练，得到图像识别模型，其中，所述目标分类信息表征图像的目标类别，所述图像识别模型用于识别所述目标类别的图像。2.根据权利要求1所述的方法，其特征在于，所述第一图像数据包括无标记的第一图像，所述第一目标数据包括无标记的第一目标图像，所述第二目标数据包括无标记的第二目标图像；对所述第一图像数据进行分类增强，得到第一目标数据和第二目标数据，包括：基于第一增强策略，对所述第一图像进行特征变换，得到所述第一增强策略对应的第一目标图像；基于第二增强策略，对所述第一图像进行特征变换，得到所述第二增强策略对应的第二目标图像。3.根据权利要求2所述的方法，其特征在于，所述第一增强策略包括第一特征信息和对应的第一强度系数，所述第二增强策略包括第二特征信息和对应的第二强度系数；其中，所述第一特征信息和所述第二特征信息表征特征变换的类型；所述第一强度系数和所述第二强度系数表征特征变换的强度；所述第一特征信息或第二特征信息包括以下至少一种：图像剪裁变换、图像尺寸变换、图像色彩变换、图像高斯模糊变换。4.根据权利要求2所述的方法，其特征在于，基于所述第一目标数据和所述第二目标数据，对初始模型进行无监督训练，得到预训练模型，包括：循环执行以下步骤，直至达到第一预设条件时，所述初始模型生成所述预训练模型：将所述第一目标图像和所述第二目标图像输入所述初始模型，得到所述初始模型输出的第一识别结果和第二识别结果，其中，所述第一识别结果表征所述第一目标图像的视觉表示，所述第二识别结果表征所述第二目标图像的视觉表示；基于所述第一识别结果和所述第二识别结果对应的相似度损失函数值，调整所述初始模型的模型参数。5.根据权利要求1所述的方法，其特征在于，基于目标分类信息对预训练模型进行训练，得到图像识别模型，包括：获取所述目标分类信息对应的第二图像数据，其中，所述第二图像数据包括有标记的第二图像、无标记的第三图像；根据所述第二图像数据，对所述预训练模型进行半监督训练，得到所述图像识别模型。6.根据权利要求5所述的方法，其特征在于，所述根据所述第二图像数据，对所述预训练模型进行半监督训练，得到所述图像识别模型，包括：循环执行以下步骤，直至达到第二预设条件时，所述预训练模型生成所述图像识别模型：
将所述第二图像输入所述预训练模型，得到所述第二图像对应的第一损失函数值，所述第一损失函数值对应的损失函数为交叉熵损失函数；将所述第三图像输入所述预训练模型，得到所述第三图像对应的第二损失函数值，其中，所述第二损失函数值对应的损失函数为均方误差损失函数；根据所述第一损失函数值和所述第二损失函数值的加权和，得到整体损失函数值；基于所述整体损失函数值，调整所述预训练模型的模型参数。7.根据权利要求6所述的方法，其特征在于，所述将所述第三图像输入所述预训练模型，得到所述第三图像对应的第二损失函数值，包括：基于第一增强策略和第二增强策略，分别对所述第三图像进行特征变换，得到所述第一增强策略对应的第三目标图像，和所述第二增强策略对应的第四目标图像；将所述第三目标图像和所述第四目标图像输入所述预训练模型，得到所述预训...

【专利技术属性】
技术研发人员：吴捷，
申请(专利权)人：北京字跳网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人