模型训练及图像处理方法、装置、设备、存储介质制造方法及图纸

技术编号：33291313 阅读：16 留言：0更新日期：2022-05-01 00:10

本申请实施例公开了一种模型训练及图像处理方法、装置、设备、存储介质及计算机程序产品，其中该方法包括：基于第一图像样本，确定第一场景图像和第二场景图像；第一场景图像与第二场景图像之间具有重叠区域；利用待训练的第一模型，对第一场景图像和第二场景图像分别进行特征提取，得到第一场景图像的第一场景特征和所述第二场景图像的第二场景特征，并利用第二模型，对第一场景图像和第二场景图像分别进行特征提取，得到第一场景图像的第三场景特征和第二场景图像的第四场景特征；基于第一场景特征和第二场景特征、第三场景特征和第四场景特征，确定目标损失值；基于目标损失值，对第一模型的模型参数进行至少一次更新，得到训练后的第一模型。的第一模型。的第一模型。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练及图像处理方法、装置、设备、存储介质

[0001]本申请涉及但不限人工智能领域，尤其涉及一种模型训练及图像处理方法、装置、设备、存储介质及计算机程序产品。

技术介绍

[0002]伴随着计算机视觉的技术不断发展，无标签数据的获取越来越容易。然而，对于计算机视觉领域海量的无标签数据集，使用人工的方式进行标注，会存在漏标的问题，并且消耗大量人工成本。相关技术中，可以采用自监督训练算法，对神经网络模型进行训练。自监督训练算法不需要提供带标签的数据也能训练模型，并为计算机视觉领域各类任务提供预训练后的模型。相比于有监督训练算法，自监督训练算法在减少有监督偏见、长尾问题、以及拟合海量业务数据集等方面有着明显优势。
[0003]但是，相关技术中的自监督训练算法仅能在单目标图像上进行模型训练，而无法适用于多目标图像上的模型训练，通用性较差。

技术实现思路

[0004]有鉴于此，本申请实施例提供一种模型训练及图像处理方法、装置、设备、存储介质及计算机程序产品。
[0005]本申请实施例的技术方案是这样实现的：
[0006]一方面，本申请实施例提供一种模型训练方法，所述方法包括：
[0007]基于第一图像样本，确定第一场景图像和第二场景图像；所述第一场景图像与所述第二场景图像之间具有重叠区域；
[0008]利用待训练的第一模型，对所述第一场景图像和所述第二场景图像分别进行特征提取，得到所述第一场景图像的第一场景特征和所述第二场景图像的第二场景特征，并利用第二模型，对所述第一...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，所述方法包括：基于第一图像样本，确定第一场景图像和第二场景图像；所述第一场景图像与所述第二场景图像之间具有重叠区域；利用待训练的第一模型，对所述第一场景图像和所述第二场景图像分别进行特征提取，得到所述第一场景图像的第一场景特征和所述第二场景图像的第二场景特征，并利用第二模型，对所述第一场景图像和所述第二场景图像分别进行特征提取，得到所述第一场景图像的第三场景特征和所述第二场景图像的第四场景特征；基于所述第一场景特征和所述第二场景特征、以及所述第三场景特征和所述第四场景特征，确定目标损失值；基于所述目标损失值，对所述第一模型的模型参数进行至少一次更新，得到训练后的所述第一模型。2.根据权利要求1所述的方法，其特征在于，所述基于所述第一场景特征和所述第二场景特征、以及所述第三场景特征和所述第四场景特征，确定目标损失值，包括：基于所述第一场景特征和所述第二场景特征、以及所述第三场景特征和所述第四场景特征，确定目标场景损失值；基于所述目标场景损失值，确定目标损失值。3.根据权利要求2所述的方法，其特征在于，所述基于所述第一场景特征和所述第二场景特征、以及所述第三场景特征和所述第四场景特征，确定目标场景损失值，包括：基于所述第一场景特征和所述第四场景特征之间的相似度，确定第一场景损失值；基于所述第二场景特征和所述第三场景特征之间的相似度，确定第二场景损失值；基于所述第一场景损失值和所述第二场景损失值，确定所述目标场景损失值。4.根据权利要求2或3所述的方法，其特征在于，所述重叠区域内包括至少一个候选实例；所述基于所述目标场景损失值，确定目标损失值，包括：基于所述目标场景损失值和目标实例损失值，确定目标损失值；其中，所述目标实例损失值包括以下至少之一：第一实例损失值和第二实例损失值；所述基于所述第一场景特征和所述第二场景特征、以及所述第三场景特征和所述第四场景特征，确定目标损失值，还包括：在所述目标实例损失值包括所述第一实例损失值的情况下，基于所述第三场景特征和所述第四场景特征、以及每一所述候选实例在所述第一场景图像中的第一实例特征，确定所述第一实例损失值；每一所述第一实例特征是利用所述第一模型提取的；在所述目标实例损失值包括所述第二实例损失值的情况下，基于每一所述第一实例特征和每一所述候选实例在所述第二场景图像中的第二实例特征，确定所述第二实例损失值；每一所述第二实例特征是利用所述第二模型提取的。5.根据权利要求4所述的方法，其特征在于，所述第三场景特征和所述第四场景特征维度相同；所述基于所述第三场景特征和所述第四场景特征、以及每一所述候选实例在所述第一场景图像中的第一实例特征，确定所述第一实例损失值，包括：将每一所述第一实例特征进行连接，得到连接特征；将所述连接特征映射至所述第三场景特征的维度，得到映射特征；
基于所述第三场景特征、所述第四场景特征和所述映射特征，确定第一实例损失值。6.根据权利要求5所述的方法，其特征在于，所述基于所述第三场景特征、所述第四场景特征和所述映射特征，确定第一实例损失值，包括：基于所述第三场景特征和所述映射特征之间的相似度，确定第一子损失值；基于所述第四场景特征和所述映射特征之间的相似度，确定第二子损失值；基于所述第一子损失值和所述第二子损失值，确定第一实例损失值。7.根据权利要求4至6中任一项所述的方法，其特征在于，所述基于每一所述第一实例特征和每一所述候选实例在所述第二场景图像中的第二实例特征，确定所述第二实例损失值，包括：对每一所述第一实例特征和每一所述第二实例特征进行匹配，得到至少一对具有目标匹配关系的第一实例特征和第二实例特征；基于每一对具有目标匹配关系的第一实例特征和第二实例特征，确定第二实例损失值。8.根据权利要求7所述的方法，其特征在于，所述对每一所述第一实例特征和每一所述第二实例特征进行匹配，得到至少一对具有目标匹配关系的第一实例特征和第二实例特征，包括：基于最优传输算法，对每一所述第一实例特征和每一所述第二实例特征进行匹配，得到至少一对具有目标匹配关系的第一实例特征和第二实例特征；所述基于每一对具有目标匹配关系的第一实例特征和第二实例特征，确定第二实例损失值，包括：基于每一对具有目标匹配关系的第一实例特征和第二实例特征之间的传输成本，确定第二实例损失值。9.根据权利要求4至8中任一项所述的方法，其特征在于，所述方法还包括：从所述第一场景图像中获取所述重叠区域内每一候选实例对应的第一实例图像；利用所述第一模型，对每一所述第一实例图像进行特征提取，得到每一所述第一实例特征。10.根据权利要求9所述的方法，其特征在于，所述从所述第一场景图像中获取所述重叠区域内每一候选实例对应的第一实例图像，包括：从所述第一场景图像中获取所述重叠区域内每一候选实例对应的第一候选区域图像；将每一所述第一候选区域图像的尺寸调整至目标尺寸，得到每一所述候选实例对应的第一实例图像。11.根据权利要求4至10中任一项所述的方法，其特征在于，在所述目标实例损失值包括所述第二实例损失值的情况下，所述方法还包括：从所述第二场景图像中获取所述重叠区域内每一候选实例对...

【专利技术属性】
技术研发人员：李朝闻，朱优松，杨帆，李韡，赵朝阳，陈志扬，吴立威，赵瑞，唐明，王金桥，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人