模型训练方法、装置、存储介质及程序产品制造方法及图纸

技术编号：37911523 阅读：7 留言：0更新日期：2023-06-21 22:34

本申请涉及一种模型训练方法、装置、存储介质及程序产品，所述方法包括：根据待预测样本中的图像数据和第一预测模型，得到待预测样本的标签；根据待预测样本中的多维度数据得到待预测样本的超图；根据超图对待预测样本的标签进行修正，得到修正后的标签；根据修正后的标签对第一预测模型进行训练，得到第二预测模型。根据本申请实施例的模型训练方法，在源域模型的基础上，根据视觉维度信息和时空维度信息的关联关系训练得到适应于目标域的模型，使得得到的模型对目标域的适应性更强，从而能提升使用得到的模型进行特征提取的效果，进而提升对目标域的数据的识别效果。升对目标域的数据的识别效果。升对目标域的数据的识别效果。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置、存储介质及程序产品

[0001]本申请涉及深度学习领域，尤其涉及一种模型训练方法、装置、存储介质及程序产品。

技术介绍

[0002]近年来，深度学习在人脸识别、人体识别等方面取得了重大突破，其成功主要归因于深度学习使用大量标注数据用于模型的训练。在实际应用中，使用源域(旧场景)的标注数据训练得到的源域模型，对于源域下的无标注数据进行特征提取的效果是比较好的。然而，在目标域(新场景)数据与源域数据存在统计分布差异时，源域模型对于目标域的无标注数据的特征提取却有诸多问题。一方面，为了保证特征提取具有较好效果，可以对目标域的数据进行标注，再基于目标域的标注数据进行模型训练，但大规模标注数据的数据处理成本过于巨大。另一方面，为了降低数据处理成本，可以直接在目标域使用源域模型，但由于目标域的数据未经标注，会使得源域模型在目标域中的性能大幅下降。
[0003]综上所述，现有技术的方案在如何提升源域模型在目标域的性能方面仍有优化空间。

技术实现思路

[0004]有鉴于此，提出了一种模型训练方法、装置、存储介质及程序产品，根据本申请实施例的模型训练方法，在源域模型的基础上，根据视觉维度信息和时空维度信息的关联关系训练得到适应于目标域的模型，使得得到的模型对目标域的适应性更强，从而能提升使用得到的模型进行特征提取的效果，进而提升对目标域的数据的识别效果。
[0005]第一方面，本申请的实施例提供了一种模型训练方法，所述方法包括：根据待预测样本中的图像数据和第一预测模型，得到待预测样本...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，所述方法包括：根据待预测样本中的图像数据和第一预测模型，得到待预测样本的标签，所述待预测样本中包括多维度数据，所述多维度数据至少包括图像数据和与图像数据对应的时空数据；根据待预测样本中的多维度数据得到待预测样本的超图，所述超图以待预测样本作为顶点、以样本间多维度下的关联程度作为超边缘；根据所述超图对待预测样本的标签进行修正，得到修正后的标签；根据所述修正后的标签对所述第一预测模型进行训练，得到第二预测模型。2.根据权利要求1所述的方法，其特征在于，所述根据待预测样本中的图像数据和第一预测模型，得到待预测样本的标签，包括：将待预测样本中的图像数据输入所述第一预测模型，得到待预测样本的视觉特征；根据所述待预测样本的视觉特征得到待预测样本的样本间相似度；根据所述样本间相似度对待预测样本进行聚类，根据聚类结果得到待预测样本的标签。3.根据权利要求1或2所述的方法，其特征在于，所述根据待预测样本中的多维度数据得到待预测样本的超图，包括：根据待预测样本中的多维度数据得到样本间的至少一个相似度矩阵；根据所述至少一个相似度矩阵得到待预测样本的超图。4.根据权利要求3所述的方法，其特征在于，所述根据待预测样本中的多维度数据得到样本间的至少一个相似度矩阵包括：根据待预测样本中的时空数据得到待预测样本的样本间时空一致程度；根据待预测样本的样本间时空一致程度和待预测样本的样本间相似度，得到样本间的联合相似度矩阵。5.根据权利要求4所述的方法，其特征在于，所述多维度数据还包括所述图像数据对应的场景数据，所述场景数据包括所述待预测样本中的图像数据产生的时间和/或产生的地点的场景信息，所述场景数据包括至少一个类型的场景信息，所述根据待预测样本中的多维度数据得到样本间的至少一个相似度矩阵还包括：根据所述场景数据得到样本间的场景相似度矩阵，其中，每一类型的场景信息对应一个场景相似度矩阵。6.根据权利要求4或5所述的方法，其特征在于，所述多维度数据还包括属性数据，所述属性数据为待预测样本中的图像数据中的对象的属性信息，所述属性数据包括至少一个类型的属性信息，所述根据待预测样本中的多维度数据得到样本间的至少一个相似度矩阵还包括：根据所述属性数据得到样本间的属性相似度矩阵，其中，每一类型的属性信息对应一个属性相似度矩阵。7.根据权利要求4
‑
6中任一项所述的方法，其特征在于，所述根据所述至少一个相似度矩阵得到待预测样本的超图，包括：根据所述至少一个相似度矩阵中的每一矩阵，得到每个矩阵对应的超图；合并每个矩阵对应的超图中的超边缘，以合并后的超边缘作为待预测样本的超图的超
边缘，得到待预测样本的超图。8.根据权利要求1
‑
7中任一项所述的方法，其特征在于，所述根据所述超图对待预测样本的标签进行修正，得到修正后的标签，包括：将待预测样本分类为可信样本和不可信样本；根据待预测样本的标签得到可信样本的分类误差和第0次的不可信样本的分类误差；根据所述超图以及第t
‑
1次的不可信样本的分类误差，得到第t次的不可信样本的分类误差，其中1＜t≤T且为整数，T是大于1的整数；根据可信样本的分类误差和第T次的不可信样本的分类误差、待预测样本的标签以及所述超图...

【专利技术属性】
技术研发人员：吴一鸣，施克游，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人