模型训练方法、装置、存储介质及程序产品制造方法及图纸

技术编号:37911523 阅读:7 留言:0更新日期:2023-06-21 22:34
本申请涉及一种模型训练方法、装置、存储介质及程序产品,所述方法包括:根据待预测样本中的图像数据和第一预测模型,得到待预测样本的标签;根据待预测样本中的多维度数据得到待预测样本的超图;根据超图对待预测样本的标签进行修正,得到修正后的标签;根据修正后的标签对第一预测模型进行训练,得到第二预测模型。根据本申请实施例的模型训练方法,在源域模型的基础上,根据视觉维度信息和时空维度信息的关联关系训练得到适应于目标域的模型,使得得到的模型对目标域的适应性更强,从而能提升使用得到的模型进行特征提取的效果,进而提升对目标域的数据的识别效果。升对目标域的数据的识别效果。升对目标域的数据的识别效果。

【技术实现步骤摘要】
模型训练方法、装置、存储介质及程序产品


[0001]本申请涉及深度学习领域,尤其涉及一种模型训练方法、装置、存储介质及程序产品。

技术介绍

[0002]近年来,深度学习在人脸识别、人体识别等方面取得了重大突破,其成功主要归因于深度学习使用大量标注数据用于模型的训练。在实际应用中,使用源域(旧场景)的标注数据训练得到的源域模型,对于源域下的无标注数据进行特征提取的效果是比较好的。然而,在目标域(新场景)数据与源域数据存在统计分布差异时,源域模型对于目标域的无标注数据的特征提取却有诸多问题。一方面,为了保证特征提取具有较好效果,可以对目标域的数据进行标注,再基于目标域的标注数据进行模型训练,但大规模标注数据的数据处理成本过于巨大。另一方面,为了降低数据处理成本,可以直接在目标域使用源域模型,但由于目标域的数据未经标注,会使得源域模型在目标域中的性能大幅下降。
[0003]综上所述,现有技术的方案在如何提升源域模型在目标域的性能方面仍有优化空间。

技术实现思路

[0004]有鉴于此,提出了一种模型训练方法、装置、存储介质及程序产品,根据本申请实施例的模型训练方法,在源域模型的基础上,根据视觉维度信息和时空维度信息的关联关系训练得到适应于目标域的模型,使得得到的模型对目标域的适应性更强,从而能提升使用得到的模型进行特征提取的效果,进而提升对目标域的数据的识别效果。
[0005]第一方面,本申请的实施例提供了一种模型训练方法,所述方法包括:根据待预测样本中的图像数据和第一预测模型,得到待预测样本的标签,所述待预测样本中包括多维度数据,所述多维度数据至少包括图像数据和与图像数据对应的时空数据;根据待预测样本中的多维度数据得到待预测样本的超图,所述超图以待预测样本作为顶点、以样本间多维度下的关联程度作为超边缘;根据所述超图对待预测样本的标签进行修正,得到修正后的标签;根据所述修正后的标签对所述第一预测模型进行训练,得到第二预测模型。
[0006]根据本申请实施例的模型训练方法,根据待预测样本中的多维度数据可以得到待预测样本的超图,由于待预测样本中包括多维度数据,因此待预测样本的超图可以包括样本间多维度下的关联程度信息。再根据超图对使用第一预测模型得到的待预测样本的标签进行修正,得到修正后的标签,使得修正后的标签也因考虑了样本间多维度下的关联程度而更加准确。进一步使得根据修正后的标签对第一预测模型进行训练得到的第二预测模型的性能也有所提升。从而能提升使用得到的模型进行特征提取的效果,进而提升对目标域的数据的识别效果。
[0007]根据第一方面,在所述模型训练方法的第一种可能的实现方式中,所述根据待预测样本中的图像数据和第一预测模型,得到待预测样本的标签,包括:将待预测样本中的图
像数据输入所述第一预测模型,得到待预测样本的视觉特征;根据所述待预测样本的视觉特征得到待预测样本的样本间相似度;根据所述样本间相似度对待预测样本进行聚类,根据聚类结果得到待预测样本的标签。
[0008]通过这种方式,可以完成待预测样本的聚类,得到待预测样本的标签。聚类根据由样本视觉特征得到的样本间相似度来实现,能够保证聚类的结果在视觉维度下具有一定的准确度。
[0009]根据第一方面或第一方面的第一种可能的实现方式,在所述模型训练方法的第二种可能的实现方式中,所述根据待预测样本中的多维度数据得到待预测样本的超图,包括:根据待预测样本中的多维度数据得到样本间的至少一个相似度矩阵;根据所述至少一个相似度矩阵得到待预测样本的超图。
[0010]通过这种方式,使得可以容易地将多个维度下的数据应用于待预测样本的超图的获取,并且采用通过多维度数据获取相似度矩阵、并且通过相似度矩阵获取待预测样本的超图的方式,便于通过增加相似度矩阵数量来提升超图的准确程度。
[0011]根据第一方面的第二种可能的实现方式,在所述模型训练方法的第三种可能的实现方式中,所述根据待预测样本中的多维度数据得到样本间的至少一个相似度矩阵包括:根据待预测样本中的时空数据得到待预测样本的样本间时空一致程度;根据待预测样本的样本间时空一致程度和待预测样本的样本间相似度,得到样本间的联合相似度矩阵。
[0012]样本间的联合相似度矩阵是根据样本间时空一致程度和待预测样本的样本间相似度得到的,样本间时空一致程度和待预测样本的样本间相似度又分别是根据对应于图像数据的时空数据和图像数据得到的,因此,样本间的联合相似度矩阵可以指示待预测样本在视觉维度和时空维度下的相似程度,使得对于样本的相似程度的预测更为准确。
[0013]根据第一方面的第三种可能的实现方式,在所述模型训练方法的第四种可能的实现方式中,所述多维度数据还包括所述图像数据对应的场景数据,所述场景数据包括所述待预测样本中的图像数据产生的时间和/或产生的地点的场景信息,所述场景数据包括至少一个类型的场景信息,所述根据待预测样本中的多维度数据得到样本间的至少一个相似度矩阵还包括:根据所述场景数据得到样本间的场景相似度矩阵,其中,每一类型的场景信息对应一个场景相似度矩阵。
[0014]通过这种方式,使得能够获取到图像数据的采集场景的场景相似度矩阵,通过增加场景数据的类型可以对应增加可用于获得超图的相似度矩阵的数量,并且使用场景数据可以扩展超图对于多维度下待预测样本的关联程度的支持能力。
[0015]根据第一方面的第三种或第四种可能的实现方式,在所述模型训练方法的第五种可能的实现方式中,所述多维度数据还包括属性数据,所述属性数据为待预测样本中的图像数据中的对象的属性信息,所述属性数据包括至少一个类型的属性信息,所述根据待预测样本中的多维度数据得到样本间的至少一个相似度矩阵还包括:根据所述属性数据得到样本间的属性相似度矩阵,其中,每一类型的属性信息对应一个属性相似度矩阵。
[0016]通过这种方式,使得能够获取到图像数据中的对象属性的属性相似度矩阵,通过属性数据的类型增加可以对应增加可用于获得超图的相似度矩阵的数量,并且使用属性数据可以扩展超图对于多维度下待预测样本的关联程度的支持能力。
[0017]根据第一方面的第三种至第五种可能的实现方式中的任意一种可能的实现方式,
在所述模型训练方法的第六种可能的实现方式中,所述根据所述至少一个相似度矩阵得到待预测样本的超图,包括:根据所述至少一个相似度矩阵中的每一矩阵,得到每个矩阵对应的超图;合并每个矩阵对应的超图中的超边缘,以合并后的超边缘作为待预测样本的超图的超边缘,得到待预测样本的超图。
[0018]通过这种方式,使得用于修正标签的超图,是综合了样本在多维度下的相似度的超图,使得待预测样本的超图指示的样本间的多维度下的关联程度更为准确。
[0019]根据第一方面,以及以上第一方面的任意一种可能的实现方式,在所述模型训练方法的第七种可能的实现方式中,所述根据所述超图对待预测样本的标签进行修正,得到修正后的标签,包括:将待预测样本分类为可信样本和不可信样本;根据待预测样本的标签得到可信样本的分类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:根据待预测样本中的图像数据和第一预测模型,得到待预测样本的标签,所述待预测样本中包括多维度数据,所述多维度数据至少包括图像数据和与图像数据对应的时空数据;根据待预测样本中的多维度数据得到待预测样本的超图,所述超图以待预测样本作为顶点、以样本间多维度下的关联程度作为超边缘;根据所述超图对待预测样本的标签进行修正,得到修正后的标签;根据所述修正后的标签对所述第一预测模型进行训练,得到第二预测模型。2.根据权利要求1所述的方法,其特征在于,所述根据待预测样本中的图像数据和第一预测模型,得到待预测样本的标签,包括:将待预测样本中的图像数据输入所述第一预测模型,得到待预测样本的视觉特征;根据所述待预测样本的视觉特征得到待预测样本的样本间相似度;根据所述样本间相似度对待预测样本进行聚类,根据聚类结果得到待预测样本的标签。3.根据权利要求1或2所述的方法,其特征在于,所述根据待预测样本中的多维度数据得到待预测样本的超图,包括:根据待预测样本中的多维度数据得到样本间的至少一个相似度矩阵;根据所述至少一个相似度矩阵得到待预测样本的超图。4.根据权利要求3所述的方法,其特征在于,所述根据待预测样本中的多维度数据得到样本间的至少一个相似度矩阵包括:根据待预测样本中的时空数据得到待预测样本的样本间时空一致程度;根据待预测样本的样本间时空一致程度和待预测样本的样本间相似度,得到样本间的联合相似度矩阵。5.根据权利要求4所述的方法,其特征在于,所述多维度数据还包括所述图像数据对应的场景数据,所述场景数据包括所述待预测样本中的图像数据产生的时间和/或产生的地点的场景信息,所述场景数据包括至少一个类型的场景信息,所述根据待预测样本中的多维度数据得到样本间的至少一个相似度矩阵还包括:根据所述场景数据得到样本间的场景相似度矩阵,其中,每一类型的场景信息对应一个场景相似度矩阵。6.根据权利要求4或5所述的方法,其特征在于,所述多维度数据还包括属性数据,所述属性数据为待预测样本中的图像数据中的对象的属性信息,所述属性数据包括至少一个类型的属性信息,所述根据待预测样本中的多维度数据得到样本间的至少一个相似度矩阵还包括:根据所述属性数据得到样本间的属性相似度矩阵,其中,每一类型的属性信息对应一个属性相似度矩阵。7.根据权利要求4

6中任一项所述的方法,其特征在于,所述根据所述至少一个相似度矩阵得到待预测样本的超图,包括:根据所述至少一个相似度矩阵中的每一矩阵,得到每个矩阵对应的超图;合并每个矩阵对应的超图中的超边缘,以合并后的超边缘作为待预测样本的超图的超
边缘,得到待预测样本的超图。8.根据权利要求1

7中任一项所述的方法,其特征在于,所述根据所述超图对待预测样本的标签进行修正,得到修正后的标签,包括:将待预测样本分类为可信样本和不可信样本;根据待预测样本的标签得到可信样本的分类误差和第0次的不可信样本的分类误差;根据所述超图以及第t

1次的不可信样本的分类误差,得到第t次的不可信样本的分类误差,其中1<t≤T且为整数,T是大于1的整数;根据可信样本的分类误差和第T次的不可信样本的分类误差、待预测样本的标签以及所述超图...

【专利技术属性】
技术研发人员:吴一鸣施克游
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1