一种模型训练的方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:31094513 阅读:20 留言:0更新日期:2021-12-01 13:03
本申请公开了一种模型训练的方法、装置、计算机设备和存储介质,包括:获取视频样本集合、真实分类结果集合以及真实标签集合;通过第一待训练标签模型得到每个视频样本对应的第一预测视频标签;根据真实标签集合以及每个视频样本对应的第一预测视频标签得到第二待训练标签模型;通过第一待训练分类模型得到每个视频样本对应的第一预测分类结果;通过第二待训练标签模型得到每个视频样本对应的第二预测视频标签;根据前述所得到的结果对第一待训练分类模型进行训练,以得到目标分类模型。通过上述方法,在模型训练的过程中能够学习到视频标签中的细粒度特征,又能学习到分类任务的泛化性,由此提升目标分类模型所得到的视频分类结果的准确度。分类结果的准确度。分类结果的准确度。

【技术实现步骤摘要】
一种模型训练的方法、装置、计算机设备和存储介质


[0001]本申请涉及人工智能领域中的机器学习领域,尤其涉及一种模型训练的方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着人工智能技术的发展,采用视频类目作为监督信息是一种十分常见的做法,原因在于视频的分类信息比较容易获得,且人工标注的成本也较低。但是,通过分类作为监督信号,学习到的特征往往是比较粗粒度的类别特征。对于相同类别下,包含不同细粒度实体信息的视频,学习到的特征的可分性一般较差。目前,为了使得分类粒度更细,能够基于标签进行分类能够细化分类结果,但是人工标注可能会存在漏标、误标的情况,此时会降低对视频进行分类的准确度。因此,如何更为准确的对视频进行分类成为亟需解决的问题。

技术实现思路

[0003]本申请实施例提供了一种模型训练的方法、装置、计算机设备和存储介质,在模型训练的一次迭代过程中先训练标签模型,由于标签模型迭代过程中所学习到的特征区分性更好,因此在下一个相邻的迭代过程中再训练分类模型,使得在标签信号下学习到的细粒度、区分性高的特征迁移到待训练的分类模本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型训练的方法,其特征在于,包括:获取视频样本集合、真实分类结果集合以及真实标签集合,其中,所述视频样本集合包括多个视频样本,所述真实分类结果集合包括每个视频样本对应的真实分类结果,所述真实标签集合包括每个视频样本对应的真实标签,所述真实标签与真实分类结果具有对应关系;基于所述视频样本集合,通过第一待训练标签模型得到每个视频样本对应的第一预测视频标签;根据所述真实标签集合以及所述每个视频样本对应的第一预测视频标签,训练所述第一待训练标签模型,以得到第二待训练标签模型,其中,所述第二待训练标签模型为所述第一待训练标签模型进行一次迭代后得到的;基于所述视频样本集合,通过第一待训练分类模型得到每个视频样本对应的第一预测分类结果;基于所述视频样本集合,通过所述第二待训练标签模型得到每个视频样本对应的第二预测视频标签;根据所述真实标签集合、所述每个视频样本对应的第二预测视频标签、所述真实分类结果集合以及所述每个视频样本对应的第一预测分类结果,对第一待训练分类模型进行训练,以得到目标分类模型,其中,所述目标分类模型用于对视频进行分类。2.根据权利要求1所述的方法,其特征在于,在所述基于所述视频样本集合,通过第一待训练标签模型得到每个视频样本对应的第一预测视频标签之前,所述方法还包括:基于所述视频样本集合,通过第三待训练标签模型得到每个视频样本对应的第三预测视频标签;根据所述真实标签集合以及所述每个视频样本对应的第三预测视频标签,对所述第三待训练标签模型进行训练,得到第三标签模型。3.根据权利要求2所述的方法,其特征在于,所述根据所述真实标签集合以及所述每个视频样本对应的第一预测视频标签,训练所述第一待训练标签模型,以得到第二待训练标签模型,包括:基于所述视频样本集合,通过所述第三标签模型得到每个视频样本对应的第三预测视频标签;根据所述每个视频样本对应的第三预测视频标签以及所述每个视频样本对应的第一预测视频标签,通过第一损失函数对所述第一待训练标签模型的模型参数进行一次迭代更新,以得到所述第二待训练标签模型。4.根据权利要求1所述的方法,其特征在于,所述根据所述真实标签集合、所述每个视频样本对应的第二预测视频标签、所述真实分类结果集合以及所述每个视频样本对应的第一预测分类结果,对第一待训练分类模型进行训练,以得到目标分类模型,包括:根据所述真实分类结果集合以及所述每个视频样本对应的第一预测分类结果,训练所述第一待训练分类模型,以得到第二待训练分类模型,其中,所述第二待训练分类模型为所述第一待训练分类模型进行一次迭代后得到的;根据所述真实标签集合以及所述每个视频样本对应的第二预测视频标签,训练所述第二待训练标签模型,以得到第四待训练标签模型,其中,所述第四待训练标签模型为所述第
一待训练标签模型进行二次迭代后得到的;基于所述视频样本集合,通过所述第二待训练分类模型得到每个视频样本对应的第二预测分类结果;基于所述视频样本集合,通过所述第四待训练标签模型得到每个视频样本对应的第四预测视频标签;根据所述真实标签集合、所述每个视频样本对应的第四预测视频标签、所述真实分类结果集合以及所述每个视频样本对应的第二预测分类结果,对所述第二待训练分类模型进行训练,以得到所述目标分类模型。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述视频样本集合中每个视频样本进行特征化处理,得到多模态视频特征集合,其中,所述多模态视频特征集合包括每个视频样本的多模态视频特征,所述多模态视频特征包括视频帧特征,或,所述多模态视频特征包括文本...

【专利技术属性】
技术研发人员:罗永盛
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1