模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号:20076030 阅读:44 留言:0更新日期:2019-01-15 00:55
本申请实施例提供一种模型训练方法、装置、设备及存储介质,通过获取样本数据集和预设模型,其中,样本数据集中包括N类特征数据,预设模型至少包括N个部分;针对所述N类特征数据,基于一类特征数据训练预设模型的一个部分,得到能够识别全部N类特征数据的目标模型。本发明专利技术实施例能够充分不完整的样本来训练模型,避免数据浪费,降低了模型的训练成本,提高模型训练效率。

Model training methods, devices, equipment and storage media

The embodiment of this application provides a model training method, device, device and storage medium. By acquiring sample data set and preset model, the sample data set includes N-class feature data, and the preset model includes at least N parts. For the N-class feature data, a part of the preset model is trained based on one kind of feature data, and all N-class feature data can be recognized. Target model. The embodiment of the invention can fully and incompletely train the sample model, avoid data waste, reduce the training cost of the model and improve the training efficiency of the model.

【技术实现步骤摘要】
模型训练方法、装置、设备及存储介质
本申请实施例涉及计算机
,尤其涉及一种模型训练方法、装置、设备及存储介质。
技术介绍
在现有技术中,对于模型训练的样本数据要求非常高,一般要求所有样本数据必须格式统一、内容完整(比如在分类模型中需要样本数据中包括预先标定的标签,像素分割模型需要样本数据中包括每个像素值的类别信息等等)。然而对于那些不完整的数据则无法用来训练模型,通常的做法是直接抛弃掉这部分数据。比如,在训练一个用于检测图片上物体位置和类别的模型时,需要样本数据中同时包括物体的位置信息和类别信息,若样本数据中缺少二者任意一个则无法用来训练模型,将会被抛弃掉。但是实际上这些不完整的数据同样也包括了部分有用的信息,若是抛弃掉不用,则会造成资源浪费,提高成本。
技术实现思路
本申请实施例提供一种模型训练方法、装置、设备及存储介质,用以充分利用不完整的数据,提高数据利用率,降低模型训练成本。本申请实施例第一方面提供一种模型训练方法,包括:获取样本数据集和预设模型,所述样本数据集中包括N类特征数据,所述预设模型至少包括N个部分;针对所述N类特征数据,基于一类特征数据训练所述预设模型的一个部分本文档来自技高网...

【技术保护点】
1.一种模型训练方法,其特征在于,包括:获取样本数据集和预设模型,所述样本数据集中包括N类特征数据,所述预设模型至少包括N个部分;针对所述N类特征数据,基于一类特征数据训练所述预设模型的一个部分,得到能够识别全部所述N类特征数据的目标模型;其中,N为大于或等于2的正整数。

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取样本数据集和预设模型,所述样本数据集中包括N类特征数据,所述预设模型至少包括N个部分;针对所述N类特征数据,基于一类特征数据训练所述预设模型的一个部分,得到能够识别全部所述N类特征数据的目标模型;其中,N为大于或等于2的正整数。2.根据权利要求1所述的方法,其特征在于,所述针对所述N类特征数据,基于一类特征数据训练所述预设模型的一个部分,得到能够识别全部所述N类特征数据的目标模型,包括:针对所述N类特征数据,在将一类特征数据输入预设模型,训练得到所述预设模型能够识别该类特征数据的部分后,再将下一类特征数据输入所述预设模型训练所述预设模型的另一部分,直至得到能够识别全部所述N类特征数据的目标模型为止。3.根据权利要求1所述的方法,其特征在于,所述针对所述N类特征数据,基于一类特征数据训练所述预设模型的一个部分,得到能够识别全部所述N类特征数据的目标模型,包括:对所述预设模型进行多轮训练,直至得到能够识别全部所述N类特征数据的目标模型为止,其中,在每轮训练中,基于一个类别的特征数据对所述预设模型的一个部分进行一次训练,直至所述N类特征数据均完成一次训练之后进行下一轮训练。4.根据权利要求1-3中任一项所述的方法,其特征在于,所述针对所述N类特征数据,基于一类特征数据训练所述预设模型的一个部分,得到能够识别全部所述N类特征数据的目标模型之前,所述方法还包括:根据所述样本数据集中样本的标注信息,确定每个样本上包含的特征数据的类型;针对每个类型,从相应的样本上提取获得所述类型的特征数据。5.一种模型训练装置,其特征在于,包括:获取模块,...

【专利技术属性】
技术研发人员:杨少雄赵晨
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1