【技术实现步骤摘要】
模型训练方法和装置
本说明书涉及机器学习
,尤其涉及一种模型训练方法和装置。
技术介绍
机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。通过特定的机器学习算法以及训练样本可以构建并训练机器学习模型。为达到较好的预测效果,模型的参数往往较多,网络结构也较为复杂,这就会导致模型在使用时占用设备大量的计算和存储资源。
技术实现思路
有鉴于此,本说明书提供一种模型训练方法和装置。具体地,本说明书是通过如下技术方案实现的:一种模型训练方法,包括:获取用于训练目标模型的样本数据;采用第一类模型对所述样本数据进行标注;采用标注后的样本数据对第二类模型进行训练,得到目标模型。一种模型训练装置,包括:样本获取单元,获取用于训练目标模型的样本数据;样本标注单元,采用第一类模型对所述样本数据进行标注;模型训练单元,采用标注后的样本数据对第二类模型进行训练,得到目标模型。一种模型训练装置,包括:处理器;用于存储机器可执行指令的存储器;其中,通过读取并执行所述存储器存储的与模型训练逻辑对应的机器可执行指令 ...
【技术保护点】
1.一种模型训练方法,包括:获取用于训练目标模型的样本数据;采用第一类模型对所述样本数据进行标注;采用标注后的样本数据对第二类模型进行训练,得到目标模型。
【技术特征摘要】
1.一种模型训练方法,包括:获取用于训练目标模型的样本数据;采用第一类模型对所述样本数据进行标注;采用标注后的样本数据对第二类模型进行训练,得到目标模型。2.根据权利要求1所述的方法,所述获取用于训练目标模型的样本数据包括:当所述目标模型所应用的目标场景中的样本数据量充足时,从所述目标场景中获取所述样本数据。3.根据权利要求1所述的方法,所述获取用于训练目标模型的样本数据包括:当所述目标模型所应用的目标场景中的样本数据量不充足时,从与所述目标场景相似的场景中获取数据作为所述样本数据,以对目标场景中的样本数据进行补充。4.根据权利要求3所述的方法,所述从与所述目标场景相似的场景中获取数据作为所述样本数据,包括:针对每个相似场景,获取所述相似场景对应的数据集,所述数据集中包括若干数据;分别计算每个数据集与所述目标场景中的样本数据的相似度;将相似度满足预定条件的数据集确定为目标数据集;对所述目标数据集中的数据进行提取,并将提取到的数据确定为样本数据。5.根据权利要求4所述的方法,所述分别计算每个数据集与所述目标场景中的样本数据的相似度,包括:针对每个数据集,分别从所述数据集和所述目标场景中提取出相同数量的数据;基于笛卡尔乘积计算所述数据集中提取出的每个数据与所述目标场景中提取出的每个数据的相似度作为个体相似度;计算所述个体相似度的平均值作为所述数据集与所述目标场景中的样本数据的相似度。6.根据权利要求4所述的方法,从所述目标数据集中提取出的样本数据的数量与所述目标数据集的相似度正相关。7.根据权利要求1所述的方法,在采用标注后的样本数据对第二类模型进行训练之前,还包括:对标注后的样本数据进行过滤。8.根据权利要求1所述的方法,在采用标注后的样本数据对第二类模型进行训练之前,还包括:优化所述第二类模型的超参数。9.根据权利要求1所述的方法,所述采用标注后的样本数据对第二类模型进行训练,包括:对所述第二类模型的部分网络单元进行冻结;采用标注后的样本数据对所述第二类模型中未冻结的网络单元进行训练。10.根据权利要求9所述的方法,冻结的网络单元数量与样本数据量负相关。11.根据权利要求1所述的方法,所述第二类模型的模型参数少于所述第一类模型的模型参数,和/或所述第二类模型的网络结构比所述第一类模型的网络结构简单。12.一种模型训练装置,包括:样本获取单元,获取用于训练目标模型的样本数据;样本标注单元,采用第一类模型对所...
【专利技术属性】
技术研发人员:黄凯明,杨旭东,侯章军,张晓博,曾晓东,林锋,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。