【技术实现步骤摘要】
用于生成模型的方法和装置
本申请实施例涉及计算机
,具体涉及用于生成模型的方法和装置。
技术介绍
在机器学习领域中,通常需要利用样本集进行模型训练。然而,用于进行模型训练的样本集中,很多样本具有噪声。作为示例,训练用于检测视频类别(例如,被划分为高质量视频类、低质量视频类)的模型时,所使用的样本集,通常是基于点击量所得到的。点击量高的视频通常被标记为高质量视频,点击量低的视频通常被标记为低质量视频。然而,也存在某些低质量视频由于点击量较大被标记为高质量视频的情况。例如,低质量视频的发布者具有较多的关注者,导致视频点击量较大。同时,存在某些高质量视频由于点击量较小但被标记为低质量视频的情况。例如,由于推送系统故障导致高质量视频未被推送。相关的方式,通常是不考虑样本噪声,直接利用样本集,利用有监督学习方式进行模型训练。
技术实现思路
本申请实施例提出了用于生成模型的方法和装置。第一方面,本申请实施例提供了一种用于生成模型的方法,该方法包括:获取样本集,其中,样本集中的样本带有标注信息;提取样本集中的部分样本组成子集,执行如下训练步骤:将子集中的样本输入至初始模型,基于初始模型输出的信息和子集中的样本所带有的标注信息,确定所输入的各样本的损失值;按照损失值从小到大的顺序选取目标数量的损失值,将所选取的损失值的平均值确定为目标损失值,其中,目标数量小于子集中的样本的数量;基于目标损失值,确定初始模型是否训练完成;若是,将训练后的初始模型确定为目标模型。在一些实施例中,该方法还包括:响应于确定初始模型未训练完成,基于目标损失值,更新初始模型中的参数,确定样本集中是 ...
【技术保护点】
1.一种用于生成模型的方法,包括:获取样本集,其中,所述样本集中的样本带有标注信息;提取所述样本集中的部分样本组成子集,执行如下训练步骤:将所述子集中的样本输入至初始模型,基于初始模型输出的信息和所述子集中的样本所带有的标注信息,确定所输入的各样本的损失值;按照损失值从小到大的顺序选取目标数量的损失值,将所选取的损失值的平均值确定为目标损失值,其中,目标数量小于所述子集中的样本的数量;基于所述目标损失值,确定初始模型是否训练完成;若是,将训练后的初始模型确定为目标模型。
【技术特征摘要】
1.一种用于生成模型的方法,包括:获取样本集,其中,所述样本集中的样本带有标注信息;提取所述样本集中的部分样本组成子集,执行如下训练步骤:将所述子集中的样本输入至初始模型,基于初始模型输出的信息和所述子集中的样本所带有的标注信息,确定所输入的各样本的损失值;按照损失值从小到大的顺序选取目标数量的损失值,将所选取的损失值的平均值确定为目标损失值,其中,目标数量小于所述子集中的样本的数量;基于所述目标损失值,确定初始模型是否训练完成;若是,将训练后的初始模型确定为目标模型。2.根据权利要求1所述的用于生成模型的方法,其中,所述方法还包括:响应于确定初始模型未训练完成,基于所述目标损失值,更新初始模型中的参数,确定所述样本集中是否存在未执行所述训练步骤的样本;响应于确定存在,从未执行所述训练步骤的样本中提取样本组成子集,使用更新参数后的初始模型作为初始模型,继续执行所述训练步骤。3.根据权利要求2所述的用于生成模型的方法,其中,所述方法还包括:响应于确定所述样本集中不存在未执行所述训练步骤的样本,确定目标数量是否小于预设数值;响应于确定目标数量小于预设数值,将目标数量与指定值之和作为目标数量,使用更新参数后的初始模型作为初始模型,重新提取所述样本集中的部分样本组成子集,继续执行所述训练步骤。4.根据权利要求3所述的用于生成模型的方法,其中,所述方法还包括:响应于确定目标数量不小于所述预设数值,使用更新参数后的初始模型作为初始模型,重新提取所述样本集中的部分样本组成子集,继续执行所述训练步骤。5.根据权利要求3所述的用于生成模型的方法,其中,目标数量的初始值为初次组成的子集中的样本的数量的二分之一。6.根据权利要求1所述的用于生成模型的方法,其中,初始模型通过如下步骤得到:利用机器学习方法,将所述样本集中的样本作为输入,将所输入的样本的标注信息作为输出,训练得到初始模型。7.根据权利要求1-6之一所述的用于生成模型的方法,其中,所述样本集中的样本为样本视频,样本所带有的标注信息用于指示样本视频的类别,所述目标模型为用于检测视频类别的视频类别检测模型。8.一种用于生成模型的装置,包括:获取单元,被配置成获取样本集,其中,所述样本集中的样本带有标注信息;训练单元,被配置成提取所述样本集中的部分样本组成子集,执行如下训练步骤:将所述子集中的样本输入至初始模型,基于初始模型输出的信息和所述子集中的样本所带有的标注信息,确定所输入的各样本的损失值;按照损失值从小到大的顺序选取目标数量的损失值,将所选取的损失值的平均值确定为目标损失值,其中,目标数量小于所述子...
【专利技术属性】
技术研发人员:袁泽寰,王长虎,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。