用于生成模型的方法和装置制造方法及图纸

技术编号:20364455 阅读:25 留言:0更新日期:2019-02-16 17:14
本申请实施例公开了用于生成模型方法和装置。该方法的一具体实施方式包括:获取样本集;从该样本集中提取样本,执行如下训练步骤:将所提取的样本中的样本视频中的帧输入至初始模型,分别得到样本视频属于低质视频和各低质类别的概率;基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数,确定样本的损失值;基于该损失值与目标值的比较,确定初始模型是否训练完成;响应于确定初始模型训练完成,将训练后的初始模型确定为低质视频检测模型。该实施方式能够得到一种可以用于低质视频检测的模型,该模型有助于提高对低质视频检测的效率。

【技术实现步骤摘要】
用于生成模型的方法和装置
本申请实施例涉及计算机
,具体涉及用于生成模型的方法和装置。
技术介绍
随着计算机技术的发展,短视频类应用应运而生。用户可以利用短视频类应用上传、发布视频。服务器在接收到一个视频后,可以对该视频进行检测,以确定其是否为低质视频。此处,低质视频通常为质量较低的视频,例如,可以包括模糊视频、黑屏视频、录屏视频等。相关的方式,通常是将视频分为多类,例如分为黑屏视频类、录屏视频类、模糊视频类、正常视频类。训练分类模型确定视频属于各个类别的概率,将视频属于非正常视频的概率之和作为视频属于低质视频的概率,进而确定视频是否为低质视频。
技术实现思路
本申请实施例提出了用于生成模型的方法和装置。第一方面,本申请实施例提供了一种用于生成模型的方法,该方法包括:获取样本集,其中,该样本集中的样本包括样本视频和用于指示样本视频是否属于低质视频的第一标注信息,当样本视频属于低质视频时,样本还包括用于指示样本视频的低质类别的第二标注信息;从样本集中提取样本,执行如下训练步骤:将所提取的样本中的样本视频中的帧输入至初始模型,分别得到样本视频属于低质视频和各低质类别的概率;基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数,确定样本的损失值;基于损失值与目标值的比较,确定初始模型是否训练完成;响应于确定初始模型训练完成,将训练后的初始模型确定为低质视频检测模型。在一些实施例中,基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数,确定样本的损失值,包括:将所提取的样本中的第一标注信息、样本视频属于低质视频的概率输入至预先建立的第一损失函数,得到第一损失值;响应于确定所提取的样本中不包含第二标注信息,将第一损失值确定为所提取的样本的损失值。在一些实施例中,基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数,确定样本的损失值,还包括:响应于确定所提取的样本中包含第二标注信息,将所提取的样本中的第二标注信息所指示的低质类别作为目标类别,将所提取的样本中所包含的第二标注信息、样本视频属于目标类别的概率输入至预先建立的第二损失函数,得到第二损失值;将第一损失值与第二损失值之和确定为所提取的样本的损失值。在一些实施例中,该方法还包括:响应于确定初始模型未训练完成,基于所确定的损失值,更新初始模型中的参数,从样本集中重新提取样本,使用更新参数后的初始模型作为初始模型,继续执行训练步骤。第二方面,本申请实施例提供了一种用于生成模型的装置,该装置包括:获取单元,被配置成获取样本集,其中,样本集中的样本包括样本视频和用于指示样本视频是否属于低质视频的第一标注信息,当样本视频属于低质视频时,样本还包括用于指示样本视频的低质类别的第二标注信息;训练单元,被配置成从样本集中提取样本,执行如下训练步骤:将所提取的样本中的样本视频的帧输入至初始模型,分别得到样本视频属于低质视频和各低质类别的概率;基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数,确定样本的损失值;基于损失值与目标值的比较,确定初始模型是否训练完成;响应于确定初始模型训练完成,将训练后的初始模型确定为低质视频检测模型。在一些实施例中,训练单元,进一步被配置成:将所提取的样本中的第一标注信息、样本视频属于低质视频的概率输入至预先建立的第一损失函数,得到第一损失值;响应于确定所提取的样本中不包含第二标注信息,将第一损失值确定为所提取的样本的损失值。在一些实施例中,训练单元,进一步被配置成:响应于确定所提取的样本中包含第二标注信息,将所提取的样本中的第二标注信息所指示的低质类别作为目标类别,将所提取的样本中所包含的第二标注信息、样本视频属于目标类别的概率输入至预先建立的第二损失函数,得到第二损失值;将第一损失值与第二损失值之和确定为所提取的样本的损失值。在一些实施例中,该装置还包括:更新单元,被配置成响应于确定初始模型未训练完成,基于所确定的损失值,更新初始模型中的参数,从样本集中重新提取样本,使用更新参数后的初始模型作为初始模型,继续执行训练步骤。第三方面,本申请实施例提供了一种用于检测低质视频的方法,包括:接收包含目标视频的低质视频检测请求;将目标视频中的帧输入采用如上述第一方面中任一实施例所描述的方法生成的低质视频检测模型,得到检测结果,其中,检测结果包括目标视频属于低质视频的概率;响应于确定概率大于第一预设阈值,确定目标视频为低质视频。在一些实施例中,其中,该检测结果还包括该目标视频属于各低质类别的概率;以及在该确定该目标视频为低质视频之后,该方法还包括:响应于接收到对该目标视频的低质类别检测请求,将目标视频属于低质视频的概率作为第一概率,对于每一个低质类别,确定目标视频属于该低质类别的概率与第一概率的乘积,将乘积确定为目标视频属于该低质类别的概率;将概率大于第二预设数值的低质类别确定为目标视频的低质类别。第四方面,本申请实施例提供了一种用于检测低质视频的装置,包括:第一接收单元,被配置成接收包含目标视频的低质视频检测请求;输入单元,被配置成将目标视频中的帧输入采用如上述第一方面中任一实施例所描述的方法生成的低质视频检测模型,得到检测结果,其中,检测结果包括目标视频属于低质视频的概率;第一确定单元,被配置成响应于确定概率大于第一预设阈值,确定目标视频为低质视频。在一些实施例中,其中,该检测结果还包括该目标视频属于各低质类别的概率;以及该装置还包括:第二接收单元,被配置成响应于接收到对该目标视频的低质类别检测请求,将目标视频属于低质视频的概率作为第一概率,对于每一个低质类别,确定目标视频属于该低质类别的概率与第一概率的乘积,将乘积确定为目标视频属于该低质类别的概率;第二确定单元,被配置成将概率大于第二预设数值的低质类别确定为目标视频的低质类别。第五方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上述第一方面和第三方面中任一实施例的方法。第六方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面和第三方面中任一实施例的方法。本申请实施例提供的用于生成模型的方法和装置,通过获取样本集,可以从中提取样本以进行初始模型的训练。其中,样本集中的样本可以包括样本视频、用于指示样本视频是否属于低质视频的第一标注信息、用于指示属于低质视频的样本视频的低质类别的第二标注信息。这样,将提取的样本中的样本视频的帧输入至初始模型,便可以得到初始模型所输出的样本视频属于低质视频和各低质类别的概率。而后,基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数,即可确定样本的损失值。之后,基于损失值与目标值的比较,可以确定初始模型是否训练完成。如果初始模型训练完成,就可以将训练后的初始模型确定为低质视频检测模型。从而,能够得到一种可以用于低质视频检测的模型,该模型有助于提高对低质视频检测的效率。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2是本文档来自技高网...

【技术保护点】
1.一种用于生成模型的方法,包括:获取样本集,其中,所述样本集中的样本包括样本视频和用于指示样本视频是否属于低质视频的第一标注信息,当样本视频属于低质视频时,样本还包括用于指示样本视频的低质类别的第二标注信息;从所述样本集中提取样本,执行如下训练步骤:将所提取的样本中的样本视频中的帧输入至初始模型,分别得到样本视频属于低质视频和各低质类别的概率;基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数,确定样本的损失值;基于所述损失值与目标值的比较,确定初始模型是否训练完成;响应于确定初始模型训练完成,将训练后的初始模型确定为低质视频检测模型。

【技术特征摘要】
1.一种用于生成模型的方法,包括:获取样本集,其中,所述样本集中的样本包括样本视频和用于指示样本视频是否属于低质视频的第一标注信息,当样本视频属于低质视频时,样本还包括用于指示样本视频的低质类别的第二标注信息;从所述样本集中提取样本,执行如下训练步骤:将所提取的样本中的样本视频中的帧输入至初始模型,分别得到样本视频属于低质视频和各低质类别的概率;基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数,确定样本的损失值;基于所述损失值与目标值的比较,确定初始模型是否训练完成;响应于确定初始模型训练完成,将训练后的初始模型确定为低质视频检测模型。2.根据权利要求1所述的用于生成模型的方法,其中,所述基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数,确定样本的损失值,包括:将所提取的样本中的第一标注信息、样本视频属于低质视频的概率输入至预先建立的第一损失函数,得到第一损失值;响应于确定所提取的样本中不包含第二标注信息,将所述第一损失值确定为所提取的样本的损失值。3.根据权利要求2所述的用于生成模型的方法,其中,所述基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数,确定样本的损失值,还包括:响应于确定所提取的样本中包含第二标注信息,将所提取的样本中的第二标注信息所指示的低质类别作为目标类别,将所提取的样本中所包含的第二标注信息、样本视频属于目标类别的概率输入至预先建立的第二损失函数,得到第二损失值;将所述第一损失值与所述第二损失值之和确定为所提取的样本的损失值。4.根据权利要求1所述的用于生成模型的方法,其中,所述方法还包括:响应于确定初始模型未训练完成,基于所确定的损失值,更新初始模型中的参数,从所述样本集中重新提取样本,使用更新参数后的初始模型作为初始模型,继续执行所述训练步骤。5.一种用于生成模型的装置,包括:获取单元,被配置成获取样本集,其中,所述样本集中的样本包括样本视频和用于指示样本视频是否属于低质视频的第一标注信息,当样本视频属于低质视频时,样本还包括用于指示样本视频的低质类别的第二标注信息;训练单元,被配置成从所述样本集中提取样本,执行如下训练步骤:将所提取的样本中的样本视频的帧输入至初始模型,分别得到样本视频属于低质视频和各低质类别的概率;基于所提取的样本中的标注信息、所得到的概率和预先建立的损失函数,确定样本的损失值;基于所述损失值与目标值的比较,确定初始模型是否训练完成;响应于确定初始模型训练完成,将训练后的初始模型确定为低质视频检测模型。6.根据权利要求5所述的用于生成模型的装置,其中,所述训练单元,进一步被配置成:将所提取的样本中的第一标注信息、样本视频属于低质视频的概率输入至预先建立的第一损失函数,得到第一损失值;响应于确定所提取的样本中不包含第二标注信息,将所述第一损失值确定为所提取的样本的损失值。7.根据权利要求6所述的用于生成模...

【专利技术属性】
技术研发人员:袁泽寰王长虎
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1