【技术实现步骤摘要】
一种针对直播场景视频的内容审核模型训练方法及装置
本专利技术涉及视频信息
,尤其涉及一种针对直播场景视频的内容审核模型训练方法及装置。
技术介绍
直播场景存在内容安全风险,现有技术一般是利用内容审核模型过滤视频画面,或同时配合审核专员对直播视频进行拦截。其中,内容审核模型的准确率及召回率对内容审核而言十分重要,然而内容审核模型审核效果的好坏依赖于海量的训练样本,需要大量(通常是百万数量级)的人工标注样本。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术的不足,提供一种针对直播场景视频的内容审核模型训练方法及装置。本专利技术解决上述技术问题的技术方案如下:一种针对直播场景视频的内容审核模型训练方法,包括:通过深度学习算法训练获取的人工标注样本,得到初步模型;计算当前直播场景视频中相邻两帧图片的相似度,将相似度大于预设相似度的两帧图片确定为相似图片,并对所述相似图片标注相同的标签;利用所述初步模块对获取的大量未标注样本进行识别,得到标签样本;根据所述人工标注样本、所述相似图片的标签和所述标签样本,训练得到内容审核模型。本专利技术的有益效果是:利用通过深度学 ...
【技术保护点】
1.一种针对直播场景视频的内容审核模型训练方法,其特征在于,包括:通过深度学习算法训练获取的人工标注样本,得到初步模型;计算当前直播场景视频中相邻两帧图片的相似度,将相似度大于预设相似度的两帧图片确定为相似图片,并对所述相似图片标注相同的标签;利用所述初步模块对获取的大量未标注样本进行识别,得到标签样本;根据所述人工标注样本、所述相似图片的标签和所述标签样本,训练得到内容审核模型。
【技术特征摘要】
1.一种针对直播场景视频的内容审核模型训练方法,其特征在于,包括:通过深度学习算法训练获取的人工标注样本,得到初步模型;计算当前直播场景视频中相邻两帧图片的相似度,将相似度大于预设相似度的两帧图片确定为相似图片,并对所述相似图片标注相同的标签;利用所述初步模块对获取的大量未标注样本进行识别,得到标签样本;根据所述人工标注样本、所述相似图片的标签和所述标签样本,训练得到内容审核模型。2.根据权利要求1所述的方法,其特征在于,根据所述人工标注样本、所述相似图片的标签和所述标签样本,训练得到内容审核模型,包括:通过深度学习算法训练所述人工标注样本、所述相似图片的标签和所述标签样本,得到所述内容审核模型。3.根据权利要求1所述的方法,其特征在于,利用所述初步模块对获取的大量未标注样本进行识别,得到标签样本,包括:利用所述初步模块对获取的大量未标注样本进行识别,得到多个中间样本,每个所述中间样本具有标签和与所述标签对应的置信度;将多个所述中间样本中标签的置信度满足预定条件的中间样本确定为所述标签样本。4.根据权利要求1-3中任一项所述的方法,其特征在于,所述未标注样本的数量远大于所述人工标注样本的数量,所述标签包括:正常、色情、暴恐和涉政四类。5.一种针对直播场景视频的内容审核模型训练装置,其特征在于,包括:模型训练器,用于通过深度学习算法训练获取的人工标注样本,得到初步模型;数据处理器,用于计算当前直播场景视频中相邻两帧图片的相似...
【专利技术属性】
技术研发人员:曹腾,唐会军,刘拴林,陈云阔,
申请(专利权)人:北京数美时代科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。