一种视频审核方法、装置及服务器制造方法及图纸

技术编号:18142994 阅读:34 留言:0更新日期:2018-06-06 14:47
本发明专利技术提出一种视频审核方法、装置及服务器。所述方法包括:根据待审核视频中的场景截取所述待审核视频的多媒体片段;检测所述多媒体片段的内容是否属于禁止类别;若属于,则发送所述待审核视频属于禁止类别的提示信息;其中,所述多媒体片段包括图像帧、音频片段、语音片段和/或文字片段。本发明专利技术可以实现:根据待审核视频中的场景截取其多媒体片段,检测所述多媒体片段的内容是否属于禁止类别,其中,多媒体片段包括图像帧、音频片段、语音片段和文字片段,将待审核视频根据场景截成多媒体片段,当其中一个片段具有较强烈的特征表现,即可认定该待审核视频是属于禁止类别的,因此,在视频较长的情况下,本技术方案可以大大地提高审核效率。

【技术实现步骤摘要】
一种视频审核方法、装置及服务器
本专利技术涉及视频处理
,特别是涉及一种视频审核方法、装置及服务器。
技术介绍
随着互联网技术的繁荣发展,网络上的视频资源也越来越多。大量的视频鱼龙混杂,尤其是一些用户自行上传的视频更是如此。诸如一些影视片段含有色情、严重暴力等内容,或者一些视频涉及版权等问题。为了能够将不良视频过滤,需要对视频的内容进行审核。传统技术中,广电行业对于视频审核采取的方式主要是:采用播控系统,将视频进行多轮人工审核。具体是为人工审核人员提供一个封闭或半封闭的集中办公场所,并为每个审核人员配备工位和视频播放设备,可以同时以不同速率播放多个视频,一般情况下,每个视频经过二至四人审核确认没有问题后方可通过审核。采用传统技术的视频审核方式,必须对用户上传的视频进行完整播放,导致审核效率低下。
技术实现思路
本专利技术实施例提供一种视频审核方法、装置及服务器,以至少解决现有技术中的以上技术问题。第一方面,本专利技术实施例提供了一种视频审核的方法,包括:根据待审核视频中的场景截取所述待审核视频的多媒体片段;检测所述多媒体片段的内容是否属于禁止类别;若属于,则发送所述待审核视频属于禁止类别的提示信息;其中,所述多媒体片段包括图像帧、音频片段、语音片段和文字片段结合第一方面,本专利技术在第一方面的第一种实施方式中,截取待审核视频的多媒体片段,包括:截取所述待审核视频的图像帧;提取所述待审核视频的音频片段;提取所述待审核视频的语音片段;获取所述待审核视频中的文字片段。结合第一方面的第一实施方式,检测所述多媒体片段的内容是否属于禁止类别,包括:若所述图像帧存在属于禁止类别的可能性,则根据预设禁止类别分类表判断所述图像帧是否属于所述禁止类别;若所述图像帧属于所述禁止类别,则计算所述图像帧属于所述禁止类别的置信度。结合第一方面的第一种实施方式,检测所述多媒体片段的内容是否属于禁止类别,包括:提取所述待审核视频的音频片段的频谱;根据所述音频片段的频谱确定所述音频片段是否属于所述禁止类别;若所述音频片段属于所述禁止类别,则计算所述音频片段属于所述禁止类别的置信度。结合第一方面的第一种实施方式,检测所述多媒体片段的内容是否属于禁止类别,包括:采集一语言的语音标注数据样本;根据所述语言的语音标注数据样本,采用机器学习算法构建语音识别机器模型;根据所述语音识别机器模型输出的结果确定所述语音片段是否属于所述禁止类别;若所述语音片段属于所述禁止类别,则计算所述语音片段属于所述禁止类别的置信度。结合第一方面的第一种实施方式,检测所述多媒体片段的内容是否属于禁止类别,包括:采集图像标记数据样本;根据所述图像标记数据样本,采用机器学习算法构建文字识别模型;根据所述文字识别模型识别所述图像帧中的文字;审核所述图像帧中的文字是否包含敏感词,以确定所述图像帧中的文字是否属于禁止类别;对所述图像帧中不包含敏感词的文字进行语义分析,根据所述语义分析结构确定所述图像帧中的文字是否属于禁止类别;若所述图像帧中的文字片段属于禁止类别,则计算所述文字片段属于所述禁止类别的置信度。结合第一方面的第一种实施方式,检测所述多媒体片段的内容是否属于禁止类别,包括:根据所述待审核视频的图像帧、音频片段、语音片段和文字片段属于禁止类别的置信度,确定所述待审核视频是否属于禁止类别。第二方面,本专利技术实施例提供了一种视频审核装置,包括:截取模块,配置为根据待审核视频中的场景截取所述待审核视频的多媒体片段;检测模块,配置为检测所述多媒体片段的内容是否属于禁止类别;提示模块,配置为当所述多媒体片段的内容属于禁止类别时,发送所述待审核视频属于禁止类别的提示信息;其中,所述多媒体片段包括图像帧、音频片段、语音片段和/或文字片段。第三方面,本专利技术实施例提供了一种服务器,所述服务器包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的视频审核方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,用于存储视频审核装置所用的计算机软件指令,其包括用于执行上述第一方面中视频审核方法所涉及的程序。上述技术方案中的一个技术方案具有如下优点或有益效果:根据待审核视频中的场景截取其多媒体片段,检测所述多媒体片段的内容是否属于禁止类别,其中,多媒体片段包括图像帧、音频片段、语音片段和文字片段,将待审核视频根据场景截成多媒体片段,当其中一个片段具有较强烈的特征表现,即可认定该待审核视频是属于禁止类别的,因此,在视频较长的情况下,本技术方案可以大大地提高审核效率。上述技术方案中的另一个技术方案具有如下优点或有益效果:本技术方案从图像帧、音频、语音和文字四个维度进行审核,能够较为全面地对待审核视频进行审核。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1为本专利技术实施例一的视频审核方法的流程图;图2为本专利技术实施例二的视频审核方法的流程图;图3为本专利技术实施例三的视频审核方法的流程图;图4为本专利技术实施例四的视频审核方法的流程图;图5为本专利技术实施例五的视频审核方法的流程图;图6为本专利技术实施例六的视频审核方法的流程图;图7为本专利技术实施例七的视频审核装置的示意图;图8为本专利技术实施例八的服务器的示意图。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。实施例一本专利技术实施例提供一种视频审核方法。如图1所示,为本专利技术的视频审核方法的流程图。本专利技术的视频审核方法包括如下步骤:S101,根据待审核视频中的场景截取所述待审核视频的多媒体片段。本专利技术实施例采用场景检测技术,首先将待审核视频按照场景进行分割,根据场景的时长,在截取多媒体片段时,根据多媒体片段的类型做不同的截取,例如,截取图像帧时,可以随机选择若干图像帧,在截取音频片段时,可以截取一场景中的一段音频,还可以截取一场景的所有音频。其中,场景可以认为是一系列连续的图像帧,在同一场景中的图像帧差异较小。由于同一场景中的图像帧差异度较小,因此,在同一场景中选择若干图像帧或者一段音频等多媒体片段,即可以表征该场景下的多媒体片段可能属于的类别。S102,检测所述多媒体片段的内容是否属于禁止类别。本实施例所涉及的禁止类别可以包色情和暴力等类别。本专利技术实施例将以色情类别为例,介绍本专利技术方法。S103,若属于,则发送所述待审核视频属于禁止类别的提示信息。本专利技术实施例在具体实施时,由于多媒体片段有很多个,因此在检测完当前多媒体片段时,如果当前的多媒体片段具有很强烈的特征表明该多媒体片段具有禁止内容,属于禁止类别,则可以仅根据当前多媒体片段确定待审核视频属于禁止类别,这时不用再检本文档来自技高网...
一种视频审核方法、装置及服务器

【技术保护点】
一种视频审核方法,其特征在于,所述方法包括:根据待审核视频中的场景截取所述待审核视频的多媒体片段;检测所述多媒体片段的内容是否属于禁止类别;若属于,则发送所述待审核视频属于禁止类别的提示信息;其中,所述多媒体片段包括图像帧、音频片段、语音片段和/或文字片段。

【技术特征摘要】
1.一种视频审核方法,其特征在于,所述方法包括:根据待审核视频中的场景截取所述待审核视频的多媒体片段;检测所述多媒体片段的内容是否属于禁止类别;若属于,则发送所述待审核视频属于禁止类别的提示信息;其中,所述多媒体片段包括图像帧、音频片段、语音片段和/或文字片段。2.根据权利要求1所述的方法,其特征在于,截取待审核视频的多媒体片段,包括:截取所述待审核视频的图像帧;提取所述待审核视频的音频片段;提取所述待审核视频的语音片段;获取所述待审核视频中的文字片段。3.根据权利要求2所述的方法,其特征在于,检测所述多媒体片段的内容是否属于禁止类别,包括:若所述图像帧存在属于禁止类别的可能性,则根据预设禁止类别分类表判断所述图像帧是否属于所述禁止类别;若所述图像帧属于所述禁止类别,则计算所述图像帧属于所述禁止类别的置信度。4.根据权利要求2所述的方法,其特征在于,检测所述多媒体片段的内容是否属于禁止类别,包括:提取所述待审核视频的音频片段的频谱;根据所述音频片段的频谱确定所述音频片段是否属于所述禁止类别;若所述音频片段属于所述禁止类别,则计算所述音频片段属于所述禁止类别的置信度。5.根据权利要求2所述的方法,其特征在于,检测所述多媒体片段的内容是否属于禁止类别,包括:采集一语言的语音标注数据样本;根据所述语言的语音标注数据样本,采用机器学习算法构建语音识别机器模型;根据所述语音识别机器模型输出的结果确定所述语音片段是否属于所述禁止类别;若所述语音片段属于所述禁止类别,则计算所述语音片段属于所述禁止类别的置信度。6.根据权利要求2...

【专利技术属性】
技术研发人员:丁圣龙王璇尉明望郁陈焙
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1