一种音视频审核方法、装置、设备和可读存储介质制造方法及图纸

技术编号:38468247 阅读:10 留言:0更新日期:2023-08-11 14:45
本申请公开了一种音视频审核方法、装置、设备和可读存储介质,方法包括:获取待审核的音视频数据;确定音视频审核模型,音视频审核模型包括一级分析网络、二级分析网络、三级分析网络以及结果处理网络,一级分析网络用于按照各大类违规标签进行大类分析筛选,得到一级分析结果,二级分析网络用于对各违规音视频数据集中的各条违规音视频数据进行细类分析筛选,得到二级分析结果,三级分析网络用于提取各条违规音视频数据的隐式特征,并进行相似度计算,得到相似度比较结果,结果处理网络用于基于一级分析结果、二级分析结果以及相似度比较结果确定对待审核的音视频数据的审核结果;将待审核的音视频数据输入到音视频审核模型中,得到审核结果。得到审核结果。得到审核结果。

【技术实现步骤摘要】
一种音视频审核方法、装置、设备和可读存储介质


[0001]本申请涉及审核识别领域,更具体地说,涉及一种音视频审核方法、装置、设备和可读存储介质。

技术介绍

[0002]现阶段随着泛娱乐社交、视频发布、直播等领域的飞速发展,用户数量及上传平台的音视频数量也大幅度增多,每日产生几万到数十万小时不等的音视频内容。目前对于网络环境的治理非常严格,对上传的音视频数据审核是各大平台的一个重要工作内容,平台有义务对用户上传的音视频数据进行筛选和审核,判别是不是属于违规、低俗、禁止上传的音视频作品,保障用户上传视频作品的健康。
[0003]为了顺应监管要求,平台管理公司通常需要设置审核部门,用户每天在后台上传的视频会被发送到审核部门交叉审核,审核通过后方可通过平台展现和其他用户,但是使用人工监控,人力成本巨大且审核效率低,无法适应音视频数据数量较多的情况,因而无法满足平台后续发展要求。

技术实现思路

[0004]有鉴于此,本申请提供了一种音视频审核方法、装置、设备和可读存储介质,由三级审核网络构成的音视频审核模型对待审核的音视频数据进行审核,在审核机器成本上更节省、更优,创新使用与子类违规标签对应的黑名单特征库和白名单特征库中特征,实现机器对音视频数据进行自动审核,降低人工审核压力和成本,提高审核效率。
[0005]一种音视频审核方法,包括:
[0006]获取待审核的音视频数据;
[0007]确定音视频审核模型,所述音视频审核模型包括一级分析网络、二级分析网络、三级分析网络以及结果处理网络,所述一级分析网络用于按照各大类违规标签对输入的所述待审核的音视频数据进行大类分析筛选,得到一级分析结果并生成与各大类违规标签对应的各违规音视频数据集,所述二级分析网络用于对所述各违规音视频数据集中的各条违规音视频数据进行细类分析筛选,得到二级分析结果并确定所述各条违规音视频数据对应的子类违规标签,所述三级分析网络用于提取所述各条违规音视频数据的隐式特征,并与所述子类违规标签对应的黑名单特征库和白名单特征库中特征进行相似度计算,得到相似度比较结果,所述结果处理网络用于基于所述一级分析结果、所述二级分析结果以及所述相似度比较结果确定对所述待审核的音视频数据的审核结果;
[0008]将所述待审核的音视频数据输入到所述音视频审核模型中,得到所述音视频审核模型输出的对所述待审核的音视频数据的审核结果。
[0009]优选的,基于所述一级分析结果、所述二级分析结果以及所述相似度比较结果确定对所述待审核的音视频数据的审核结果,包括:
[0010]将所述待审核的音视频数据中所述一级分析结果和/或所述二级分析结果为未违
规的各条音视频数据的审核结果确定为审核通过;
[0011]将所述一级分析结果和所述二级分析结果为违规,且所述相似度比较结果为与所述黑名单特征库中特征相似度超过预设阈值的各条音视频数据的审核结果确定为审核不通过;
[0012]将所述一级分析结果和所述二级分析结果为违规,且所述相似度比较结果为与所述白名单特征库中特征相似度超过预设阈值的各条音视频数据的审核结果确定为审核通过。
[0013]优选的,还包括:
[0014]将所述一级分析结果和所述二级分析结果为违规,且所述相似度比较结果为与所述黑名单特征库和所述白名单特征库中特征相似度均未超过预设阈值的各条音视频数据的发送至人工审核模块,并将所述人工审核模块的反馈结果确定为审核结果。
[0015]优选的,所述一级分析网络由采用倒置残差结构的逐深度卷积网络以及逐点卷积层组成;
[0016]所述一级分析网络按照各大类违规标签对输入的所述待审核的音视频数据进行大类分析筛选,得到一级分析结果并生成与各大类违规标签对应的各违规音视频数据集的过程,包括:
[0017]所述一级分析网络的所述逐深度卷积网络按照各大类违规标签对应的参数对输入的所述待审核的音视频数据进行逐深度卷积,并使用轻量级过滤,得到各通道信息值;
[0018]所述一级分析网络的所述逐点卷积层基于所述各通道信息值进行线性组合构建,并按照各大类违规标签对应的筛选范围确定与各大类违规标签对应的各违规音视频数据集。
[0019]优选的,所述二级分析网络由残差卷积网络、池化处理层以及结果输出层构成;
[0020]所述二级分析网络对所述各违规音视频数据集中的各条违规音视频数据进行细类分析筛选,得到二级分析结果并确定所述各条违规音视频数据对应的子类违规标签的过程,包括:
[0021]所述二级分析网络的所述残差卷积网络通过对所述各违规音视频数据集中的各条违规音视频数据进行特征提取,得到所述各违规音视频数据集中的各条违规音视频数据的特征信息;
[0022]所述二级分析网络的所述池化处理层对所述各违规音视频数据集中的各条违规音视频数据的特征信息做降维池化处理,生成所述各违规音视频数据集中的各条违规音视频数据的整合特征;
[0023]所述二级分析网络的所述结果输出层基于所述各违规音视频数据集中的各条违规音视频数据的整合特征进行二次违规筛选,得到二级分析结果并确定所述各条违规音视频数据对应的子类违规标签。
[0024]优选的,所述三级分析网络由图像特征提取层、语音特征提取层以及相似度比较层构成;
[0025]所述三级分析网络提取所述各条违规音视频数据的隐式特征,并与所述子类违规标签对应的黑名单特征库和白名单特征库中特征进行相似度计算,得到相似度比较结果的过程,包括:
[0026]所述三级分析网络的所述图像特征提取层提取所述各条违规音视频数据中视频画面的隐式特征,得到画面通用特征;
[0027]所述三级分析网络的所述语音特征提取层提取所述各条违规音视频数据中语音信号的隐式特征,得到语音通用特征;
[0028]所述三级分析网络的所述相似度计算层基于所述画面通用特征和所述语音通用特征,与所述子类违规标签对应的黑名单特征库和白名单特征库中特征进行余弦相似度计算,得到所述相似度比较结果。
[0029]优选的,训练所述音视频审核模型的过程,包括:
[0030]获取训练音视频数据,所述训练音视频数据标注有对应的审核结果信息;
[0031]将所述训练音视频数据输入预设的初始音视频审核模型,得到所述初始音视频审核模型输出的对所述训练音视频数据的审核结果;
[0032]以对所述训练音视频数据的审核结果与所述训练音视频数据标注的对应的审核结果信息一致为目标,训练所述初始音视频审核模型;
[0033]当所述初始音视频审核模型满足预设的训练条件时,将训练完成的初始音视频审核模型作为所述音视频审核模型。
[0034]一种音视频审核装置,包括:
[0035]音视频获取模块,用于获取待审核的音视频数据;
[0036]模型确定模块,用于确定音视频审核模型,所述音视频审核模型包括一级分析网络、二级分析网络、三级分析网络以及结果处理网络,所述一级分析网络用于按照各大本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音视频审核方法,其特征在于,包括:获取待审核的音视频数据;确定音视频审核模型,所述音视频审核模型包括一级分析网络、二级分析网络、三级分析网络以及结果处理网络,所述一级分析网络用于按照各大类违规标签对输入的所述待审核的音视频数据进行大类分析筛选,得到一级分析结果并生成与各大类违规标签对应的各违规音视频数据集,所述二级分析网络用于对所述各违规音视频数据集中的各条违规音视频数据进行细类分析筛选,得到二级分析结果并确定所述各条违规音视频数据对应的子类违规标签,所述三级分析网络用于提取所述各条违规音视频数据的隐式特征,并与所述子类违规标签对应的黑名单特征库和白名单特征库中特征进行相似度计算,得到相似度比较结果,所述结果处理网络用于基于所述一级分析结果、所述二级分析结果以及所述相似度比较结果确定对所述待审核的音视频数据的审核结果;将所述待审核的音视频数据输入到所述音视频审核模型中,得到所述音视频审核模型输出的对所述待审核的音视频数据的审核结果。2.根据权利要求1所述的方法,其特征在于,基于所述一级分析结果、所述二级分析结果以及所述相似度比较结果确定对所述待审核的音视频数据的审核结果,包括:将所述待审核的音视频数据中所述一级分析结果和/或所述二级分析结果为未违规的各条音视频数据的审核结果确定为审核通过;将所述一级分析结果和所述二级分析结果为违规,且所述相似度比较结果为与所述黑名单特征库中特征相似度超过预设阈值的各条音视频数据的审核结果确定为审核不通过;将所述一级分析结果和所述二级分析结果为违规,且所述相似度比较结果为与所述白名单特征库中特征相似度超过预设阈值的各条音视频数据的审核结果确定为审核通过。3.根据权利要求2所述的方法,其特征在于,还包括:将所述一级分析结果和所述二级分析结果为违规,且所述相似度比较结果为与所述黑名单特征库和所述白名单特征库中特征相似度均未超过预设阈值的各条音视频数据的发送至人工审核模块,并将所述人工审核模块的反馈结果确定为审核结果。4.根据权利要求1所述的方法,其特征在于,所述一级分析网络由采用倒置残差结构的逐深度卷积网络以及逐点卷积层组成;所述一级分析网络按照各大类违规标签对输入的所述待审核的音视频数据进行大类分析筛选,得到一级分析结果并生成与各大类违规标签对应的各违规音视频数据集的过程,包括:所述一级分析网络的所述逐深度卷积网络按照各大类违规标签对应的参数对输入的所述待审核的音视频数据进行逐深度卷积,并使用轻量级过滤,得到各通道信息值;所述一级分析网络的所述逐点卷积层基于所述各通道信息值进行线性组合构建,并按照各大类违规标签对应的筛选范围确定与各大类违规标签对应的各违规音视频数据集。5.根据权利要求1所述的方法,其特征在于,所述二级分析网络由残差卷积网络、池化处理层以及结果输出层构成;所述二级分析网络对所述各违规音视频数据集中的各条违规音视频数据进行细类分析筛选,得到二级分析结果并确定所述各条违规音视频数据对应的子类违规标签的过程,包括:
所述二级分析网络的所述残差卷积网络通过对所述各违规音视频数据集中的各条违规音视频数据进行特征提取,得到所述各违规音视频数据集中的各条违规音视频数据的特征信息;所述二级分析网络的所述池化处理层对所述各违规音...

【专利技术属性】
技术研发人员:黎子骏马金龙熊佳吴文亮曾锐鸿王伟喆盘子圣焦南凯邓其春张政统黄祥康兰翔廖艳冰徐志坚谢睿陈光尧
申请(专利权)人:广州趣研网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1