The embodiment of the invention relates to the technical field of video processing, detection method and device discloses a bad content in the video, the method includes: acquiring the detected video files; to detect the video file for video and audio separation, obtaining audio and image information; the audio information into the first text and image information convert second text; the first text content and second text content are combined and re processing, to obtain the target text; contrast target text content and sensitive vocabulary list, find out the contents of the target sensitive words and the number of total access to sensitive vocabulary; according to the number of total words and target text sensitive words the obtained detection video file content according to the proportion of bad value; bad content ratio, processing the detected video The embodiment of the invention improves the recognition accuracy of the undesirable contents in the video, and reduces the misjudgment rate of the bad video.
【技术实现步骤摘要】
一种视频中不良内容的检测方法及装置
本专利技术涉及视频处理
,具体涉及一种视频中不良内容的检测方法及装置。
技术介绍
网络视频已深入人们的日常生活,成为人们获知知识和娱乐的手段。网络视频内容涉及的范围较广,视频内容良莠不齐,常常会有暴力、反动或者欺诈等不良内容信息混杂在内。随着包括不良内容视频的传播,会扰乱社会秩序,破坏社会风气,给人们尤其是给青少年的健康成长造成极大的负面影响。因此常常需要对网络视频的内容进行检查,以过滤掉不良内容的网络视频。然而视频的信息量通常比较大,现有过滤方式无法快速地排查出不良视频,容易造成不良视频的误判。
技术实现思路
本专利技术实施例公开了一种视频中不良内容的检测方法及装置,用于提高视频中不良内容的识别准确率,降低不良视频的误判率。本专利技术第一方面公开了一种视频中不良内容的检测方法,可包括:获取待检测视频文件;对所述待检测视频文件进行视频音频分离,获得音频信息和图像信息;将所述音频信息转换成第一文本内容,以及将所述图像信息转换成第二文本内容;对所述第一文本内容和所述第二文本内容进行合并和去重处理,获得目标文本内容;对比所述目标文本 ...
【技术保护点】
一种视频中不良内容的检测方法,其特征在于,包括:获取待检测视频文件;对所述待检测视频文件进行视频音频分离,获得音频信息和图像信息;将所述音频信息转换成第一文本内容,以及将所述图像信息转换成第二文本内容;对所述第一文本内容和所述第二文本内容进行合并和去重处理,获得目标文本内容;对比所述目标文本内容与敏感词汇列表,查找出所述目标文本内容中的敏感词汇以及获得所述敏感词汇的总字数;根据所述敏感词汇的总字数与所述目标文本内容的总字数,获得所述待检测视频文件的不良内容比例值;根据所述不良内容比例值,处理所述待检测视频文件。
【技术特征摘要】
1.一种视频中不良内容的检测方法,其特征在于,包括:获取待检测视频文件;对所述待检测视频文件进行视频音频分离,获得音频信息和图像信息;将所述音频信息转换成第一文本内容,以及将所述图像信息转换成第二文本内容;对所述第一文本内容和所述第二文本内容进行合并和去重处理,获得目标文本内容;对比所述目标文本内容与敏感词汇列表,查找出所述目标文本内容中的敏感词汇以及获得所述敏感词汇的总字数;根据所述敏感词汇的总字数与所述目标文本内容的总字数,获得所述待检测视频文件的不良内容比例值;根据所述不良内容比例值,处理所述待检测视频文件。2.根据权利要求1所述的方法,其特征在于,所述根据所述不良内容比例值,处理所述待检测视频文件,包括:当所述不良内容比例值小于或等于预设阈值时,确定所述待检测视频文件为内容健康的视频文件;当所述不良内容比例值大于所述预设阈值时,启动删除程序删除所述待检测视频文件。3.根据权利要求1或2所述的方法,其特征在于,所述获取待检测视频文件之后,以及所述对所述待检测视频文件进行视频音频分离,获得音频信息和图像信息之前,所述方法还包括:获取所述待检测视频文件的文件名称;对比所述文件名称与所述敏感词汇列表;当所述文件名称包含有所述敏感词汇列表中的敏感词汇且所包含的敏感词汇数量达到预设数量时,启动删除程序删除所述待检测视频文件;当所述文件名称包含的敏感词汇数量未达到预设数量时,执行所述对所述待检测视频文件进行视频音频分离,获得音频信息和图像信息的步骤。4.根据权利要求1或2所述的方法,其特征在于,所述获取待检测视频文件之后,以及所述对所述待检测视频文件进行视频音频分离,获得音频信息和图像信息之前,所述方法还包括:获取所述待检测视频文件的来源信息;判断所述来源信息所指示的来源地址是否与预设的非法来源地址列表中的某一个非法来源地址相匹配;如果匹配,启动删除程序删除所述待检测视频文件;如果不匹配,执行所述对所述待检测视频文件进行视频音频分离,获得音频信息和图像信息的步骤。5.根据权利要求1所述的方法,其特征在于,所述根据所述不良内容比例值,处理所述待检测视频文件,包括:当所述不良内容比例值大于所述预设阈值时,启动删除程序删除所述待检测视频文件;当所述不良内容比例值小于或等于预设阈值时,从所述待检测视频文件中提取连续多个关键帧,所述连续多个关键帧呈现所述待检测视频文件中的某一关键场景;获取所述某一关键场景中镜头的平均运动强度;判断所述运动强度是否大于预设强度值;如果所述运动强度大于所述预设强度值,从所述连续多个关键帧提取图像特征数据和音频特征数据;当所述图像特征数据处于预设的不良图像特征数据范围内且所述音频特征数据处于预设的不良音频特征数据范围内时,启动删除程序删除所述待检测视频文件;当所述图像特征数据不在预设的不良图像特征数据范围内且所述音频特征数据不在预设的不良音频特征数据范围内时,确定所述待检测视频文件为内容健康文件。6.一种视频中不良内容的检测装置,其特征在于,包括:获取单元,用于获取待检测视频文件;分离单元,用于对所述待检测视频文件进行视频音频分离,获得音频信息和图像信息;文本转换单元,用于将所述音频信息转换成第一文本内容,以及将所述图...
【专利技术属性】
技术研发人员:李应斌,
申请(专利权)人:广东小天才科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。