【技术实现步骤摘要】
一种短视频检测和多分类方法、装置及存储介质
[0001]本专利技术涉及短视频检测与分类领域,特别涉及一种短视频检测和分类方法、装置及计算机存储介质。
技术介绍
[0002]随着互联网通信技术和多媒体技术的迅速发展,数字视频已广泛传播于大量用户之间,尤其是各大短视频平台的出现,短视频已经成为人们获取娱乐和新闻的重要来源之一。然而,有些短视频属于异常短视频。因此如果对短视频不加以分类管理,不提前进行提醒,那么会存在一定影响。因此,如何对短视频内容的检测、监测、分类、提醒是本领域中迫切需求解决的技术难题。
[0003]如何对短视频内容检测涉及多种技术的交叉,其涉及短视频编解码技术、图像处理技术、语音处理技术、文本处理技术、数据库存储技术等等。而现有技术中,通常只涉及利用单一的技术对短视频内容进行简单粗分类,例如可利用图像识别技术将目标短视频分类、利用关键词识别的手段将预警短视频分类等等,很显然上述技术方案不能适应多种类型的短视频分类,同时由于检测手段的单一会导致准确度较低。因此,迫切需要一种针对短视频,进行检测和分类的技术,其不仅能对短视频进行多类型的检测分类,同时通过融合多种短视频中的信息提高短视频分类的准确度。
技术实现思路
[0004]有鉴于此,本专利技术提供了一种短视频检测和分类方法,可将短视频分类为目标视频和突发预警视频。一方面利用图像处理技术和文本处理技术能够准确提取短视频中的蕴含的有效信息,为短视频的分类提供多种图像信息和文本信息,提高短视频识别的准确度。另一方面充分利用短视频中的图像 ...
【技术保护点】
【技术特征摘要】
1.一种短视频检测和多分类装置,所述装置包括:获取模块、视频语音分离模块、目标短视频检测和识别模块、图像文字检测和识别模块、多领域预警关键词库构建模块、预警短视频分类模块、分类结果展示模块;所述获取模块:具体用于接收用户发送的短视频获取请求,采用获取程序以消息队列请求的方式向短视频平台或者短视频网络存储数据库发送短视频获取请求,并接收获取结果;所述视频语音分离模块:具体用于从所述短视频中分离出短视频的视频图像帧以及该短视频中的语音信息;所述目标短视频检测和识别模块:具体用于执行目标短视频检测和识别,首先判断图像关键帧对应的人脸数量是否满足阈值条件,若是,则利用图像关键帧的多种特征信息判断该短视频是否为目标短视频;所述图像文字检测和识别模块:具体用于对剔除了目标短视频的剩余短视频执行文字信息识别;所述多领域预警关键词库构建模块:具体用于构建多领域预警关键词库,该预警关键词库是基于预先采集的多领域语料进行训练得到的,且该多领域关键词库对应多种短视频预警类别;所述预警短视频分类模块:具体用于将未检测出文字区域的短视频剔除,对剩余的短视频进行突发预警分类识别,匹配多领域预警关键词库,利用文本关键词分词结果的哈希相似度比对结合基于机器学习的语义比对,执行预警短视频分类;所述分类结果展示模块:具体用于对上述分类短视频进行展示。2.一种利用权利要求1所述的装置实现的短视频检测和多分类方法,包括如下步骤:步骤1:接收用户发送的短视频获取请求,采用获取程序以消息队列请求的方式向短视频平台或者短视频网络存储数据库发送短视频获取请求,并接收获取结果;步骤2:从所述短视频中分离出短视频的视频图像帧以及该短视频中的语音信息;在提取视频图像帧之后,还包括执行如下步骤:步骤2.1:将获取的每个短视频划分为多个片段,从每个片段中提取一个非边缘帧作为视频图像关键帧;步骤2.2:将提取的多个视频图像关键帧构成该短视频的图像关键帧序列,并作为该短视频的图像帧对应保存到数据库,同时将对应的语音文件也对应保存到数据库,并设置查询索引;步骤3:执行目标短视频检测和识别,首先判断图像关键帧对应的人脸数量是否满足阈值条件,若是,则利用图像关键帧的多种特征信息判断该短视频是否为目标短视频;步骤4:对剔除了目标短视频的剩余短视频执行文字信息的识别流程,包括文本区域检测定位和字符识别流程;步骤5:构建多领域预警关键词库,该预警关键词库是基于预先采集的多领域语料进行训练得到的,其中多领域关键词库对应多种短视频预警类别;步骤6:将未检测出文字区域的短视频剔除,对剩余的短视频进行突发预警分类识别,利用基于两级关键词匹配识别算法,即先利用文本关键词分词结果的哈希相似度比对,再利用基于机器学习的关键词语义比对,执行预警短视频分类;
步骤7:对上述分类短视频进行展示。3.如权利要求2所述的短视频检测和多分类方法,其特征在于:其中,所述利用图像关键帧的多种特征信息判断该短视频是否为目标短视频,具体包括如下过程:步骤3.1:人体肤色区域检测和肤色特征提取:利用人体肤色统计模型得到人体肤色区域;根据所述肤色区域,从所述肤色区域中提取多个特征值作为特征向量,其中特征值包括:肤色占整个图像的比例、肤色连通区域的个数;最大连通区域占整个图像的比例;步骤3.2:人体姿态检测和特征提取:计算连续两帧图像的帧差图像,获取运动特征,并且与人体异常姿态特征库进行对比,得到最接近的人体姿态,并且将对应的直方图特征作为人体姿态特征;其中所述人体异常姿态特征库采用如下方式构建:根据多个目标动作短视频片段样本,计算连续两帧图像相减即得帧差图像,得到运动变化的像素,统计该像素直方图特征,将所述直方图特征构建为目标短视频动作特征库;步骤3.3:将上述提取的人体肤色区域特征和人体姿态特征进行多特征融合,并利用分类器进行识别,得到该图像关键帧是否为目标的帧图像,并进行0和1的标识;步骤3.4:对每个短视频的多个图像关键帧执行上述过程,并将识别结果与每个视频对应保存;步骤3.5:根据短视频的所有图像关键帧的识别结果来最终确定短视频的异常性。4.如权利要求3所述的短视频检测和多分类方法,其特征在于:其中,所述利用人体肤色统计模型得到人体肤色区域,包括如下过程:人体肤色统计模型构建如下:将RGB颜色空间转换到HSV空间,通过计算大量样本肤...
【专利技术属性】
技术研发人员:ꢀ五一IntClG零六F一六七五,
申请(专利权)人:冠传网络科技南京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。