【技术实现步骤摘要】
基于视频相关文本的视频检测方法、装置及电子设备
本申请涉及视频检测
,具体而言,本申请涉及一种基于视频相关文本的视频检测方法、装置及电子设备。
技术介绍
随着视频制作技术的发展,人人都可以制作并分享自己的视频,造成网络上视频数量的激增。在网络上的大量视频中,有一部分视频是“三俗”(即庸俗、低俗、媚俗)视频,其传播的信息内容非常低俗,相关低俗视频的传播将对社会产生不良影响,因此,实现视频的低俗检测具有重要意义。目前,对视频的低俗检测是通过人工方式实现的,即相应视频平台的相关工作人员通过人工检测的方式,逐一对视频平台上的视频进行浏览、观看,然后确定相应的视频是否为低俗视频。然而,根据现有的人工方式进行视频的低俗检测,相关工作人员需要逐一检测相关视频,对于部分视频,甚至需要观看视频的完整内容之后才能确定相关视频是否为低俗视频,检测效率非常低,此外,随着视频平台视频数量的激增,需要大量的相关工作人员才能完成视频的低俗检测工作,人工成本非常高。因此,现有的人工进行视频的低俗检测方式存在效率低、成本高的问题。 >
技术实现思路
...
【技术保护点】
1.一种基于视频相关文本的视频检测方法,其特征在于,包括:/n对待检测视频的相关文本进行分词处理,得到多个文本词;/n通过预定的词嵌入方法得到各个所述文本词对应的词向量;/n基于各个所述文本词对应的词向量确定所述相关文本的固定长度的向量表征;/n将所述固定长度的向量表征输入预定的分类网络得到所述相关文本的低俗检测结果,并根据所述相关文本的低俗检测结果确定所述待检测视频的低俗检测结果。/n
【技术特征摘要】
1.一种基于视频相关文本的视频检测方法,其特征在于,包括:
对待检测视频的相关文本进行分词处理,得到多个文本词;
通过预定的词嵌入方法得到各个所述文本词对应的词向量;
基于各个所述文本词对应的词向量确定所述相关文本的固定长度的向量表征;
将所述固定长度的向量表征输入预定的分类网络得到所述相关文本的低俗检测结果,并根据所述相关文本的低俗检测结果确定所述待检测视频的低俗检测结果。
2.根据权利要求1所述的方法,其特征在于,所述基于各个所述文本词对应的词向量确定所述相关文本的固定长度的向量表征,包括以下至少一项:
基于各个所述文本词的词向量通过全局平均池化编码方法,得到所述待检测视频的相关文本的固定长度的向量表征;
基于各个所述文本词的词向量通过VLAD编码方法,得到所述待检测视频的相关文本的固定长度的向量表征;
基于各个所述文本词的词向量通过FisherVector编码方法,得到所述待检测视频的相关文本的固定长度的向量表征。
3.根据权利要求2所述的方法,其特征在于,所述基于各个所述文本词的词向量通过VLAD编码方法,得到所述待检测视频的相关文本的固定长度的向量表征,包括:
基于各个所述文本词的词向量对多个文本词进行聚类处理,得到多个聚类中心;
计算确定各个文本词的向量值分别与其对应的聚类中心向量值的残差值,并针对任一聚类中心对该聚类中心与对应的各个文本词之间的残差值进行求和得到残差值的和;
基于得到的各个聚类中心分别对应的残差值的和来确定所述待检测视频的相关文本的固定长度的向量表征。
4.根据权利要求1所述的方法,其特征在于,该方法还包括:
通过预训练的神经网络模型确定提取的所述待检测视频的关键帧图像的低俗检测结果;
基于所述关键帧图像的低俗检测结果与所述相关文本的低俗检测结果,确定所述待检测视频的低俗检测结果。
5.根据权利要求1所述的方法,其特征在于,所述待检测视频的相关文本包括以下至少一项:
所述待检测视频的视频标题;
所述待检测视频的标签;
基于所述待检测视频的音频进行语音识别得到的相应文本。
6.一种基于视频相关文本的视频检测装置,其特征在于,包括:...
【专利技术属性】
技术研发人员:黄君实,罗玄,陈强,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。