一种视频检测方法、装置、设备及存储介质制造方法及图纸

技术编号:35095727 阅读:11 留言:0更新日期:2022-10-01 16:58
本申请公开了一种视频检测方法、装置、设备及存储介质。本申请涉及人工智能技术领域,该视频检测方法包括:获取两个目标视频对应的多模态信息,多模态信息包括两个目标视频各自对应的图像信息和音频信息;对图像信息分别进行多维度采样处理,得到两个目标视频各自对应的多维度采样图像;对多维度采样图像进行图像特征识别,得到两个目标视频各自对应的图像特征信息;对音频信息进行音频特征识别,得到两个目标视频各自对应的音频特征信息;基于图像特征信息和音频特征信息对两个目标视频进行重复检测,得到重复检测结果。利用本申请提供的技术方案,通过多维度采样图像和音频信息的双重视频特征进行视频重复检测,可以提升视频重复检测的准确性。重复检测的准确性。重复检测的准确性。

【技术实现步骤摘要】
一种视频检测方法、装置、设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种视频检测方法、装置、设备及存储介质。

技术介绍

[0002]传统的视频重复检测方法往往关注的是视频图像的相似度,通过图像相似度来判定两个视频是否重复。具体的,在图像特征库中进行相似图像检索,通过对比检索到的视频和查询视频的图像相似度确定两个视频是否重复。
[0003]然而,由于互联网创作类型的多样性,存在大量画面高度一致或相似但实质内容并不重复的视频,例如:剪辑和配音等二次创作视频。因此,从视频的单一图像模态来判定视频是否重复,通常容易造成大量重复误识别。因此,需要提供一种更加准确的技术方案。

技术实现思路

[0004]本申请提供了一种视频检测方法、装置、设备及存储介质,利用多维度采样图像和音频信息的双重视频特征进行视频重复检测,可以提升视频重复检测的准确性,本申请技术方案如下:
[0005]一方面,提供了一种视频检测方法,所述方法包括:
[0006]获取两个目标视频对应的多模态信息,所述多模态信息包括所述两个目标视频各自对应的图像信息和音频信息;
[0007]对所述图像信息分别进行多维度采样处理,得到所述两个目标视频各自对应的多维度采样图像;
[0008]对所述多维度采样图像进行图像特征识别,得到所述两个目标视频各自对应的图像特征信息;
[0009]对所述音频信息进行音频特征识别,得到所述两个目标视频各自对应的音频特征信息;
[0010]基于所述图像特征信息和所述音频特征信息,对所述两个目标视频进行重复检测,得到所述两个目标视频的重复检测结果。
[0011]另一方面,提供了一种视频检测装置,所述方法包括:
[0012]多模态信息获取模块,用于获取两个目标视频对应的多模态信息,所述多模态信息包括所述两个目标视频各自对应的图像信息和音频信息;
[0013]多维度采样处理模块,用于对所述图像信息分别进行多维度采样处理,得到所述两个目标视频各自对应的多维度采样图像;
[0014]图像特征识别模块,用于对所述多维度采样图像进行图像特征识别,得到所述两个目标视频各自对应的图像特征信息;
[0015]音频特征识别模块,用于对所述音频信息进行音频特征识别,得到所述两个目标视频各自对应的音频特征信息;
[0016]重复检测模块,用于基于所述图像特征信息和所述音频特征信息,对所述两个目标视频进行重复检测,得到所述两个目标视频的重复检测结果。
[0017]另一方面,提供了一种视频检测设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如第一方面所述的视频检测方法。
[0018]另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如第一方面所述的视频检测方法。
[0019]另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如第一方面所述的视频检测方法。
[0020]本申请提供的一种视频检测方法、装置、设备及存储介质,具有如下技术效果:
[0021]本申请在对视频进行重复检测的场景中,通过获取两个目标视频各自对应的图像信息和音频信息,并对图像信息分别进行多维度采样处理,得到两个目标视频各自对应的多维度采样图像,通过多个维度的采样图像提升图像内容的识别能力,再对多维度采样图像进行图像特征识别,得到两个目标视频各自对应的图像特征信息,以及对音频信息进行音频特征识别,得到两个目标视频各自对应的音频特征信息,最后基于图像特征信息和音频特征信息,对两个目标视频进行重复检测,得到两个目标视频的重复检测结果,通过增加特征维度,利用多维度采样图像和音频信息的双重特征进行视频重复检测,可以有效提升对视频进行重复检测的准确性。
附图说明
[0022]为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0023]图1是本申请实施例提供的一种应用环境的示意图;
[0024]图2是本申请实施例提供的一种视频检测方法的流程示意图;
[0025]图3是本申请实施例提供的一种确定两个目标视频的流程示意图;
[0026]图4是本申请实施例提供的一种对图像信息分别进行多维度采样处理,得到两个目标视频各自对应的多维度采样图像的流程示意图;
[0027]图5是本申请实施例提供的一种多维度采样图像的示意图;
[0028]图6是本申请实施例提供的一种基于多维度采样图像和音频信息,对两个目标视频进行重复检测,得到两个目标视频的重复检测结果的流程示意图;
[0029]图7是本申请实施例提供的一种对图像重复检测结果和音频重复检测结果进行复合校验处理,得到重复检测结果的流程示意图;
[0030]图8是本申请实施例提供的另一种对图像重复检测结果和音频重复检测结果进行复合校验处理,得到重复检测结果的流程示意图;
[0031]图9是本申请实施例提供的一种复合校验流程的示意图;
[0032]图10是本申请实施例提供的一种网络训练方法的流程示意图;
[0033]图11是本申请实施例提供的一种视频检测系统的示意图;
[0034]图12是本申请实施例提供的另一种视频检测系统的示意图;
[0035]图13是本申请实施例提供的一种视频检测装置的组成框图;
[0036]图14是本申请实施例提供的一种视频检测设备的结构示意图。
具体实施方式
[0037]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0038]需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0039]可以理解的是,在本申请的具体实施方式中,涉及到用户信息等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频检测方法,其特征在于,所述方法包括:获取两个目标视频对应的多模态信息,所述多模态信息包括所述两个目标视频各自对应的图像信息和音频信息;对所述图像信息分别进行多维度采样处理,得到所述两个目标视频各自对应的多维度采样图像;对所述多维度采样图像进行图像特征识别,得到所述两个目标视频各自对应的图像特征信息;对所述音频信息进行音频特征识别,得到所述两个目标视频各自对应的音频特征信息;基于所述图像特征信息和所述音频特征信息,对所述两个目标视频进行重复检测,得到所述两个目标视频的重复检测结果。2.根据权利要求1所述的方法,其特征在于,所述基于所述图像特征信息和所述音频特征信息,对所述两个目标视频进行重复检测,得到所述两个目标视频的重复检测结果包括:将所述图像特征信息输入图像重复检测网络进行图像重复检测,得到图像重复检测结果;将所述音频特征信息输入音频重复检测网络进行音频重复检测,得到音频重复检测结果;对所述图像重复检测结果和所述音频重复检测结果进行复合校验处理,得到所述重复检测结果。3.根据权利要求2所述的方法,其特征在于,所述图像重复检测结果包括所述多维度采样图像对应的多个采样维度的初始检测结果,所述对所述图像重复检测结果和所述音频重复检测结果进行复合校验处理,得到所述重复检测结果包括:基于所述多个采样维度的预设校验优先级信息,从所述多个采样维度的初始检测结果中确定目标检测结果,所述目标检测结果为当前未校验的初始检测结果中对应采样维度的预设校验优先级信息最高的初始检测结果;对所述目标检测结果进行校验处理,得到检测校验结果;在所述检测校验结果满足预设校验条件的情况下,将所述目标检测结果作为所述重复检测结果。4.根据权利要求3所述的方法,其特征在于,在所述对所述目标检测结果进行校验处理,得到检测校验结果之后,所述方法还包括:在所述多个采样维度的检测校验结果均不满足所述预设校验条件的情况下,将所述音频重复检测结果作为所述重复检测结果。5.根据权利要求2所述的方法,其特征在于,所述对所述图像重复检测结果和所述音频重复检测结果进行复合校验处理,得到所述重复检测结果包括:获取所述两个目标视频的内容类型信息;确定与所述内容类型信息对应的图像权重信息和音频权重信息;基于所述图像权重信息和所述音频权重信息,对所述图像重复检测结果和所述音频重复检测结果进行加权处理,得到所述重复检测结果。6.根据权利要求1至5任一所述的方法,其特征在于,所述对所述图像信息分别进行多
维度采样处理,得到所述两个目标视频各自对应的多维度采样图像包括:对所述图像信息进行目标检测,得到目标对象图像;对所述图像信息进行剪裁处理,得到剪裁图像;对所述图像信息进行图像转换处理,得到转换图像;基于所述图像信息、所述目标对象图像、所述剪裁图像和所述转换图像,生成所述多维度采样图像。7.根据权利要求1至5任一所述的方法,其...

【专利技术属性】
技术研发人员:束俊辉刘振华
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1