一种视频检测方法、装置、设备及存储介质制造方法及图纸

技术编号：35095727 阅读：11 留言：0更新日期：2022-10-01 16:58

本申请公开了一种视频检测方法、装置、设备及存储介质。本申请涉及人工智能技术领域，该视频检测方法包括：获取两个目标视频对应的多模态信息，多模态信息包括两个目标视频各自对应的图像信息和音频信息；对图像信息分别进行多维度采样处理，得到两个目标视频各自对应的多维度采样图像；对多维度采样图像进行图像特征识别，得到两个目标视频各自对应的图像特征信息；对音频信息进行音频特征识别，得到两个目标视频各自对应的音频特征信息；基于图像特征信息和音频特征信息对两个目标视频进行重复检测，得到重复检测结果。利用本申请提供的技术方案，通过多维度采样图像和音频信息的双重视频特征进行视频重复检测，可以提升视频重复检测的准确性。重复检测的准确性。重复检测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频检测方法、装置、设备及存储介质

[0001]本申请涉及人工智能
，尤其涉及一种视频检测方法、装置、设备及存储介质。

技术介绍

[0002]传统的视频重复检测方法往往关注的是视频图像的相似度，通过图像相似度来判定两个视频是否重复。具体的，在图像特征库中进行相似图像检索，通过对比检索到的视频和查询视频的图像相似度确定两个视频是否重复。
[0003]然而，由于互联网创作类型的多样性，存在大量画面高度一致或相似但实质内容并不重复的视频，例如：剪辑和配音等二次创作视频。因此，从视频的单一图像模态来判定视频是否重复，通常容易造成大量重复误识别。因此，需要提供一种更加准确的技术方案。

技术实现思路

[0004]本申请提供了一种视频检测方法、装置、设备及存储介质，利用多维度采样图像和音频信息的双重视频特征进行视频重复检测，可以提升视频重复检测的准确性，本申请技术方案如下：
[0005]一方面，提供了一种视频检测方法，所述方法包括：
[0006]获取两个目标视频对应的多模态信息，所述多模态信息包括所述两个目标视频各自对应的图像信息和音频信息；
[0007]对所述图像信息分别进行多维度采样处理，得到所述两个目标视频各自对应的多维度采样图像；
[0008]对所述多维度采样图像进行图像特征识别，得到所述两个目标视频各自对应的图像特征信息；
[0009]对所述音频信息进行音频特征识别，得到所述两个目标视频各自对应的音频特征信息；
[0010]基于所述图像特征...

【技术保护点】

【技术特征摘要】
1.一种视频检测方法，其特征在于，所述方法包括：获取两个目标视频对应的多模态信息，所述多模态信息包括所述两个目标视频各自对应的图像信息和音频信息；对所述图像信息分别进行多维度采样处理，得到所述两个目标视频各自对应的多维度采样图像；对所述多维度采样图像进行图像特征识别，得到所述两个目标视频各自对应的图像特征信息；对所述音频信息进行音频特征识别，得到所述两个目标视频各自对应的音频特征信息；基于所述图像特征信息和所述音频特征信息，对所述两个目标视频进行重复检测，得到所述两个目标视频的重复检测结果。2.根据权利要求1所述的方法，其特征在于，所述基于所述图像特征信息和所述音频特征信息，对所述两个目标视频进行重复检测，得到所述两个目标视频的重复检测结果包括：将所述图像特征信息输入图像重复检测网络进行图像重复检测，得到图像重复检测结果；将所述音频特征信息输入音频重复检测网络进行音频重复检测，得到音频重复检测结果；对所述图像重复检测结果和所述音频重复检测结果进行复合校验处理，得到所述重复检测结果。3.根据权利要求2所述的方法，其特征在于，所述图像重复检测结果包括所述多维度采样图像对应的多个采样维度的初始检测结果，所述对所述图像重复检测结果和所述音频重复检测结果进行复合校验处理，得到所述重复检测结果包括：基于所述多个采样维度的预设校验优先级信息，从所述多个采样维度的初始检测结果中确定目标检测结果，所述目标检测结果为当前未校验的初始检测结果中对应采样维度的预设校验优先级信息最高的初始检测结果；对所述目标检测结果进行校验处理，得到检测校验结果；在所述检测校验结果满足预设校验条件的情况下，将所述目标检测结果作为所述重复检测结果。4.根据权利要求3所述的方法，其特征在于，在所述对所述目标检测结果进行校验处理，得到检测校验结果之后，所述方法还包括：在所述多个采样维度的检测校验结果均不满足所述预设校验条件的情况下，将所述音频重复检测结果作为所述重复检测结果。5.根据权利要求2所述的方法，其特征在于，所述对所述图像重复检测结果和所述音频重复检测结果进行复合校验处理，得到所述重复检测结果包括：获取所述两个目标视频的内容类型信息；确定与所述内容类型信息对应的图像权重信息和音频权重信息；基于所述图像权重信息和所述音频权重信息，对所述图像重复检测结果和所述音频重复检测结果进行加权处理，得到所述重复检测结果。6.根据权利要求1至5任一所述的方法，其特征在于，所述对所述图像信息分别进行多
维度采样处理，得到所述两个目标视频各自对应的多维度采样图像包括：对所述图像信息进行目标检测，得到目标对象图像；对所述图像信息进行剪裁处理，得到剪裁图像；对所述图像信息进行图像转换处理，得到转换图像；基于所述图像信息、所述目标对象图像、所述剪裁图像和所述转换图像，生成所述多维度采样图像。7.根据权利要求1至5任一所述的方法，其...

【专利技术属性】
技术研发人员：束俊辉，刘振华，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人