重复视频的识别方法、设备、储存介质及计算机程序产品技术

技术编号：35585585 阅读：25 留言：0更新日期：2022-11-16 15:00

本公开实施例提供一种重复视频的识别方法、设备、储存介质及计算机程序产品，通过对第一视频提取第一多模态数据，对第二视频提取第二多模态数据，第一多模态数据和第二多模态数据均包括至少两种相同种类的模态数据；分别提取各模态数据对应的特征信息；根据各模态数据对应的特征信息确定第一视频和第二视频之间的综合相似度参数；若综合相似度参数大于预设相似度阈值，则将第一视频和第二视频识别为重复视频。通过考虑第一视频和第二视频的多模态数据，可准确得到综合相似度参数，基于综合相似度参数来准确科学的识别重复视频，避免基于单一模态特征相似度导致的不准确性。单一模态特征相似度导致的不准确性。单一模态特征相似度导致的不准确性。

全部详细技术资料下载

【技术实现步骤摘要】
重复视频的识别方法、设备、储存介质及计算机程序产品

[0001]本公开实施例涉及计算机与网络通信
，尤其涉及一种重复视频的识别方法、设备、储存介质及计算机程序产品。

技术介绍

[0002]随着大数据时代的到来，视频作为一种新的交互形式，成为了整个人机交互中，甚至是人与人交流的重要组成部分。随着视频数据量的大幅度增长，在视频库中可能出现了许多相同视频，比如将某个视频的片段裁剪出来做成的短视频，或者通过不同渠道发布的相同视频等。为了实现对视频库中的相同视频进行去重处理，诞生了许多视频的去重技术。
[0003]现有技术中的去重技术在识别重复视频时，通常通过视频的关键帧检测，提取出一系列的视频关键帧，计算两个视频之间关键帧的图像相关性，然后通过多帧结果聚合得到两个视频之间相关程度，从而判断两个视频是否为重复视频。
[0004]但是现有技术中通过视频关键帧进行重复视频识别，其准确度并不高，容易产生错误的识别结果，将原本不一样的两个视频识别为重复视频。

技术实现思路

[0005]本公开实施例提供一种重复视频的识别方法、设备、储存介质及计算机程序产品，以提高重复视频识别的准确度。
[0006]第一方面，本公开实施例提供一种重复视频的识别方法，包括：
[0007]对待识别的第一视频提取第一多模态数据，其中，所述第一多模态数据包括至少两种模态数据；
[0008]对待识别的第二视频提取第二多模态数据，其中，所述第二多模态数据包括至少两种模态数据，且所述第一多模态数据的各模态数...

【技术保护点】

【技术特征摘要】
1.一种重复视频的识别方法，其特征在于，包括：对待识别的第一视频提取第一多模态数据，其中，所述第一多模态数据包括至少两种模态数据；对待识别的第二视频提取第二多模态数据，其中，所述第二多模态数据包括至少两种模态数据，且所述第一多模态数据的各模态数据种类与所述第二多模态数据的各模态数据种类相同；针对所述第一多模态数据的各模态数据、以及所述第二多模态数据的各模态数据，分别提取各模态数据对应的特征信息；根据所述各模态数据对应的特征信息，确定所述第一视频和所述第二视频之间的综合相似度参数的数值；若所述第一视频和所述第二视频之间的综合相似度参数的数值大于预设相似度阈值，则将所述第一视频和所述第二视频识别为重复视频。2.根据权利要求1所述的方法，其特征在于，所述根据所述各模态数据对应的特征信息，确定所述第一视频和所述第二视频之间的综合相似度参数的数值，包括：分别获取所述第一视频和所述第二视频的每一相同种类模态数据的特征信息之间的相似度信息；根据所述每一相同种类模态数据的特征信息之间的相似度信息，确定所述第一视频和所述第二视频之间的综合相似度参数的数值。3.根据权利要求2所述的方法，其特征在于，所述根据所述每一相同种类模态数据的特征信息之间的相似度信息，确定所述第一视频和所述第二视频之间的综合相似度参数的数值，包括：根据所述第一视频和所述第二视频所属视频类型，获取各模态数据种类对应的预设权重；根据所述每一相同种类模态数据的特征信息之间的相似度信息、以及所述各模态数据种类对应的预设权重，确定所述第一视频和所述第二视频之间的综合相似度参数的数值。4.根据权利要求2所述的方法，其特征在于，所述根据所述每一相同种类模态数据的特征信息之间的相似度信息，确定所述第一视频和所述第二视频之间的综合相似度参数的数值，包括：根据所述每一相同种类模态数据的特征信息之间的相似度信息、以及所述第一视频和所述第二视频所属视频类型对应的预设相似度参数计算模型，确定所述第一视频和所述第二视频之间的综合相似度参数的数值。5.根据权利要求2
‑
4任一项所述的方法，其特征在于，所述至少两种模态数据包括视频关键帧数据和音频数据；所述根据所述第一多模态数据的各模态数据、以及所述第二多模态数据的各模态数据，分别提取各模态数据对应的特征信息，包括：根据预设的视频特征提取模型，对所述第一视频和所述第二视频的视频关键帧数据分别提取关键帧特征信息；根据预设的音频特征提取模型，对所述第一视频和所述第二视频的音频数据分别提取音频特征信息。
6.根据权利要求5所述的方法，其特征在于，所述根据预设的音频特征提取模型，对所述第一视频和所述第二视频的音频数据分别提取音频特征信息，包括：将所述第一视频和所述第二视频的音频数据分别划分为多个音频片段；根据所述音频特征提取模型，对于所述第一视频和所述第二视频的每一音频片段提取音频特征信息。7.根据权利要求5所述的方法，其特征在于，所述分别获取所述第一视频和所述第二视频的每一相同种类模态数据的特征信息之间的相似度信息，包括：...

【专利技术属性】
技术研发人员：任晖，
申请(专利权)人：北京字跳网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人