重复视频检测方法和装置制造方法及图纸

技术编号：20681031 阅读：42 留言：0更新日期：2019-03-27 18:55

本申请实施例公开了重复视频检测方法和装置。该方法的一具体实施方式包括：获取目标视频，对该目标视频进行视频描述，生成该目标视频的视频描述语句；对所生成的视频描述语句进行自然语言处理，得到该目标视频的目标视频特征；检测该目标视频特征与视频特征集合中的视频特征的相似度；若该目标视频特征与该视频特征集合中的、任意视频的视频特征的相似度大于或等于预设相似度阈值，则将该目标视频确定为与该视频特征集合关联的视频的重复视频。本申请实施例提供的方案能够利用视频描述，准确地确定重复视频，避免视频的重复存储，进而可以更加合理地利用存储空间，避免存储空间的无效占用。

全部详细技术资料下载

【技术实现步骤摘要】
重复视频检测方法和装置
本申请实施例涉及计算机
，具体涉及互联网
，尤其涉及重复视频检测方法和装置。
技术介绍
随着互联网技术的发展，视频数据呈爆炸式增长。每天在互联网上增加的各种长视频、短视频不计其数，给视频的存储带来挑战。在视频存储的过程中，可能会存在重复视频的存储，造成存储空间的浪费。
技术实现思路
本申请实施例提出了重复视频检测方法和装置。第一方面，本申请实施例提供了一种重复视频检测方法，包括：获取目标视频，对目标视频进行视频描述处理，生成目标视频的视频描述语句；对所生成的视频描述语句进行自然语言处理，得到目标视频的目标视频特征；检测目标视频特征与视频特征集合中的视频特征的相似度；若目标视频特征与视频特征集合中的、任意视频的视频特征的相似度大于或等于预设相似度阈值，则将目标视频确定为与视频特征集合关联的视频的重复视频。第二方面，本申请实施例提供了一种重复视频检测装置，包括：获取单元，被配置成获取目标视频，对目标视频进行视频描述处理，生成目标视频的视频描述语句；处理单元，被配置成对所生成的视频描述语句进行自然语言处理，得到目标视频的目标视频特征；相似度确定单元，被配置成检测目标视频特征与视频特征集合中的视频特征的相似度；重复视频确定单元，被配置成若目标视频特征与视频特征集合中的、任意视频的视频特征的相似度大于或等于预设相似度阈值，则将目标视频确定为与视频特征集合关联的视频的重复视频。第三方面，本申请实施例提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实...

【技术保护点】
1.一种重复视频检测方法，包括：获取目标视频，对所述目标视频进行视频描述处理，生成所述目标视频的视频描述语句；对所生成的视频描述语句进行自然语言处理，得到所述目标视频的目标视频特征；检测所述目标视频特征与视频特征集合中的视频特征的相似度；若所述目标视频特征与所述视频特征集合中的、任意视频的视频特征的相似度大于或等于预设相似度阈值，则将所述目标视频确定为与所述视频特征集合关联的视频的重复视频。

【技术特征摘要】
1.一种重复视频检测方法，包括：获取目标视频，对所述目标视频进行视频描述处理，生成所述目标视频的视频描述语句；对所生成的视频描述语句进行自然语言处理，得到所述目标视频的目标视频特征；检测所述目标视频特征与视频特征集合中的视频特征的相似度；若所述目标视频特征与所述视频特征集合中的、任意视频的视频特征的相似度大于或等于预设相似度阈值，则将所述目标视频确定为与所述视频特征集合关联的视频的重复视频。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：若所述目标视频特征与所述视频特征集合中的、各个视频的视频特征的相似度小于预设相似度阈值，则将所述目标视频添加到预设视频库中；以及将所述目标视频的目标视频特征添加到所述视频特征集合中。3.根据权利要求1或2所述的方法，其特征在于，所述对所生成的视频描述语句进行自然语言处理，得到所述目标视频的目标视频特征，包括：将所生成的视频描述语句输入词嵌入模型，得到所生成的视频描述语句的特征，将所述特征作为所述目标视频的目标视频特征。4.根据权利要求3所述的方法，其特征在于，所述词嵌入模型通过以下方式训练得到：获取预设的视频描述语句，以及所述预设的视频描述语句的特征；基于所述预设的视频描述语句与所对应的特征，训练初始词嵌入模型，得到所述词嵌入模型。5.根据权利要求1至4中任一项所述的方法，其特征在于，在所述获取目标视频之后，所述方法还包括：将所述目标视频分割为至少两个视频片段，其中，不同的视频片段对应所述目标视频的不同事件；以及所述对所述目标视频进行视频描述处理，生成所述目标视频的视频描述语句，包括：对于所述目标视频的每个视频片段，将该视频片段输入视频描述生成模型，得到该视频...

【专利技术属性】
技术研发人员：齐镗泉，
申请(专利权)人：连尚新昌网络科技有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人