【技术实现步骤摘要】
用于确定重复视频的方法和装置
本申请涉及计算机
,具体涉及计算机网络
,尤其涉及用于确定重复视频的方法和装置。
技术介绍
在目前的互联网视频业务中,为了节省硬件资源、提高用户体验,在储存视频时需要识别出高相似度视频,并对高相似度视频去重。目前的视频去重处理方法主要包括以下几种:第一种方法中根据视频文件MD5值去重。第二种方法中根据视频文本元数据信息去重,例如基于向量空间模型(VSM)在为每个视频建立文本向量空间模型后,计算两个向量的距离就得到了对于视频相似度。第三种方法中根据视频内容去重,可以通过关键帧的图像匹配来计算视频的相似度。然而,上述的第一种方法中,视频经过转码后MD5值就会变化,而且无法识别出内容高度相似的视频。第二种方法中度量计算时间复杂度高,面对大量的互联网视频,计算代价太大。第三种方法中计算时间复杂度较高,而且单个相似度的计算量过于复杂,不具有实际工程应用性;并且有些视频内容具有很高的相似性,但是由于拍摄期间或者后期处理等的差异性,使得关键帧不相同造成漏识别。
技术实现思路
本申请实施例提供了用于确定重复视频的方法和装置。第一方面,本申请实施例提供了一种用于确定重复视频的方法,包括:获取当前视频;对比当前视频中包括人脸的时间段与已有视频库中的各个已有视频中包括人脸的时间段,得到各个已有视频与当前视频的相似度;响应于对比的结果指示已有视频库中存在与当前视频的相似度大于预设阈值的已有视频,确定当前视频与该已有视频重复。在一些实施例中,对比当前 ...
【技术保护点】
1.一种用于确定重复视频的方法,包括:/n获取当前视频;/n对比所述当前视频中包括人脸的时间段与已有视频库中的各个已有视频中包括人脸的时间段,得到各个已有视频与所述当前视频的相似度;/n响应于对比的结果指示所述已有视频库中存在与所述当前视频的相似度大于预设阈值的已有视频,确定所述当前视频与该已有视频重复。/n
【技术特征摘要】
1.一种用于确定重复视频的方法,包括:
获取当前视频;
对比所述当前视频中包括人脸的时间段与已有视频库中的各个已有视频中包括人脸的时间段,得到各个已有视频与所述当前视频的相似度;
响应于对比的结果指示所述已有视频库中存在与所述当前视频的相似度大于预设阈值的已有视频,确定所述当前视频与该已有视频重复。
2.根据权利要求1所述的方法,其中,所述对比所述当前视频中包括人脸的时间段与已有视频库中的各个已有视频中包括人脸的时间段,得到各个已有视频与所述当前视频的相似度包括:
对所述当前视频中的人脸进行人脸跟踪,确定所述当前视频中的人脸出现的第一时间段集合;
对各个已有视频中的人脸进行人脸跟踪,确定各个已有视频中的人脸出现的第二时间段集合;
对比所述当前视频的第一时间段集合与已有视频库中的各个已有视频的第二时间段集合,得到各个已有视频与所述当前视频的相似度。
3.根据权利要求1所述的方法,其中,所述对比所述当前视频中包括人脸的时间段与已有视频库中的各个已有视频中包括人脸的时间段,得到各个已有视频与所述当前视频的相似度包括:
对所述当前视频中的人脸进行人脸跟踪,确定所述当前视频中的人脸出现的第一时间段集合;
对所述已有视频库中各个已有视频中的人脸进行人脸跟踪,确定各个已有视频中的人脸出现的第二时间段集合;
对比所述当前视频的第一时间段集合与已有视频库中的各个已有视频的第二时间段集合,得到预判相似值集合;
响应于所述预判相似值集合中存在大于预定阈值的预判相似值,基于大于预定阈值的预判相似值对应的已有视频,确定对应该已有视频的各个第二时间段的第二人脸标签集合;
基于当前视频,确定对应各个第一时间段的第一人脸标签集合;
对比所述当前视频的所述第一人脸标签集合中的第一人脸标签与所述该已有视频的所述第二人脸标签集合中的第二人脸标签,得到各个已有视频与所述当前视频的相似度。
4.根据权利要求3所述的方法,其中,所述基于当前视频,确定对应各个第一时间段的第一人脸标签集合包括:对于所述当前视频的各个第一时间段中的各个视频帧,提取每个人脸的特征形成多维向量,基于各个人脸的多维向量形成第一人脸向量矩阵;
所述基于大于预定阈值的预判相似值对应的已有视频,确定对应该已有视频的各个第二时间段的第二人脸标签集合包括:对于大于预定阈值的预判相似值对应的已有视频的各个第二时间段中的各个视频帧,提取每个人脸的特征形成多维向量,基于各个人脸的多维向量形成第二人脸向量矩阵。
5.根据权利要求3或4任意一项所述的方法,其中,所述第一人脸标签集合中包括第一人脸标签子集序列,所述第一人脸标签子集序列中的每一个第一人脸标签子集对应所述当前视频中的一个视频帧且包括多个人脸标签;
所述第二人脸标签集合中包括第二人脸标签子集序列,所述第二人脸标签子集序列中的每一个第二人脸标签子集对应大于预定阈值的预判相似值对应的已有视频中的一个视频帧且包括多个人脸标签;
所述对比所述当前视频的所述第一人脸标签集合中的第一人脸标签与所述该已有视频的所述第二人脸标签集合中的第二人脸标签包括:对比所述第一时间段集合中出现的人脸标签子集序列与所述第二时间段集合中出现的人脸标签子集序列。
6.一种用于确定重复视频的装置,包括:
视频获取单元,被配置成获取当前视频;
视频对比单元,被配置成对比所述当前视频中包括人...
【专利技术属性】
技术研发人员:李元朋,彭明浩,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。