相似视频文件的检测方法和装置制造方法及图纸

技术编号:14768185 阅读:51 留言:0更新日期:2017-03-08 12:28
本发明专利技术公开了一种相似视频文件的检测方法和装置。该方法包括:获取第一视频文件的第一关键帧与第二视频文件的第二关键帧中指纹相同的关键帧的数量,该数量与第二关键帧的数量的比值记为第一比值;获取第一视频文件的第一音频指纹序列和第二视频文件的第二音频指纹序列中相同的音频指纹序列,将该音频指纹序列中音频指纹序号的范围与第二音频指纹序列中的音频指纹的数量的比值为第二比值,将该音频指纹序列中的音频指纹的数量与该音频指纹序列中音频指纹序号的范围的比值为第三比值;根据第一比值、第二比值和第三比值中的至少一个判断第一视频文件与第二视频文件是否相似。本发明专利技术解决了相关技术中对相似视频文件的检测准确度较低的技术问题。

【技术实现步骤摘要】

本专利技术涉及计算机领域,具体而言,涉及一种相似视频文件的检测方法和装置
技术介绍
目前,视频相似度检测被广泛应用于盗版视频监控领域,相关技术中的视频相似度检测方法主要是基于视频关键帧指纹匹配,如图1所示,相关技术中的视频相似度检测方法主要分为以下两步:1)分别获取视频a和视频b的关键帧指纹特征:分别提取正版视频(假设为视频a)与疑似盗版视频(假设为视频b)的关键帧,并计算关键帧的颜色分布直方图,然后将直方图转化成固定长度的0/1序列,即单帧关键帧的指纹特征。2)将两个视频关键帧的指纹序列进行比对,计算两个指纹序列中重叠的指纹个数,得到视频a和视频b之间的相似度。上述视频相似度检测方法对视频相似度的检测准确度较低,存在以下缺陷:1、即使相同的视频在不同编码格式下,提取到的关键帧也不完全相同,仅靠关键帧指纹并不能准确计算视频的相似度。2、直方图只是图像中颜色的全局分布的描述,无法描述颜色的局部分布和色彩所处的位置。因此,内容不同的图像其直方图也很有可能相同,导致不同内容的关键帧的指纹相同。3、相比于正版视频,受录制条件等因素影响,盗版视频可能会存在额外的黑色边,表现为:画面缩小,视频上下左右都有几厘米宽的黑边。关键指纹因此而改变,相同的视频也无法识别出来。4、盗版视频中可能插播了广告,受此影响,关键帧指纹匹配算法准确率会进一步下降。受上面几点因素的影响,相关技术中的视频相似度检测方法并不能准确计算两视频的相似度,极有可能产生错判。因此,相关技术方案并不能作为一种可信赖的方案应用于全自动化盗版视频监控。针对上述的问题,目前尚未提出有效的解决方案。专利技术内容本专利技术实施例提供了一种相似视频文件的检测方法和装置,以至少解决相关技术中对相似视频文件的检测准确度较低的技术问题。根据本专利技术实施例的一个方面,提供了一种相似视频文件的检测方法,包括:根据第一视频文件的第一关键帧的第一关键帧指纹集与第二视频文件的第二关键帧的第二关键帧指纹集,获取第一关键帧与第二关键帧中指纹相同的关键帧的数量,其中,将指纹相同的关键帧的数量与第二关键帧的数量的比值记为第一比值;获取第一视频文件的第一音频指纹序列和第二视频文件的第二音频指纹序列中相同的音频指纹序列,记为第三音频指纹序列,其中,将第三音频指纹序列中音频指纹序号的范围与第二音频指纹序列中的音频指纹的数量的比值记为第二比值,将第三音频指纹序列中的音频指纹的数量与第三音频指纹序列中音频指纹序号的范围的比值记为第三比值;根据第一比值、第二比值和第三比值中的至少一个判断第一视频文件与第二视频文件是否为相似视频文件。根据本专利技术实施例的另一方面,还提供了一种相似视频文件的检测装置,包括:第一获取单元,用于根据第一视频文件的第一关键帧的第一关键帧指纹集与第二视频文件的第二关键帧的第二关键帧指纹集,获取第一关键帧与第二关键帧中指纹相同的关键帧的数量,其中,将指纹相同的关键帧的数量与第二关键帧的数量的比值记为第一比值;第二获取单元,用于获取第一视频文件的第一音频指纹序列和第二视频文件的第二音频指纹序列中相同的音频指纹序列,记为第三音频指纹序列,其中,将第三音频指纹序列中音频指纹序号的范围与第二音频指纹序列中的音频指纹的数量的比值记为第二比值,将第三音频指纹序列中的音频指纹的数量与第三音频指纹序列中音频指纹序号的范围的比值记为第三比值;判断单元,用于根据第一比值、第二比值和第三比值中的至少一个判断第一视频文件与第二视频文件是否为相似视频文件。在本专利技术实施例中,通过获取第一视频文件的第一关键帧与第二视频文件的第二关键帧中指纹相同的关键帧的数量,并将该数量与第二关键帧的数量的比值记为第一比值;获取第一视频文件的第一音频指纹序列和第二视频文件的第二音频指纹序列中相同的音频指纹序列,将该音频指纹序列中音频指纹序号的范围与第二音频指纹序列中的音频指纹的数量的比值为第二比值,将该音频指纹序列中的音频指纹的数量与该音频指纹序列中音频指纹序号的范围的比值为第三比值;根据第一比值、第二比值和第三比值中的至少一个判断第一视频文件与第二视频文件是否相似,达到了综合关键帧指纹和音频指纹检测视频相似度的目的,从而实现了提高视频相似度检测结果的准确度的技术效果,进而解决了相关技术中对相似视频文件的检测准确度较低的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据相关技术的视频相似度检测方法的示意图;图2是根据本专利技术实施例的相似视频文件的检测方法的硬件环境的示意图;图3是根据本专利技术实施例的一种可选的相似视频文件的检测方法的流程图;图4a是根据本专利技术实施例的正版视频中的关键帧图像的示意图;图4b是根据本专利技术实施例的盗版视频中的关键帧图像的示意图;图5a是根据本专利技术实施例的均值图的示意图;图5b是根据本专利技术实施例的灰度图的示意图;图5c是根据本专利技术实施例的二值图的示意图;图5d是根据本专利技术实施例的边缘图的示意图;图5e是根据本专利技术实施例的确定的黑边位置的示意图;图6是根据本专利技术实施例的裁剪后的关键帧的示意图;图7是根据本专利技术实施例的音频波形的示意图;图8是根据本专利技术实施例的声谱图的示意图;图9是根据本专利技术实施例的音符图的示意图;图10是根据本专利技术实施例的不同的区域掩膜的示意图;图11是根据本专利技术实施例的盗版视频监控流程的示意图;图12是根据本专利技术实施例的一种可选的相似视频文件的检测装置的示意图;图13是根据本专利技术实施例的另一种可选的相似视频文件的检测装置的示意图;图14是根据本专利技术实施例的另一种可选的相似视频文件的检测装置的示意图;图15是根据本专利技术实施例的另一种可选的相似视频文件的检测装置的示意图;图16是根据本专利技术实施例的另一种可选的相似视频文件的检测装置的示意图;图17是根据本专利技术实施例的另一种可选的相似视频文件的检测装置的示意图;图18是根据本专利技术实施例的另一种可选的相似视频文件的检测装置的示意图;以及图19是根据本专利技术实施例的一种终端的结构框图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施例1根据本专利技术实施例,提供了一种相似视频文件的检测方法的方法实施例。可选地,在本实施例中,上述相似视频文件的检测方法可以应用本文档来自技高网
...
相似视频文件的检测方法和装置

【技术保护点】
一种相似视频文件的检测方法,其特征在于,包括:根据第一视频文件的第一关键帧的第一关键帧指纹集与第二视频文件的第二关键帧的第二关键帧指纹集,获取所述第一关键帧与所述第二关键帧中指纹相同的关键帧的数量,其中,将所述指纹相同的关键帧的数量与所述第二关键帧的数量的比值记为第一比值;获取所述第一视频文件的第一音频指纹序列和所述第二视频文件的第二音频指纹序列中相同的音频指纹序列,记为第三音频指纹序列,其中,将所述第三音频指纹序列中音频指纹序号的范围与所述第二音频指纹序列中的音频指纹的数量的比值记为第二比值,将所述第三音频指纹序列中的音频指纹的数量与所述第三音频指纹序列中音频指纹序号的范围的比值记为第三比值;根据所述第一比值、所述第二比值和所述第三比值中的至少一个判断所述第一视频文件与所述第二视频文件是否为相似视频文件。

【技术特征摘要】
1.一种相似视频文件的检测方法,其特征在于,包括:根据第一视频文件的第一关键帧的第一关键帧指纹集与第二视频文件的第二关键帧的第二关键帧指纹集,获取所述第一关键帧与所述第二关键帧中指纹相同的关键帧的数量,其中,将所述指纹相同的关键帧的数量与所述第二关键帧的数量的比值记为第一比值;获取所述第一视频文件的第一音频指纹序列和所述第二视频文件的第二音频指纹序列中相同的音频指纹序列,记为第三音频指纹序列,其中,将所述第三音频指纹序列中音频指纹序号的范围与所述第二音频指纹序列中的音频指纹的数量的比值记为第二比值,将所述第三音频指纹序列中的音频指纹的数量与所述第三音频指纹序列中音频指纹序号的范围的比值记为第三比值;根据所述第一比值、所述第二比值和所述第三比值中的至少一个判断所述第一视频文件与所述第二视频文件是否为相似视频文件。2.根据权利要求1所述的方法,其特征在于,根据所述第一比值、所述第二比值和所述第三比值中的至少一个判断所述第一视频文件与所述第二视频文件是否为相似视频文件包括:判断是否满足以下条件之一,若满足,则判断出所述第一视频文件与所述第二视频文件为相似视频文件:所述第一比值大于等于第一阈值;所述第三比值大于等于第二阈值、且所述第二比值大于等于第三阈值;所述第一比值大于等于第四阈值、且所述第三比值大于等于第五阈值、且所述第二比值大于等于第六阈值。3.根据权利要求1所述的方法,其特征在于,在获取所述第一关键帧与所述第二关键帧中指纹相同的关键帧的数量之前,还包括:确定用于裁剪的黑边位置,其中,所述黑边位置用于指示关键帧中需要保留的目标区域;根据所述黑边位置对所述第一关键帧和所述第二关键帧中的每个关键帧进行裁剪,使得所述第一关键帧和所述第二关键帧中的每个关键帧仅保留所述目标区域中的图像信息;获取进行所述裁剪之后的所述第一关键帧的所述第一关键帧指纹集,和进行所述裁剪之后的所述第二关键帧的所述第二关键帧指纹集。4.根据权利要求3所述的方法,其特征在于,获取进行所述裁剪之后的所述第一关键帧的所述第一关键帧指纹集,和进行所述裁剪之后的所述第二关键帧的所述第二关键帧指纹集包括:对所述第一关键帧和所述第二关键帧中的每个关键帧执行以下步骤,得到每个关键帧的指纹,其中,每个关键帧在执行以下步骤时被记为当前关键帧,将所述第一关键帧中的每个关键帧的指纹组成所述第一关键帧指纹集,并将所述第二关键帧中的每个关键帧的指纹组成所述第二关键帧指纹集:将所述当前关键帧的图像转为灰度图;过所述灰度图的图像中心取N条直线,计算每条直线上的像素点的方差,得到1*N的一维特征向量,其中,N为大于1的自然数;对所述1*N的一维特征向量进行离散余弦变换,得到所述当前关键帧的指纹。5.根据权利要求4所述的方法,其特征在于,通过以下公式对所述1*N的一维特征向量进行离散余弦变换:F(u)=c(u)Σi=0N-1f(i)cos[(i+0.5)πNu]]]>c(u)=1N,u=02N,u≠0]]>其中,f(i)为所述1*N的一维特征向量,u为1*N的一维特征向量的频率,所述F(u)用于指示所述当前关键帧的指纹。6.根据权利要求1所述的方法,其特征在于,在获取所述第一视频文件的第一音频指纹序列和所述第二视频文件的第二音频指纹序列中相同的音频指纹序列之前,还包括:将所述第一视频文件的第一音频划分成部分重叠的多个第一音频段,将所述第二视频文件的第二音频划分成部分重叠的多个第二音频段;对所述多个第一音频段和所述多个第二音频段中的每个音频段执行以下步骤,得到每个音频段的音频指纹,其中,每个音频段在执行以下步骤时被记为当前音频段,将所述多个第一音频段中的每个音频段的音频指纹组成所述第一音频指纹序列,并将所述多个第二音频段中的每个音频段的音频指纹组成所述第二音频指纹序列:在所述当前音频段上做短时傅里叶变换,得到声谱图;将所述声谱图中预定频带范围内的频谱能量量化成1*M的特征向量,得到音符图,其中,M为大于1的自然数;对所述音符图进行滤波,得到所述当前音频段的音频指纹。7.根据权利要求1所述的方法,其特征在于,获取所述第一关键帧与所述第二关键帧中指纹相同的关键帧的数量包括:通过以下公式判断所述第一关键帧的指纹是否与所述第二关键帧的指纹相同:ρX,Y=cov(X,Y)σXσY=E((X-μX)(Y-μY))σXσY=E(XY)-E(X)E(Y)E(X2)-E2(X)E(Y2)-E2(Y)]]>其中,X用于指示所述第一关键帧的指纹,Y用于指示所述第二关键帧的指纹,ρX,Y为所述第一关键帧的指纹与所述第二关键帧的指纹之间的皮尔逊相关系数,在ρX,Y大于第七阈值时,判断出所述第一关键帧的指纹与所述第二关键帧的指纹相同。8.根据权利要求1所述的方法,其特征在于,获取所述第一视频文件的第一音频指纹序列和所述第二视频文件的第二音频指纹序列中相同的音频指纹序列包括:通过以下步骤查找所述第一音频指纹序列和所述第二音频指纹序列中相同的音频指纹,并将查找到的所有相同的音频指纹按照在所述第二音频指纹序列中的序号组成所述第三音频指纹序列,其中,所述第一音频指纹序列中的音频指纹在执行以下步骤时被记为第一音频指纹,所述第二音频指纹序列中的音频指纹在执行以下步骤时被记为第二音频指纹:按位依次比较第一数值和第二数值,其中,所述第一数值用于表示所述第一音频指纹,所述第二数值用于表示所述第二音频指纹,所述第一数值和所述第二数值均由P位数字表示;判断所述第一数值和所述第二数值中不相等的位的数量是否小于第八阈值;若小于所述第八阈...

【专利技术属性】
技术研发人员:胡丹万明月冯少伟
申请(专利权)人:腾讯科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1