【技术实现步骤摘要】
本专利技术涉及计算机领域,具体而言,涉及一种相似视频文件的检测方法和装置。
技术介绍
目前,视频相似度检测被广泛应用于盗版视频监控领域,相关技术中的视频相似度检测方法主要是基于视频关键帧指纹匹配,如图1所示,相关技术中的视频相似度检测方法主要分为以下两步:1)分别获取视频a和视频b的关键帧指纹特征:分别提取正版视频(假设为视频a)与疑似盗版视频(假设为视频b)的关键帧,并计算关键帧的颜色分布直方图,然后将直方图转化成固定长度的0/1序列,即单帧关键帧的指纹特征。2)将两个视频关键帧的指纹序列进行比对,计算两个指纹序列中重叠的指纹个数,得到视频a和视频b之间的相似度。上述视频相似度检测方法对视频相似度的检测准确度较低,存在以下缺陷:1、即使相同的视频在不同编码格式下,提取到的关键帧也不完全相同,仅靠关键帧指纹并不能准确计算视频的相似度。2、直方图只是图像中颜色的全局分布的描述,无法描述颜色的局部分布和色彩所处的位置。因此,内容不同的图像其直方图也很有可能相同,导致不同内容的关键帧的指纹相同。3、相比于正版视频,受录制条件等因素影响,盗版视频可能会存在额外的黑色边,表现为:画面缩小,视频上下左右都有几厘米宽的黑边。关键指纹因此而改变,相同的视频也无法识别出来。4、盗版视频中可能插播了广告,受此影响,关键帧指纹匹配算法准确率会进一步下降。受上面几点因素的影响,相关技术中的视频相似度检测方法并不能准确计算两视频的相似度,极有可能产生错判。因此,相关技术方案并不能作为一种可信赖的方案应用于全自动化盗版视频监控。针对上述的问题,目前尚未提出有效的解决方案。专利技术内 ...
【技术保护点】
一种相似视频文件的检测方法,其特征在于,包括:根据第一视频文件的第一关键帧的第一关键帧指纹集与第二视频文件的第二关键帧的第二关键帧指纹集,获取所述第一关键帧与所述第二关键帧中指纹相同的关键帧的数量,其中,将所述指纹相同的关键帧的数量与所述第二关键帧的数量的比值记为第一比值;获取所述第一视频文件的第一音频指纹序列和所述第二视频文件的第二音频指纹序列中相同的音频指纹序列,记为第三音频指纹序列,其中,将所述第三音频指纹序列中音频指纹序号的范围与所述第二音频指纹序列中的音频指纹的数量的比值记为第二比值,将所述第三音频指纹序列中的音频指纹的数量与所述第三音频指纹序列中音频指纹序号的范围的比值记为第三比值;根据所述第一比值、所述第二比值和所述第三比值中的至少一个判断所述第一视频文件与所述第二视频文件是否为相似视频文件。
【技术特征摘要】
1.一种相似视频文件的检测方法,其特征在于,包括:根据第一视频文件的第一关键帧的第一关键帧指纹集与第二视频文件的第二关键帧的第二关键帧指纹集,获取所述第一关键帧与所述第二关键帧中指纹相同的关键帧的数量,其中,将所述指纹相同的关键帧的数量与所述第二关键帧的数量的比值记为第一比值;获取所述第一视频文件的第一音频指纹序列和所述第二视频文件的第二音频指纹序列中相同的音频指纹序列,记为第三音频指纹序列,其中,将所述第三音频指纹序列中音频指纹序号的范围与所述第二音频指纹序列中的音频指纹的数量的比值记为第二比值,将所述第三音频指纹序列中的音频指纹的数量与所述第三音频指纹序列中音频指纹序号的范围的比值记为第三比值;根据所述第一比值、所述第二比值和所述第三比值中的至少一个判断所述第一视频文件与所述第二视频文件是否为相似视频文件。2.根据权利要求1所述的方法,其特征在于,根据所述第一比值、所述第二比值和所述第三比值中的至少一个判断所述第一视频文件与所述第二视频文件是否为相似视频文件包括:判断是否满足以下条件之一,若满足,则判断出所述第一视频文件与所述第二视频文件为相似视频文件:所述第一比值大于等于第一阈值;所述第三比值大于等于第二阈值、且所述第二比值大于等于第三阈值;所述第一比值大于等于第四阈值、且所述第三比值大于等于第五阈值、且所述第二比值大于等于第六阈值。3.根据权利要求1所述的方法,其特征在于,在获取所述第一关键帧与所述第二关键帧中指纹相同的关键帧的数量之前,还包括:确定用于裁剪的黑边位置,其中,所述黑边位置用于指示关键帧中需要保留的目标区域;根据所述黑边位置对所述第一关键帧和所述第二关键帧中的每个关键帧进行裁剪,使得所述第一关键帧和所述第二关键帧中的每个关键帧仅保留所述目标区域中的图像信息;获取进行所述裁剪之后的所述第一关键帧的所述第一关键帧指纹集,和进行所述裁剪之后的所述第二关键帧的所述第二关键帧指纹集。4.根据权利要求3所述的方法,其特征在于,获取进行所述裁剪之后的所述第一关键帧的所述第一关键帧指纹集,和进行所述裁剪之后的所述第二关键帧的所述第二关键帧指纹集包括:对所述第一关键帧和所述第二关键帧中的每个关键帧执行以下步骤,得到每个关键帧的指纹,其中,每个关键帧在执行以下步骤时被记为当前关键帧,将所述第一关键帧中的每个关键帧的指纹组成所述第一关键帧指纹集,并将所述第二关键帧中的每个关键帧的指纹组成所述第二关键帧指纹集:将所述当前关键帧的图像转为灰度图;过所述灰度图的图像中心取N条直线,计算每条直线上的像素点的方差,得到1*N的一维特征向量,其中,N为大于1的自然数;对所述1*N的一维特征向量进行离散余弦变换,得到所述当前关键帧的指纹。5.根据权利要求4所述的方法,其特征在于,通过以下公式对所述1*N的一维特征向量进行离散余弦变换:F(u)=c(u)Σi=0N-1f(i)cos[(i+0.5)πNu]]]>c(u)=1N,u=02N,u≠0]]>其中,f(i)为所述1*N的一维特征向量,u为1*N的一维特征向量的频率,所述F(u)用于指示所述当前关键帧的指纹。6.根据权利要求1所述的方法,其特征在于,在获取所述第一视频文件的第一音频指纹序列和所述第二视频文件的第二音频指纹序列中相同的音频指纹序列之前,还包括:将所述第一视频文件的第一音频划分成部分重叠的多个第一音频段,将所述第二视频文件的第二音频划分成部分重叠的多个第二音频段;对所述多个第一音频段和所述多个第二音频段中的每个音频段执行以下步骤,得到每个音频段的音频指纹,其中,每个音频段在执行以下步骤时被记为当前音频段,将所述多个第一音频段中的每个音频段的音频指纹组成所述第一音频指纹序列,并将所述多个第二音频段中的每个音频段的音频指纹组成所述第二音频指纹序列:在所述当前音频段上做短时傅里叶变换,得到声谱图;将所述声谱图中预定频带范围内的频谱能量量化成1*M的特征向量,得到音符图,其中,M为大于1的自然数;对所述音符图进行滤波,得到所述当前音频段的音频指纹。7.根据权利要求1所述的方法,其特征在于,获取所述第一关键帧与所述第二关键帧中指纹相同的关键帧的数量包括:通过以下公式判断所述第一关键帧的指纹是否与所述第二关键帧的指纹相同:ρX,Y=cov(X,Y)σXσY=E((X-μX)(Y-μY))σXσY=E(XY)-E(X)E(Y)E(X2)-E2(X)E(Y2)-E2(Y)]]>其中,X用于指示所述第一关键帧的指纹,Y用于指示所述第二关键帧的指纹,ρX,Y为所述第一关键帧的指纹与所述第二关键帧的指纹之间的皮尔逊相关系数,在ρX,Y大于第七阈值时,判断出所述第一关键帧的指纹与所述第二关键帧的指纹相同。8.根据权利要求1所述的方法,其特征在于,获取所述第一视频文件的第一音频指纹序列和所述第二视频文件的第二音频指纹序列中相同的音频指纹序列包括:通过以下步骤查找所述第一音频指纹序列和所述第二音频指纹序列中相同的音频指纹,并将查找到的所有相同的音频指纹按照在所述第二音频指纹序列中的序号组成所述第三音频指纹序列,其中,所述第一音频指纹序列中的音频指纹在执行以下步骤时被记为第一音频指纹,所述第二音频指纹序列中的音频指纹在执行以下步骤时被记为第二音频指纹:按位依次比较第一数值和第二数值,其中,所述第一数值用于表示所述第一音频指纹,所述第二数值用于表示所述第二音频指纹,所述第一数值和所述第二数值均由P位数字表示;判断所述第一数值和所述第二数值中不相等的位的数量是否小于第八阈值;若小于所述第八阈...
【专利技术属性】
技术研发人员:胡丹,万明月,冯少伟,
申请(专利权)人:腾讯科技北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。