The present invention provides a video similarity recognition method and device, the method includes: extracting time sequence characteristics of the first video files, second video files; for the first time sequences of video file features of time sequence and the second video files of the correlation calculation, if the correlation calculation results is higher than the preset threshold. The first second video files and video files are the same content of the video file, otherwise, determine the first video file and second video files are not the same content of video files. The invention can accurately identify two video files, such as code rate, resolution, frame rate and other indicators, but with slight difference or no difference in content.
【技术实现步骤摘要】
一种视频文件相似性识别方法和装置
本专利技术涉及视频处理
,特别涉及一种视频文件相似性识别方法和装置。
技术介绍
视频识别也是当前比较热门的领域。视频识别主要有两种方式,一种是对视频文件本身进行哈希计算,两个视频文件的哈希值一致则认为两个视频文件是同一个视频文件;另一种方式是对视频图像进行比较识别,视频图像一致则认为两个视频文件是同一个视频文件。哈希计算的方法比较方便快捷,但是对于文件内容的微小变化十分敏感,码率不同、帧率不同、画面有水标或字幕不同,都会使相同内容的两个视频文件的哈希值完全不同。而图像识别方法需要很大的运算量,识别过程比较漫长,只适用于某些特定的场景。
技术实现思路
有鉴于此,本专利技术的目的在于一种视频文件相似性识别方法和装置,能够以较小的运算量,准确识别出码率、帧率、分辨率等指标不同,但内容有微小差别或无差别的两个视频文件。为了达到上述目的,本专利技术提供了如下技术方案:一种视频文件相似性识别方法,该方法包括:分别提取第一视频文件、第二视频文件的时间特征序列;对第一视频文件的时间特征序列和第二视频文件的时间特征序列进行相关性计算,如果相关性计算结果高于预设阈值,则确定第一视频文件和第二视频文件是同一内容的视频文件,否则,确定第一视频文件和第二视频文件不是同一内容的视频文件。一种视频文件相似性识别装置,该装置包括:提取单元、识别单元;所述提取单元,用于分别提取第一视频文件、第二视频文件的时间特征序列;所述识别单元,用于对第一视频文件的时间特征序列和第二视频文件的时间特征序列进行相关性计算,如果相关性计算结果高于预设阈值,则确定第一视频文 ...
【技术保护点】
一种视频文件相似性识别方法,其特征在于,该方法包括:分别提取第一视频文件、第二视频文件的时间特征序列;对第一视频文件的时间特征序列和第二视频文件的时间特征序列进行相关性计算,如果相关性计算结果高于预设阈值,则确定第一视频文件和第二视频文件是同一内容的视频文件,否则,确定第一视频文件和第二视频文件不是同一内容的视频文件。
【技术特征摘要】
1.一种视频文件相似性识别方法,其特征在于,该方法包括:分别提取第一视频文件、第二视频文件的时间特征序列;对第一视频文件的时间特征序列和第二视频文件的时间特征序列进行相关性计算,如果相关性计算结果高于预设阈值,则确定第一视频文件和第二视频文件是同一内容的视频文件,否则,确定第一视频文件和第二视频文件不是同一内容的视频文件。2.根据权利要求1所述的方法,其特征在于,执行分别提取第一视频文件、第二视频文件的时间特征序列的操作之前,进一步包括:分别提取第一视频文件、第二视频文件的播放总时长,并计算第一视频文件的播放总时长与第二视频文件的播放总时长之间的差值,如果差值的绝对值小于第二预设时长,则继续执行分别提取第一视频文件、第二视频文件的时间特征序列的操作,否则,确定第一视频文件和第二视频文件不是同一内容的视频文件,并停止本次相似性识别过程。3.根据权利要求1所述的方法,其特征在于,提取第一视频文件的时间特征序列的方法为:提取第一视频文件从播放起始位置开始第一预设时长内的视频内容中的所有基础帧信息,将提取的第一视频文件的所有基础帧信息按照预设规则排列后作为第一视频文件的时间特征序列;提取第二视频文件的时间特征序列的方法为:提取第二视频文件从播放起始位置开始第一预设时长内的视频内容中的所有基础帧信息,将提取的第二视频文件的所有基础帧信息按照预设规则排列后作为第二视频文件的时间特征序列。4.根据权利要求1所述的方法,其特征在于,所述基础帧信息包括基础帧的播放序号、基础帧包括的总数据字节数、基础帧播放的相对起始时间;将提取的第一视频文件的所有基础帧信息按照预设规则排列的方法为:将提取的第一视频文件的所有基础帧信息按照播放序号从小到大的顺序排列,或者,将提取的第一视频文件的所有基础帧信息按照播放的相对起始时间从小到大的顺序排序;将提取的第二视频文件的所有基础帧信息按照预设规则排列的方法为:将提取的第二视频文件的所有基础帧信息按照播放序号从小到大的顺序排列,或者,将提取的第二视频文件的所有基础帧信息按照播放的相对起始时间从小到大的顺序排序。5.根据权利要求1-4任一权项所述的方法,其特征在于,所述第一视频文件为采用H.264或MPEG4编码方式的视频文件;所述第二视频文件为采用H.264或MPEG4编码方式的视频文件。6.一种视频文件相似性识别装置,其特征在于,该装置包括:提取单...
【专利技术属性】
技术研发人员:刘述,夏勇,段世惠,田辉,高巍,
申请(专利权)人:工业和信息化部电信研究院,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。