一种以图搜视频的方法技术

技术编号:23787401 阅读:67 留言:0更新日期:2020-04-15 00:39
本发明专利技术涉及视频搜素技术领域,具体地说,涉及一种以图搜视频的方法。包括创建数据索引阶段和搜索视频阶段,创建数据索引阶段包如下步骤:读取视频帧图片;计算图片帧的数字指纹;将指纹按16位为一段位分成多段;循环遍历所有分段,将指纹放入分段对应的索引目录下;指纹数据追加到索引文件中;搜索视频阶段包括如下步骤:读取待搜索视频截图数据;计算截图指纹;循环获得不同指纹分段下数据索引;通过数据索引搜索到指纹;通过搜索到的指纹获得视频信息以及对应的帧。该以图搜视频的方法中,通过帧图像指纹的分段,来有效缩小搜索范围,提升搜索速度,同时通过多节点的分布式处理的方式,快速定位到最终结果。

A method of searching video by image

【技术实现步骤摘要】
一种以图搜视频的方法
本专利技术涉及视频搜素
,具体地说,涉及一种以图搜视频的方法。
技术介绍
以图搜视频的技术包括经典的模式识别、深度学习领域相关技术,其原理是通过经典的模式识别技术和深度学习技术的融合,达到海量视频搜索在精准度、速度上的最佳组合。但目前以图搜视频,计算速度慢,每次计算需要数分钟甚至数小时的计算时间,在此期间用户不能操作软件,只有等待计算完成;同时,不能充分利用现代CPU的多核心特性,无论用户的电脑有多少个处理核心,都只能利用其中一个,资源利用率低,而且,耗费计算资源,特别是深度学习技术需要专用的GPU资源来加速学习过程;扩展性不足,模式识别和深度学习等技术需要预先准备好海量的训练数据,且训练结果适应性较差,和样本的选取有比较强的关联,只能适用于有限类型的场景。
技术实现思路
本专利技术的目的在于提供一种以图搜视频的方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供一种以图搜视频的方法,包括创建数据索引阶段和搜索视频阶段,所述创建数据索引阶段包如下步骤:S1.1、读取视频帧图片;S1.2、计算图片帧的数字指纹;S1.3、将指纹按16位为一段位分成多段;S1.4、循环遍历所有分段,将指纹放入分段对应的索引目录下;S1.5、指纹数据追加到索引文件中;所述搜索视频阶段包括如下步骤:S2.1、读取待搜索视频截图数据;S2.2、计算截图指纹;S2.3、循环获得不同指纹分段下数据索引;r>S2.4、通过数据索引搜索到指纹;S2.5、通过搜索到的指纹获得视频信息以及对应的帧。作为优选,所述S1.1中,读取视频帧图片的方法为:将视频,音频压缩编码数据,还原成非压缩的视频,经过解码,得到非压缩的视频颜色数据。作为优选,所述S1.2中,计算图片帧的数字指纹的方法为:通过感知Hash算法,先对原图片进行灰度计算,在通过缩小图片为8x8像素后,将64位的二进制数据保存到数组,作为64位的图片指纹。作为优选,所述S1.4中,指纹放入分段对应的索引目录的方法为:在文件系统中建立四个目录,对应指纹分为4段后对应的序号,序号值表示为1、2、3、4,在每个序号下建立2^16=65536个hash目录,分别用1~65535表示,每个目录下建立10个文件,文件中存放完整的64位Hash值。作为优选,所述S1.4中,循环遍历所有分段的方法为:通过“/分段数/当前段Hash目录/Hash文件”唯一确定的写入路径,将完整的64位Hash值存入文件中。作为优选,所述S2.2中,计算截图指纹的方法为:使用感知Hash算法获得数字指纹。作为优选,所述S2.3中,循环获得不同指纹分段下数据索引的方法为:将指纹分段,分为4段后,从第一段开始,进行分段索引。作为优选,所述S2.4中,通过数据索引搜索到指纹的方法为:读取目录“段数\当前段Hash值\”下的所有文件,遍历整个文件内容,并计算汉明距离,返回汉明距离最小的指纹。作为优选,所述S2.5中,通过搜索到的指纹获得视频信息以及对应的帧的方法为:识别到指纹后,查询数据库即可获得视频和视频的第几帧。作为优选,所述分段索引方法为:将4个分段中当前段相同的指纹存储到段数对应的目录下,并将当前段相同的指纹存储到分段对应的文件中。与现有技术相比,本专利技术的有益效果:该以图搜视频的方法中,通过帧图像指纹的分段,来有效缩小搜索范围,提升搜索速度,同时通过多节点的分布式处理的方式,快速定位到最终结果,可以,快速、精准的搜索到目标帧以及具体视频和所在帧数。附图说明图1为本专利技术的帧图像指纹分段原理图;图2为本专利技术的多节点实时搜索的流程图;图3为本专利技术的视频帧指纹计算和分段原理图;图4为本专利技术的结视频帧指纹分段存储格式图;图5为本专利技术的以图搜视频的搜索过程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1-图5所示,本专利技术提供一种技术方案:本专利技术提供一种以图搜视频的方法,包括创建数据索引阶段和搜索视频阶段,创建数据索引阶段包如下步骤:S1.1、读取视频帧图片;S1.2、计算图片帧的数字指纹;S1.3、将指纹按16位为一段位分成多段;S1.4、循环遍历所有分段,将指纹放入分段对应的索引目录下;S1.5、指纹数据追加到索引文件中;搜索视频阶段包括如下步骤:S2.1、读取待搜索视频截图数据;S2.2、计算截图指纹;S2.3、循环获得不同指纹分段下数据索引;S2.4、通过数据索引搜索到指纹;S2.5、通过搜索到的指纹获得视频信息以及对应的帧。本实施例中,S1.1中,读取视频帧图片的方法为:将视频,音频压缩编码数据,还原成非压缩的视频,音频原始数据,音频的压缩编码标准包括AAC,MP3,AC-3等,视频压缩编码标准包含H.264,MPEG2,VC-1等,经过解码,得到非压缩的视频颜色数据如YUV420P,RGB和非压缩的音频数据如PCM等。进一步的,S1.2中,计算图片帧的数字指纹的方法为:通过感知Hash算法,先对原图片进行灰度计算,在通过缩小图片为8x8像素后,将64位的二进制数据保存到数组,作为64位的图片指纹。具体的,S1.3中,指纹按16位为一段位分成多段的方法为:由于需要搜索的视频帧和用于搜索的图片内容相同或者大部分相同(忽略水印,台标等情况),假设图片指纹中最大容错3位不同,那么指纹以16位为一段,分为4段。其中,S1.4中,指纹放入分段对应的索引目录的方法为:在文件系统中建立四个目录,对应指纹分为4段后对应的序号,序号值表示为1、2、3、4,在每个序号下建立2^16=65536个hash目录,分别用1~65535表示,每个目录下建立10个文件,文件中存放完整的64位Hash值,估算:假设有80万部1小时的视频,那么一共会产生720亿左右个帧,每个hash目录需要存放720亿/65535≈120万个指纹,每个文件存放120万/10=12万个hash值。除此之外,S1.4中,循环遍历所有分段的方法为:通过“/分段数/当前段Hash目录/Hash文件”唯一确定的写入路径,将完整的64位Hash值存入文件中,具体为:首先,该方案假设需要搜索的视频帧和用于搜索的图片内容相同或者大部分相同(忽略水印,台标等情况),假设图片指纹中最大容错3位不同,也就是说如果将指纹切分为4段后总会有一段是相同的。因此,该方案会查找”分段数/当前段Hash目录/Hash文件”下所有的hash值,通过比较这些hash值中汉明距离最近的一本文档来自技高网...

【技术保护点】
1.一种以图搜视频的方法,包括创建数据索引阶段和搜索视频阶段,其特征在于:所述创建数据索引阶段包如下步骤:/nS1.1、读取视频帧图片;/nS1.2、计算图片帧的数字指纹;/nS1.3、将指纹按16位为一段位分成多段;/nS1.4、循环遍历所有分段,将指纹放入分段对应的索引目录下;/nS1.5、指纹数据追加到索引文件中;/n所述搜索视频阶段包括如下步骤:/nS2.1、读取待搜索视频截图数据;/nS2.2、计算截图指纹;/nS2.3、循环获得不同指纹分段下数据索引;/nS2.4、通过数据索引搜索到指纹;/nS2.5、通过搜索到的指纹获得视频信息以及对应的帧。/n

【技术特征摘要】
1.一种以图搜视频的方法,包括创建数据索引阶段和搜索视频阶段,其特征在于:所述创建数据索引阶段包如下步骤:
S1.1、读取视频帧图片;
S1.2、计算图片帧的数字指纹;
S1.3、将指纹按16位为一段位分成多段;
S1.4、循环遍历所有分段,将指纹放入分段对应的索引目录下;
S1.5、指纹数据追加到索引文件中;
所述搜索视频阶段包括如下步骤:
S2.1、读取待搜索视频截图数据;
S2.2、计算截图指纹;
S2.3、循环获得不同指纹分段下数据索引;
S2.4、通过数据索引搜索到指纹;
S2.5、通过搜索到的指纹获得视频信息以及对应的帧。


2.根据权利要求1所述的以图搜视频的方法,其特征在于:所述S1.1中,读取视频帧图片的方法为:将视频,音频压缩编码数据,还原成非压缩的视频,经过解码,得到非压缩的视频颜色数据。


3.根据权利要求1所述的以图搜视频的方法,其特征在于:所述S1.2中,计算图片帧的数字指纹的方法为:通过感知Hash算法,先对原图片进行灰度计算,在通过缩小图片为8x8像素后,将64位的二进制数据保存到数组,作为64位的图片指纹。


4.根据权利要求1所述的以图搜视频的方法,其特征在于:所述S1.4中,指纹放入分段对应的索引目录的方法为:在文件系统中建立四个目录,对应指纹分为4段后对应的序号,序号值表示为1、2、3、4,在每个序号下建立2^16=...

【专利技术属性】
技术研发人员:柴中进吴伟平
申请(专利权)人:新华智云科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1