一种基于帧密度的视频检索方法及计算机可读存储介质技术

技术编号:20655133 阅读:19 留言:0更新日期:2019-03-23 06:49
本发明专利技术提供了一种基于帧密度的视频检索方法及计算机可读存储介质,提取第一图像帧的第一CNN特征;提取第二图像帧的第二CNN特征;所述第一图像帧包括待检索视频帧中的每一帧图像;所述第二图像帧包括用于检索的视频帧库中的每一帧图像;把第一CNN特征和第二CNN特征进行余弦距离比较,找出第一图像帧中每一帧图像各自在第二图像帧中相似度最高的N个图像作为匹配结果;标出第一图像帧中每一帧图像的所述N个图像在所述视频帧库中的位置;对所述位置进行密度筛选,密度最高的位置作为检索结果。与现有技术相比,本发明专利技术视频定位过程具有更高的鲁棒性。

【技术实现步骤摘要】
一种基于帧密度的视频检索方法及计算机可读存储介质
本专利技术涉及视频检索领域,特别涉及一种基于帧密度的视频检索方法及计算机可读存储介质。
技术介绍
基于内容的视频检索作为计算机视觉领域的一个重要研究问题,在过去的十年里受到国内外学者的广泛关注。基于内容的视频检索是指从视频库中定位出与待检索短视频最匹配的位置。通过对待检索短视频的帧图像进行匹配,得出在视频库的匹配位置。
技术实现思路
本专利技术提供了一种基于帧密度的视频检索方法,具有鲁棒性更高的特点。本专利技术还提供了一种计算机可读存储介质,具有能够便于实施上述任何一种方法的特点。根据本专利技术提供的一种基于帧密度的视频检索方法,包括,提取第一图像帧的第一CNN特征;提取第二图像帧的第二CNN特征;所述第一图像帧包括待检索视频帧中的每一帧图像;所述第二图像帧包括用于检索的视频帧库中的每一帧图像;把第一CNN特征和第二CNN特征进行余弦距离比较,找出第一图像帧中每一帧图像各自在第二图像帧中相似度最高的N个图像作为匹配结果;所述N为大于0的自然数;标出第一图像帧中每一帧图像的所述N个图像在所述视频帧库中的位置;对所述位置进行密度筛选,密度最高的位置作为检索结果。所述N为大于等于2小于等于6的自然数。所述N等于5。所述方法还包括,抽取待检索视频的每一帧图像,从第一帧图像开始,去除与在前图像帧相比相似度高于设置的相似度阈值T1的图像帧,剩下的图像帧作为待检索视频帧组成所述第一图像帧。所述方法还包括,采用包括但不仅限于差异哈希算法DHash去除所述相似度高于设置的相似度阈值T1的图像帧。采用差异哈希算法DHash去除图像帧的具体方法包括,缩小图片:将图片缩小到M*K大小,其中M和K均为大于2的自然数;灰度图转化:将缩小后的图片转化为灰度图;计算差异值:DHash算法工作在相邻像素之间,这样每行M个像素之间产生了M-1个不同的差异,一共K行,则产生了(M-1)*K个差异值;获得指纹:如果第一方向上的像素的灰度值比第二方向上的像素的灰度值高,则记为1,否则为0;对比指纹:计算两幅图片的汉明距离,汉明距离越大则说明图片越不一致,反之,汉明距离越小则说明图片越相似,当距离为0时,说明完全相同。所述相似度阈值T1大于等于60%小于等于100%。所述相似度阈值T1等于80%。所述方法还包括,按照设置的帧抽取间隔阈值T2抽取用于检索的视频的帧图像,组成用于检索的视频帧库。所述帧抽取间隔阈值T2大于等于1小于等于6。所述帧抽取间隔阈值T2等于2。根据本专利技术提供的一种计算机可读存储介质,存储有便于处理器加载并执行上述任意一种的方法的计算机程序。与现有技术相比,本专利技术视频定位过程具有更高的鲁棒性。附图说明图1为本专利技术其中一实施例的检索结果示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。本说明书(包括摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或者具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。本专利技术还提供了一种计算机可读存储介质,具有能够便于实施上述任何一种方法的特点。根据本专利技术提供的一种基于帧密度的视频检索方法,包括,提取第一图像帧的第一CNN特征;提取第二图像帧的第二CNN特征;所述第一图像帧包括待检索视频帧中的每一帧图像;所述第二图像帧包括用于检索的视频帧库中的每一帧图像;把第一CNN特征和第二CNN特征进行余弦距离比较,找出第一图像帧中每一帧图像各自在第二图像帧中相似度最高的N个图像作为匹配结果;所述N为大于0的自然数;标出第一图像帧中每一帧图像的所述N个图像在所述视频帧库中的位置;对所述位置进行密度筛选,密度最高的位置作为检索结果。本专利技术用待检索视频的帧匹配用于检索的视频库的帧;找出待检索视频帧中每一帧所对应的相似度最高的N个图像在所述视频帧库中的对应的时间序列并进行标示;所述N个图像可能分布在所述视频帧库的不同时间序列上。在所述视频帧库中得到的位置标记中,找出位置标记最密集位置(作为本专利技术的一种实施例,如图1所示中圈出的位置),即为和待检索视频相匹配的时间片段,以此来完成视频检索。本专利技术通过对匹配位置进行密度筛选,匹配结果最集中的区域就是待检索视频所在的时间片段。其中,在特征提取过程中采用CNN方法,在帧匹配的过程中采用余弦距离的度量方法。考虑到待检索视频帧中个每一帧信息,最大化突出视频的特征,使最终进行视频时间段定位过程中具有更高的鲁棒性。作为本专利技术的实施方式,作为比较适合的选择,所述N为大于等于2小于等于6的自然数,可以根据实际需求进行设置N的值。作为本专利技术的一种实施方式,所述N等于5,即找出第一图像帧中每一帧图像各自在第二图像帧中相似度最高的5个图像作为匹配结果。作为本专利技术的一种具体实施方式,所述方法还包括,抽取待检索视频的每一帧图像,从第一帧图像开始,去除与在前图像帧相比相似度高于设置的相似度阈值T1的图像帧,剩下的图像帧作为待检索视频帧组成所述第一图像帧。在本专利技术方案中,采用相似度比较去除待检索视频中的大量冗余帧,在保证鲁棒性的基础上,提高了帧匹配的效率。作为本专利技术的实施方式,所述方法还包括,采用包括但不仅限于差异哈希算法DHash去除所述相似度高于设置的相似度阈值T1的图像帧。作为本专利技术的一种实施方式,采用差异哈希算法DHash去除图像帧的具体方法包括,缩小图片:将图片缩小到M*K大小,其中M和K均为大于2的自然数;灰度图转化:将缩小后的图片转化为灰度图;计算差异值:DHash算法工作在相邻像素之间,这样每行M个像素之间产生了M-1个不同的差异,一共K行,则产生了(M-1)*K个差异值;获得指纹:如果第一方向上的像素的灰度值比第二方向上的像素的灰度值高,则记为1,否则为0;对比指纹:计算两幅图片的汉明距离,汉明距离越大则说明图片越不一致,反之,汉明距离越小则说明图片越相似,当距离为0时,说明完全相同。作为本专利技术的一种实施方式,将图片缩小到9*8大小,共72个像素点;将缩小后的图片转化为256阶的灰度图;计算差异值时,每行9个像素之间产生了8个不同的差异,一共8行,则产生了64个差异值。作为本专利技术的一种实施方式,如果左边的像素的灰度值比右边的像素的灰度值高,则记为1,否则为0。计算两幅图片的汉明距离,汉明距离越大则说明图片越不一致,反之,汉明距离越小则说明图片越相似,当距离为0时,说明完全相同。通常认为距离>10,就是两张完全不同的图片。作为本专利技术的实施方式,所述相似度阈值T1大于等于60%小于等于100%,可以根据实际需求设置T1的值。作为本专利技术的一种实施方式,所述相似度阈值T1等于80%。作为本专利技术的一种实施方式,所述方法还包括,按照设置的帧抽取间隔阈值T2抽取用于检索的视频的帧图像,组成用于检索的视频帧库。因为用于检索的视频的相邻帧之间相似度很高,如果挨个提取视频的帧会造成很大的数据冗余,所以采取隔几帧提取一张图片的方式,遍历整个视频,将抽取的帧组成的视频帧库作为用于检索的视频帧库,在保证鲁棒性的基础上,减小了数据冗余,提高了帧匹配的效率。作为本专利技术的本文档来自技高网...

【技术保护点】
1.一种基于帧密度的视频检索方法,包括,提取第一图像帧的第一CNN特征;提取第二图像帧的第二CNN特征;所述第一图像帧包括待检索视频帧中的每一帧图像;所述第二图像帧包括用于检索的视频帧库中的每一帧图像;把第一CNN特征和第二CNN特征进行余弦距离比较,找出第一图像帧中每一帧图像各自在第二图像帧中相似度最高的N个图像作为匹配结果;所述N为大于0的自然数;标出第一图像帧中每一帧图像的所述N个图像在所述视频帧库中的位置;对所述位置进行密度筛选,密度最高的位置作为检索结果。

【技术特征摘要】
1.一种基于帧密度的视频检索方法,包括,提取第一图像帧的第一CNN特征;提取第二图像帧的第二CNN特征;所述第一图像帧包括待检索视频帧中的每一帧图像;所述第二图像帧包括用于检索的视频帧库中的每一帧图像;把第一CNN特征和第二CNN特征进行余弦距离比较,找出第一图像帧中每一帧图像各自在第二图像帧中相似度最高的N个图像作为匹配结果;所述N为大于0的自然数;标出第一图像帧中每一帧图像的所述N个图像在所述视频帧库中的位置;对所述位置进行密度筛选,密度最高的位置作为检索结果。2.根据权利要求1所述的视频检索方法,所述N为大于等于2小于等于6的自然数。3.根据权利要求2所述的视频检索方法,所述N等于5。4.根据权利要求1所述的视频检索方法,所述方法还包括,抽取待检索视频的每一帧图像,从第一帧图像开始,去除与在前图像帧相比相似度高于设置的相似度阈值T1的图像帧,剩下的图像帧作为待检索视频帧组成所述第一图像帧。5.根据权利要求4所述的视频检索方法,所述方法还包括,采用包括但不仅限于差异哈希算法DHash去除所述相似度高于设置的相似度阈值T1的图像帧。6.根据权...

【专利技术属性】
技术研发人员:管永来张默
申请(专利权)人:北京陌上花科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1