实现海量视频快速检索的方法技术

技术编号:10445027 阅读:199 留言:0更新日期:2014-09-17 20:32
本发明专利技术涉及一种实现海量视频快速检索的方法,其中包括对视频库的视频流中各帧视频图像分别提取空间特征向量得到视频特征序列;在空间特征向量中提取关键特征向量;根据视频库中所有视频文件的关键特征向量建立分布式存储索引库;提取待检索视频的关键特征向量集并提取该待检索视频的视频索引文件;根据待检索视频的视频索引文件在分布式存储索引库中进行视频相似度检索并输出相似度大于系统预设值的视频检索结果。采用该种结构的实现海量视频快速检索的方法,采用代表性的视觉单词代替关键帧,完整地代表了视频信息,既无大量冗余,又十分紧凑,加快检索速度,具有海量数据并发处理能力,具有更广泛的应用范围。

【技术实现步骤摘要】

本专利技术涉及多媒体信息
,尤其涉及多媒体信息检索、数据挖掘和视频处理领域,具体是指一种实现海量视频快速检索的方法。 
技术介绍
随着多媒体信息技术飞速发展,视频分享网站的出现,互联网视频数量迅速增长,且成几何级数上升。通过网络发布、分享和检索视频成为了人们的一种生活方式。面对海量的多媒体数据,如何快速的检索到相同或相似的视频成为了当前业界和学术界研究的热点。 传统的基于关键帧的视频检索方法主要倾向于视频检索的准确性,但计算复杂度极高,要花费若干分钟才能完成一次检索任务。面对海量的网路视频,传统的视频比对技术已不能胜任。当前面向互联网的视频检索技术,借鉴了传统文本搜索引擎的核心思想,把视频特征看作视频单词(visual word),构建视频文件的倒排索引,实现对海量视频文件的快速索引。 成功的匹配有赖于检索视频和参考视频自身信息的丰富程度和自身信息被表达、描述的程度。面向互联网视频检索方法在提取关键帧的时候,往往不是按照传统的方法,先进行镜头切分,再提取镜头关键帧,因为提取关键帧的位置会受到视频帧率、分辨率等因素的影响,关键帧不能稳定、可靠的提取。更为简单可行方法是对视频每隔1秒做一次采样,作为关键帧。其实相当于增加了采样的频率,采样频率越高,原有信息表达的越充分,但计算量就会越大。通过增加采样频率来增加信息表达的程度,这样会导致,既有信息被过度表达产生冗余,又有信息没有被充分表达,导致信息丢失。而线性采样会使丢失的信息具有随机性,因为视频信息并不是线性表达的。随机丢失的信息会降低检索的准确性和稳定性。另外一方面,传统的关键帧提取方法,一般信息变化较小的地方提取较少的关键帧,在视频帧变过较大的地方提取较多的关键帧,会产生比较紧致而较完整的表达信息,其程度取决于聚类或分割的阈值。检索视频和参考视频往往会受到各种噪声干扰,比如视频分辨率变差,网络丢包,视频丢帧,低帧率,视频插入,视频编辑等,会使原有的视频信息混有噪声,或导致部分信息丢失而不再完整。传统的视频关键帧提取方法过于理想化,a)未考虑外界干扰的复杂性,适当冗余度是必要的,b)其用于提取关键帧的特征并未针对海量检索任务而构建,相关的方法 并不合适直接用来提取关键帧。如何选择恰当的检索特征,使得构建的关键帧序列的帧数量最少,视频镜头信息表达的相对完整而又有适当冗余,成为了面向海量数据检索技术丞待解决的关键问题。 
技术实现思路
本专利技术的目的是克服了上述现有技术的缺点,提供了一种能够实现采用代表性的视觉单词代替关键帧、既无大量冗余、又十分紧凑、加快检索速度、具有海量数据并发处理能力、具有更广泛应用范围的实现海量视频快速检索的方法。 为了实现上述目的,本专利技术的实现海量视频快速检索的方法具有如下构成: 该实现海量视频快速检索的方法,其主要特点是,所述的方法包括以下步骤: (1)对视频库的视频流中各帧视频图像分别提取空间特征向量得到视频特征序列; (2)在所述的视频特征序列的空间特征向量中提取关键特征向量; (3)根据视频库中所有视频文件的关键特征向量建立所有视频文件的分布式存储索引库; (4)提取待检索视频的关键特征向量集并提取该待检索视频的视频索引文件; (5)根据所述的待检索视频的视频索引文件在所述的分布式存储索引库中进行视频相似度检索并输出相似度大于系统预设值的视频检索结果。 较佳地,所述的空间特征向量包括所对应帧图像的灰度空间分布特征和纹理空间分布特征,所述的对视频库的视频流中各帧视频图像分别提取空间特征向量,包括以下步骤: (11)计算得到视频库的视频流中各帧视频图像的灰度图像和边缘纹理图像; (12)计算各帧视频图像的灰度图像的中心空间特征和边界空间特征并得到由所述的中心空间特征和边界空间特征构成的该帧视频图像的灰度空间分布特征; (13)计算各帧视频图像的边缘纹理图像的纹理空间分布特征。 更佳地,所述的计算得到视频库的视频流中各帧视频图像的灰度图像和边缘纹理图像,包括以下步骤: (111)将视频库的视频流中的各帧视频图像划分成数个同样大小的子图像并计算各个子图像的灰度值和纹理边缘点数目; (112)计算各帧视频图像的各个子图像的灰度值得到该帧视频图像的灰度图像; (113)计算各帧视频图像的各个子图像的纹理边缘点数目得到该帧视频图像的边缘纹理图像。 更佳地,所述的计算各帧视频图像的灰度图像的中心空间特征和边界空间特征,具体为: 计算各帧视频图像的灰度图像的局部二值模式的中心空间特征和边界空间特征; 所述的计算各帧视频图像的边缘纹理图像的纹理空间分布特征,具体为: 计算各帧视频图像的边缘纹理图像的局部二值模式的纹理空间分布特征。 更佳地,所述的空间特征向量还包括颜色直方图特征,所述的对视频库的视频流中各帧视频图像分别提取空间特征向量,还包括以下步骤: (14)计算各帧视频图像的颜色直方图特征。 较佳地,所述的在所述的视频特征序列的空间特征向量中提取关键特征向量,包括以下步骤: (21)将所述的视频特征序列的第一个空间特征向量默认为关键特征向量; (22)计算各个空间特征向量与前一关键特征向量的马氏距离; (23)将大于系统预设阈值的马氏距离所对应的空间特征向量提取为关键特征向量。 较佳地,所述的根据视频库中所有视频文件的关键特征向量建立所有视频文件的分布式存储索引库,包括以下步骤: (31)建立所述的视频特征序列中关键特征向量的子空间投影直方图并记录各个关键特征向量在所对应视频中出现的频次; (32)建立视频库的所有视频文件的倒排索引文件; (33)建立视频库的所有视频文件的分布式索引数据库。 更佳地,所述的建立视频特征序列中关键特征向量的子空间投影直方图,具体为: 将视频特征序列中关键特征向量投影到灰度子空间、纹理子空间和颜色子空间中并获得各个关键特征向量的子空间投影直方图。 更进一步地,所述的记录各个关键特征向量在所对应视频中出现的频次,具体为: 记录各个关键特征向量所对应的子空间投影直方图中表示该关键特征向量在视频中出现频次的特征值。 更进一步地,所述的建立视频库的所有视频文件的倒排索引文件,包括以下步骤: (321)统计视频库中各个视频文件所对应的关键特征向量集合并构成该视频库的统计关键特征向量库; (322)建立所述的统计关键特征向量库中的各个关键特征向量对应的拥有该关键特征向量的文档集合; (323)将关键特征向量集合的文档按照所含关键特征向量的数量从多到少进行排序; (324)根据各个子空间建立视频库的所有视频文件的倒排索引文件。 再进一步地,所述的建立视频库的所有视频文件的分布式索引数据库,包括以下步骤: (331)利用基于p-stable的局部敏感哈希算法将各个子空间的关键特征向量映射到一维空间; (332)基于Hadoop分布式文件系本文档来自技高网
...

【技术保护点】
一种实现海量视频快速检索的方法,其特征在于,所述的方法包括以下步骤:(1)对视频库的视频流中各帧视频图像分别提取空间特征向量得到视频特征序列;(2)在所述的视频特征序列的空间特征向量中提取关键特征向量;(3)根据视频库中所有视频文件的关键特征向量建立所有视频文件的分布式存储索引库;(4)提取待检索视频的关键特征向量集并提取该待检索视频的视频索引文件;(5)根据所述的待检索视频的视频索引文件在所述的分布式存储索引库中进行视频相似度检索并输出相似度大于系统预设值的视频检索结果。

【技术特征摘要】
1.一种实现海量视频快速检索的方法,其特征在于,所述的方法包括以下步骤:
(1)对视频库的视频流中各帧视频图像分别提取空间特征向量得到视频特征序列;
(2)在所述的视频特征序列的空间特征向量中提取关键特征向量;
(3)根据视频库中所有视频文件的关键特征向量建立所有视频文件的分布式存储索引
库;
(4)提取待检索视频的关键特征向量集并提取该待检索视频的视频索引文件;
(5)根据所述的待检索视频的视频索引文件在所述的分布式存储索引库中进行视频相似
度检索并输出相似度大于系统预设值的视频检索结果。
2.根据权利要求1所述的实现海量视频快速检索的方法,其特征在于,所述的空间特征
向量包括所对应帧图像的灰度空间分布特征和纹理空间分布特征,所述的对视频库的视频流
中各帧视频图像分别提取空间特征向量,包括以下步骤:
(11)计算得到视频库的视频流中各帧视频图像的灰度图像和边缘纹理图像;
(12)计算各帧视频图像的灰度图像的中心空间特征和边界空间特征并得到由所述的中
心空间特征和边界空间特征构成的该帧视频图像的灰度空间分布特征;
(13)计算各帧视频图像的边缘纹理图像的纹理空间分布特征。
3.根据权利要求2所述的实现海量视频快速检索的方法,其特征在于,所述的计算得到
视频库的视频流中各帧视频图像的灰度图像和边缘纹理图像,包括以下步骤:
(111)将视频库的视频流中的各帧视频图像划分成数个同样大小的子图像并计算各个子
图像的灰度值和纹理边缘点数目;
(112)计算各帧视频图像的各个子图像的灰度值得到该帧视频图像的灰度图像;
(113)计算各帧视频图像的各个子图像的纹理边缘点数目得到该帧视频图像的边缘纹理
图像。
4.根据权利要求2所述的实现海量视频快速检索的方法,其特征在于,所述的计算各帧
视频图像的灰度图像的中心空间特征和边界空间特征,具体为:
计算各帧视频图像的灰度图像的局部二值模式的中心空间特征和边界空间特征;
所述的计算各帧视频图像的边缘纹理图像的纹理空间分布特征,具体为:
计算各帧视频图像的边缘纹理图像的局部二值模式的纹理空间分布特征。
5.根据权利要求2所述的实现海量视频快速检索的方法,其特征在于,所述的空间特征

\t向量还包括颜色直方图特征,所述的对视频库的视频流中各帧视频图像分别提取空间特征向
量,还包括以下步骤:
(14)计算各帧视频图像的颜色直方图特征。
6.根据权利要求1所述的实现海量视频快速检索的方法,其特征在于,所述的在所述的
视频特征序列的空间特征向量中提取关键特征向量,包括以下步骤:
(21)将所述的视频特征序列的第一个空间特征向量默认为关键特征向量;
(22)计算各个空间特征向量与前一关键特征向量的马氏距离;
(23)将大于系统预设阈值的马氏距离所对应的空间特征向量提取为关键特征向量。
7.根据权利要求1所述的实现海量视频快速检索的方法,其特征在于,所述的根据视频
库中所有视频文件的关键特征向量建立所有视频文...

【专利技术属性】
技术研发人员:逯利军钱培专董建磊张树民曹晶李克民高瑞
申请(专利权)人:上海美琦浦悦通讯科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1