一种视频动态基元库的构建方法技术

技术编号:14182711 阅读:91 留言:0更新日期:2016-12-14 12:06
本发明专利技术公开了一种视频动态基元库的构建方法。该方法包括以下步骤:步骤1:收集视频数据文件构成视频样本集;步骤2:对于视频样本集的每个视频数据文件,提取三维时空局部特征;步骤3:对于每个三维时空局部特征,使用线性动态系统作为所述三维时空局部特征的描述子;步骤4:计算所有三维时空局部特征两两之间的距离度量,构成一个距离度量矩阵;步骤5:对所述距离度量矩阵进行聚类,聚类中心作为所述视频样本集的动态基元库。本发明专利技术可以应用在互联网视频内容检索、敏感视频检测与过滤以及智能视频监控等业务中。

A method for constructing video dynamic primitive Library

The invention discloses a method for constructing a video dynamic primitive library. The method comprises the following steps: Step 1: collect video data files of video data sets; step 2: for each video data file video samples, extracting 3D spatio-temporal local features; step 3: for each 3D spatio-temporal local features, the use of a linear dynamic system as the three-dimensional space-time local feature descriptor; step 4: the calculation between all the temporal and spatial characteristics of 22 dimensional distance metric, constitute a distance matrix; step 5: to cluster the distance metric, the cluster center as the dynamic element library of video sample set. The invention can be applied to the Internet video content retrieval, sensitive video detection and filtering, and intelligent video monitoring.

【技术实现步骤摘要】

本专利技术涉及图像处理及计算机应用
,特别涉及一种视频动态基元库的构建方法
技术介绍
随着社会经济和科学技术的飞速发展,视频已被广泛地应用于各种场所,例如,在银行、机场、居民生活区等地区安装用于安防的监控系统,每天产生大量的监控视频数据;再例如,在互联网上存储着海量的视频节目,而且每时每刻还在不断地高速增长。如何在如此海量的视频数据中快速准确地检索到我们所期望的内容,是一个具有重要研究价值和巨大应用价值的实际问题,这一问题的有效解决将对相关产业的深入发展起到重要的促进和推动作用。视频内容分析技术的一个重要环节是构建视频样本集的基元库(也称为词典、词包等)。基元库的作用是寻找最能表达视频样本集的典型特征向量,降低视频表示的复杂度,提高视频表示的准确度,从而提升视频检索与识别的精度。基元库的构造主要包括两个方面的内容:第一,计算视频样本集局部特征两两之间的距离度量;第二,对局部特征进行聚类,确定聚类中心。根据视频样本集局部特征提取方法和描述方法的不同,最终所得到的基元库存在很大差别。目前常用的局部特征描述方法包括梯度方向直方图(HOG)、光流直方图(HOF)和运动边界直方图(MBH)等。梯度方向直方图通过计算时空局部特征中每帧图像的梯度方向信息来描述局部特征。这种方法注重特征的静态表观信息,但忽略了特征中帧与帧之间的运动信息。光流直方图着重考虑了特征中帧与帧之间的运动信息,但这种方法很难处理镜头自身运动的情况。运动边界直方图在光流直方图的基础上,通过计算光流场的梯度信息,能有效过滤镜头自身运动的信息,因此能更好地描述视频中感兴趣目标的运动信息。在实际的视频内容分析系统中,一个具有共识的观点是:特征的静态表观信息和运动信息在描述视频特征方面,具有同等重要的地位。为此,本专利技术提供一种基于线性动态系统的视频动态基元库构建方法。线性动态系统能够同时刻画局部特征的静态表观信息和动态运动信息,因此其区分判别能力优于上述单个方法。由于线性动态系统无法表示为欧式空间中的一个点,为了对线性动态系统进行聚类,本专利技术在计算线性动态系统两两之间的距离度量构成一个距离度量矩阵之后,直接对上述距离度量矩阵进行聚类,聚类结果作为视频样本集的基元库。所述基元库能显著提高视频检索与识别的性能和准确度。
技术实现思路
本专利技术的目的在于提出一种视频动态基元库的构建方法,获得能够同时刻画视频静态表观信息和动态运动信息的视频动态基元库,该基元库能显著提高视频检索与识别的性能和准确度。本专利技术提出的一种视频动态基元库的构建方法,包括以下步骤:步骤1:收集视频数据文件构成视频样本集;步骤2:对于视频样本集中的每个视频数据文件,提取三维时空局部特征,构成特征集;步骤3:对于每个三维时空局部特征,使用线性动态系统作为所述三维时空局部特征的描述子;步骤4:计算特征集中三维时空局部特征两两之间的距离度量,构成一个距离度量矩阵;步骤5:对所述距离度量矩阵进行聚类,聚类中心作为所述视频样本集的动态基元库。优选的,所述的三维空间局部特征的大小为N×N×L,其中,N×N是每帧视频图像上以兴趣点为中心的局部像素块大小,L是时间方向上的帧数。优选的,步骤3中计算三维时空局部特征的描述子的方法具体为:步骤31,令三维时空局部特征Y满足线性动态系统模型,线性动态系统模型表示为如下式: x t + 1 = A x t + v t y t = Cx t + w t ]]>其中,Y={y1,…,yi,…,yL本文档来自技高网
...
一种视频动态基元库的构建方法

【技术保护点】
一种视频动态基元库的构建方法,其特征在于,包括以下步骤:步骤1:收集视频数据文件构成视频样本集;步骤2:对于视频样本集中的每个视频数据文件,提取三维时空局部特征,构成特征集;步骤3:对于每个三维时空局部特征,使用线性动态系统作为所述三维时空局部特征的描述子;步骤4:计算特征集中三维时空局部特征两两之间的距离度量,构成一个距离度量矩阵;步骤5:对所述距离度量矩阵进行聚类,聚类中心作为所述视频样本集的动态基元库。

【技术特征摘要】
1.一种视频动态基元库的构建方法,其特征在于,包括以下步骤:步骤1:收集视频数据文件构成视频样本集;步骤2:对于视频样本集中的每个视频数据文件,提取三维时空局部特征,构成特征集;步骤3:对于每个三维时空局部特征,使用线性动态系统作为所述三维时空局部特征的描述子;步骤4:计算特征集中三维时空局部特征两两之间的距离度量,构成一个距离度量矩阵;步骤5:对所述距离度量矩阵进行聚类,聚类中心作为所述视频样本集的动态基元库。2.如权利要求1所述的方法,其特征在于,所述的三维空间局部特征的大小为N×N×L,其中,N×N是每帧视频图像上以兴趣点为中心的局部像素块大小,L是时间方向上的帧数。3.如权利要求2所述的方法,其特征在于,步骤3中计算三维时空局部特征的描述子的方法具体为:步骤31,令三维时空局部特征Y满足线性动态系统模型,线性动态系统模型表示为如下式: x t ...

【专利技术属性】
技术研发人员:罗冠胡卫明
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1