当前位置: 首页 > 专利查询>东南大学专利>正文

一种基于视觉词袋模型的监控视频车型分类方法技术

技术编号:16605846 阅读:45 留言:0更新日期:2017-11-22 15:44
本发明专利技术公开了一种基于视觉词袋模型的监控视频车型分类方法,包括采集车辆图像;对训练图像库中的车辆图像提取车辆特征向量;对获得的车辆特征向量进行聚类生成视觉词典;将提取的车辆特征向量以及生成的视觉词典进行空间金字塔分解,得到最终图像特征向量,形成训练图像模型库;对待分类图像提取出最终图像特征向量,并利用KNN分类器进行分类,输出待分类图像的类别。本发明专利技术使用PCA‑SIFT算法可以自由降低特征向量的维数,大大降低计算量。另外改进的k‑means算法使用局部因子异常算法去除离群点和孤立点之后,再进行聚类,能够显著提高k‑means算法聚类的精度,且对初始中心选择更有针对性,减少计算量和迭代次数。

A vehicle classification method based on visual word bag model for surveillance video

The invention discloses a video vehicle classification method based on bag of words model, including the collection of vehicle image; vehicle feature vector on vehicle image training image database extraction; clustering to generate visual dictionary of vehicle feature vector; the extracted feature vectors and the vehicle generated visual dictionary space of Pyramid decomposition. To get the final image feature vector, image formation training model base; treat the classification image to extract the final image feature vector, and classified by KNN classifier to output image classification categories. The invention uses PCA SIFT algorithm can reduce the dimension of feature vector, greatly reduce the amount of calculation. After the addition of K improved means algorithm using local factor anomaly algorithm remove the outliers and outlier, then clustering, K means algorithm can significantly improve the accuracy of clustering, and the choice of initial centers more targeted, reduce the amount of calculation and iteration.

【技术实现步骤摘要】
一种基于视觉词袋模型的监控视频车型分类方法
本专利技术涉及视频图像分类方法,特别是涉及一种基于视觉词袋模型的监控视频车型分类方法。
技术介绍
随着电子工业技术和多媒体技术的发展,数字图像和视频等被广泛的应用于多个领域,信息呈现爆炸性增长,形成了海量数据环境。与文本信息相比,图像信息具有直观,生动,易于理解的特点,给人们带来了很多便利,但是与此同时也带来很多问题,选取需要的信息变得异常困难,检索时常常存在大量无用或者错误信息。词袋模型来源于文本分类,文本可以看作是无序的单词的集合,通过对文本中的单词进行统计,可以完成文本的分类。图像分类与之类似,图像可以看作是许多与位置无关的局部特征的集合,这些局部特征相当于文本中的单词,我们把这些局部特征称作视觉单词,视觉单词的集合称为视觉词典。智能交通系统在交通和科技日益发展的今天得到凸显,其中车型分类技术是重要的一个分支,但,现有的车型分类算法使用SIFT提取车辆局部特征,并使用k-means对特征向量进行聚类生成视觉单词,但该方法存在以下缺点:SIFT方法提取的每个特征向量使用一个128维的浮点数组表示,然后需要对特征向量进行聚类,空间金字塔匹配等操作。对于这些操作来说,128维的数组显得过于庞大,而且数组中包括了很多的冗余信息,这会导致计算量大大增加。且k-means聚类算法对于离群点和孤立点非常敏感,如果在需要进行聚类的特征向量中存在较多的离群点和孤立点,那么将会对聚类结果造成很大的影响,从而影响聚类的准确度。K-means聚类算法初始聚类中心的选择非常重要,如果初始聚类中心选择不好,那么迭代的次数将会增加,计算量也会更大。
技术实现思路
专利技术目的:为解决现有技术的不足,提供一种基于改进的K-means算法和改进的SIFT算法的视觉词袋模型的监控视频车型分类方法。技术方案:一种基于视觉词袋模型的监控视频车型分类方法,包括以下步骤:S01、采集车辆图像,并将其分为训练图像库和待分类图像,其中,车辆图像包括车脸;S02、对训练图像库中的车辆图像提取车辆特征向量;S03、对获得的车辆特征向量进行聚类生成视觉词典;S04、将提取的车辆特征向量以及生成的视觉词典进行空间金字塔分解,得到训练图像库中车辆图像的最终图像特征向量,形成训练图像模型库;S05、对待分类图像按照步骤S02至S04提取出最终图像特征向量,并利用KNN分类器进行分类,输出待分类图像的类别。进一步的,所述步骤S02中使用PCA-SIFT算法提取车辆图像的车辆特征向量,其中车辆特征向量维数设置为S维,这样每一个车辆图像最终特征向量维数为S维;其包括以下步骤:(1)输入车辆图像;(2)对车辆图像进行高斯差分尺度空间特征点检测二维图像的尺度空间定义为:L(x,y,σ)=G(x,y,σ)*I(x,y)其中,I(x,y)为车辆图像信息,G(x,y,σ)是尺度可变高斯函数,计算公式如下:其中,(x,y)是空间坐标,σ是尺度坐标,σ大小决定图像的平滑程度高斯差分尺度空间,得到稳定的特征点,高斯差分尺度空间的计算公式如下:D(x,y,σ)=(G(x,y,εσ)-G(x,y,σ))*I(x,y)=L(x,y,εσ)-L(x,y,σ)其中,ε为系数,每一个采样点要和它所有的相邻点比较,看其是否比它的图像域和尺度域的相邻点大或者小;如果一个点在多尺度空间本层以及上下两层的所有领域中是最大值或最小值时,就认为该点是图像在该尺度下的一个特征点;(3)去除不好的特征点通过拟合三维二次函数以确定特征点的位置和尺度达到亚像素精度,同时去除低对比度的特征点和不稳定的边缘响应点,以增强匹配稳定性、提高抗噪声能力;(4)特征点的主方向计算为上一步确定的每幅图像的特征点计算一个主方向,依照这个主方向进行下一步运算,利用特征点邻域像素的梯度方向分布特性为每个特征点指定方向参数,使得算子具备旋转不变性;其方向参数的计算公式如下:θ(x,y)=αtan2((L(x,y+1)-L(x,y-1))/(L(x+1,y)-L(x-1,y)))其中,(x,y)为特征点位置,m(x,y)为(x,y)处梯度的模值,即(x,y)所处尺度,θ(x,y)为(x,y)处梯度的方向,即(x,y)的主方向,α为矩阵Q的特征值,其中L所用的尺度为其对应的每个特征点各自所在的尺度;(5)描述子的构造;(6)提取出车辆特征向量。更进一步的,所述步骤(5)包括:(a)对特征点确定一个大小为41*41的邻域,旋转这个邻域到该特征点的主方向;(b)计算邻域内特征点的水平梯度与垂直梯度,这样每个特征点确定了一个大小为39*39*2=3042维的特征描述子向量;(c)假设有N个特征点,那么所有特征点描述子向量构成一个N*3042的矩阵,计算矩阵的协方差矩阵Cr;(d)计算协方差矩阵Cr的特征向量,根据特征根的大小排序,选择对应的前n′个特征向量,构成投影矩阵T;(e)对所述特征描述子向量,乘以投影矩阵T,得到3042维降到n′维的车辆特征向量,其包括视觉词典和视觉词典中视觉单词的频率。进一步的,所述步骤S03包括:(1)使用LOF算法去除离群点和孤立点;(2)定义聚类中心数ρ以及车辆特征向量集合F;(3)根据改进的算法确定ρ个初始聚类中心;(4)计算车辆特征向量集合F中的向量fi,i=1,2,...,m与ρ个初始均值向量的欧氏距离,将fi加入与其距离最近的簇Ci中:Ci=Ci∪{fi}更新均值向量(5)判断当前迭代次数是否已达预设的上限值若达到预设的上限值,则返回步骤(4),否则,结束聚类计算,得到视觉单词数量为M′的视觉词典。更进一步的,所述步骤(1)中特征点p的局部离群因子表示为:其中,lrdk(o)表示特征点o的局部可达密度,lrdk(p)表示特征点p的局部可达密度,Nk(p)表示特征点p的第k距离邻域,LOFk(p)表示特征点p的邻域点Nk(p)的局部可达密度与特征点p的局部可达密度之比的平均数,设定阈值为10,若LOFk(p)大于等于10,则认为特征点p是离群点或孤立点;若LOFk(p)小于10,则认为特征点p是正常点。更进一步的,所述步骤(3)包括:定义车辆特征向量集合:F={f1,f2,...,fm};其中,fi为特征点的特征向量,i=1,2,...,m;从中任选一个特征点的特征向量,计算它与其余所有特征点的特征向量的欧氏距离得到m-1个欧氏距离,其中,两个特征点的特征向量x和y的欧氏距离定义为:把得到的m-1欧氏距离写成距离矢量形式为:D={d1,d2,...,dm-1}其中,di为第i个欧氏距离,i=1,2,...,m-1;最后计算基于距离的概率大小为:p={p1,p2,...,pm-1}其中,选取其中前k′个概率最大的特征点的特征向量λi(i=1,2,...,k′)作为初始聚类中心Ci,每个初始聚类中心Ci只有一个向量λi。进一步的,所述步骤S04包括:(1)对采集的车辆图像进行分层处理首先需要确定车辆图像空间金字塔的层数,设置层数为R,然后对图像进行分层处理,j=0,1,…,R-1,j表示车辆图像在空间金字塔中的具体层次,j=0表示原车辆图像,那么在第j层,把车辆图像均匀分成不重叠的2j×2j块子图像;(2)统计不同层次车辆图像中不同子图像的直方图j=0时,即本文档来自技高网
...
一种基于视觉词袋模型的监控视频车型分类方法

【技术保护点】
一种基于视觉词袋模型的监控视频车型分类方法,其特征在于,包括以下步骤:S01、采集车辆图像,并将其分为训练图像库和待分类图像,其中,车辆图像包括车脸;S02、对训练图像库中的车辆图像提取车辆特征向量;S03、对获得的车辆特征向量进行聚类生成视觉词典;S04、将提取的车辆特征向量以及生成的视觉词典进行空间金字塔分解,得到训练图像库中车辆图像的最终图像特征向量,形成训练图像模型库;S05、对待分类图像按照步骤S02至S04提取出最终图像特征向量,并利用KNN分类器进行分类,输出待分类图像的类别。

【技术特征摘要】
1.一种基于视觉词袋模型的监控视频车型分类方法,其特征在于,包括以下步骤:S01、采集车辆图像,并将其分为训练图像库和待分类图像,其中,车辆图像包括车脸;S02、对训练图像库中的车辆图像提取车辆特征向量;S03、对获得的车辆特征向量进行聚类生成视觉词典;S04、将提取的车辆特征向量以及生成的视觉词典进行空间金字塔分解,得到训练图像库中车辆图像的最终图像特征向量,形成训练图像模型库;S05、对待分类图像按照步骤S02至S04提取出最终图像特征向量,并利用KNN分类器进行分类,输出待分类图像的类别。2.根据权利要求1所述的车型分类方法,其特征在于,所述步骤S02中使用PCA-SIFT算法提取车辆图像的车辆特征向量,其中车辆特征向量维数设置为S维,这样每一个车辆图像最终特征向量维数为S维;其包括以下步骤:(1)输入车辆图像;(2)对车辆图像进行高斯差分尺度空间特征点检测二维图像的尺度空间定义为:L(x,y,σ)=G(x,y,σ)*I(x,y)其中,I(x,y)为车辆图像信息,G(x,y,σ)是尺度可变高斯函数,计算公式如下:其中,(x,y)是空间坐标,σ是尺度坐标,σ大小决定图像的平滑程度高斯差分尺度空间,得到稳定的特征点,高斯差分尺度空间的计算公式如下:D(x,y,σ)=(G(x,y,εσ)-G(x,y,σ))*I(x,y)=L(x,y,εσ)-L(x,y,σ)其中,ε为系数,每一个采样点要和它所有的相邻点比较,看其是否比它的图像域和尺度域的相邻点大或者小;如果一个点在多尺度空间本层以及上下两层的所有领域中是最大值或最小值时,就认为该点是图像在该尺度下的一个特征点;(3)去除不好的特征点通过拟合三维二次函数以确定特征点的位置和尺度达到亚像素精度,同时去除低对比度的特征点和不稳定的边缘响应点,以增强匹配稳定性、提高抗噪声能力;(4)特征点的主方向计算为上一步确定的每幅图像的特征点计算一个主方向,依照这个主方向进行下一步运算,利用特征点邻域像素的梯度方向分布特性为每个特征点指定方向参数,使得算子具备旋转不变性;其方向参数的计算公式如下:θ(x,y)=αtan2((L(x,y+1)-L(x,y-1))/(L(x+1,y)-L(x-1,y)))其中,(x,y)为特征点位置,m(x,y)为(x,y)处梯度的模值,即(x,y)所处尺度,θ(x,y)为(x,y)处梯度的方向,即(x,y)的主方向,α为矩阵Q的特征值,其中L所用的尺度为其对应的每个特征点各自所在的尺度;(5)描述子的构造;(6)提取出车辆特征向量。3.根据权利要求2所述的车型分类方法,其特征在于,所述步骤(5)包括:(a)对特征点确定一个大小为41*41的邻域,旋转这个邻域到该特征点的主方向;(b)计算邻域内特征点的水平梯度与垂直梯度,这样每个特征点确定了一个大小为39*39*2=3042维的特征描述子向量;(c)假设有N个特征点,那么所有特征点描述子向量构成一个N*3042的矩阵,计算矩阵的协方差矩阵Cr;(d)计算协方差矩阵Cr的特征向量,根据特征根的大小排序,选择对应的前n′个特征向量,构成投影矩阵T;(e)对所述特征描述子向量,乘以投影矩阵T,得到3042维降到n′维的车辆特征向量,其包括视觉词典和视觉词典中视觉单词的频率。4.根据权利要求3所述的车型分类方法,其特征在于,所述步骤S03包括:(1)使用LOF算法去除离群点和孤立点;(2)定义聚类中心数ρ以及车辆特征向量集合F;(3)根据改进的算法确定ρ个初始聚类中心;(4)计算车辆特征向量集合F中的向量fi,i=1,2,...,m与ρ个初始均值向量的欧氏距离,将fi加入与...

【专利技术属性】
技术研发人员:徐平平刘凯阮湖岗张成高岩渊
申请(专利权)人:东南大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1