当前位置: 首页 > 专利查询>清华大学专利>正文

基于视觉词典的图像分类方法技术

技术编号:6612774 阅读:580 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于视觉词典的图像分类方法,涉及数字图像处理技术领域,包括以下步骤:S1:抽取训练图像数据集的联合局部特征;S2:通过基于移动均值和区域哈希法的聚类算法对所述联合局部特征进行向量矢量化,从而选择聚类中心个数,以形成视觉词典;S3:根据所述视觉词典生成图像的特征表示,以建立图像分类器;S4:根据所述图像分类器分类所述训练图像数据集中的图像。本发明专利技术能够获得最具区分度的视觉词典,从而使分类方法对图像数据集的样本空间分布具有自适应性,可以抵抗各种仿射变换和光照变化,对于局部异常、噪声干扰、以及复杂背景具有更好的鲁棒性,而且具有很强的通用性,可以用于各种类型的图像分类,因而具有较高的实用价值。

【技术实现步骤摘要】

本专利技术涉及数字图像处理
,特别涉及一种。
技术介绍
图像分类是对图像中的目标判定类别,从而将图像进行归类。目前,图像分类技术已经成为了人工智能和模式识别中的重要研究方向,在军事目标识别、遥感和医学图像识别、OCR、生物特征识别、票据识别、智能交通等领域中得到了应用。从技术上来说,基于内容的图像分类主要是利用图像的低层局部特征和高层语义特征,建立基于特征的向量表示,从而将其转化为人工智能领域的监督学习问题。在实际使用中,图像分类的难点在于目标由于不同程度的遮挡、观察视角不同、光照条件变化、仿射变换以及同类目标之间的差异性,造成分类失败。目前,基于局部区域特征提取算子(如HarriS-Affine、MSER、SIFT等)的图像分类识别方法在仿射变换、光照变化、遮挡等条件下都被证明可以取得较好的分类效果。该方法从图像中抽取局部关键区域,并用仿射不变性描述算子建立这些区域的特征向量,然后通过向量矢量化方法建立视觉词典(Visual Code Book),并将图像用基于该视觉词典的频率直方图表示,最终建立分类模型实现对目标识别。常用的向量矢量化方法是k-means ( 一种硬聚类算法),但该算法一般假设数据集是一个混合正态分布,在迭代过程中容易在样本点分布密集的地方陷入局部极值,而且还必须事先确定聚类个数,初始点不同可能结果也不一样,一个远离中心点的样本点可能会使中心点产生较大偏离,而且计算复杂度较高,在实际使用中无法得到最具区分度的视觉词典。
技术实现思路
(一)要解决的技术问题本专利技术要解决的技术问题是如何得到最具区分度的视觉词典,并根据该视觉词典进行图像分类。( 二 )技术方案为解决上述技术问题,本专利技术提供了一种,包括以下步骤Sl 抽取训练图像数据集的联合局部特征;S2:通过基于移动均值和区域哈希法的聚类算法对所述联合局部特征进行向量矢量化,从而选择聚类中心个数,以形成视觉词典;S3 根据所述视觉词典生成图像的特征表示,以建立图像分类器;S4 根据所述图像分类器分类所述训练图像数据集中的图像。其中,所述步骤Sl具体包括Si. 1 利用Harris-Affine算子或提取训练图像数据集的局部区域集合H= {h};Si. 2 利用MSER算子提取训练图像数据集的局部区域集合E = {e};Si. 3 利用SIFT算子提取训练图像数据集的特征点集合为Q = {q};Si. 4根据S1.1 Si. 3得到所述联合局部特征为: U = {u\u gQ and (u [ H or ti [ Ε)}。其中,所述步骤Si. 1具体包括Harris-AfTine利用公式(1)所示的图像二阶自相关矩阵的特征值度量判断角权利要求1.一种,其特征在于,包括以下步骤51抽取训练图像数据集的联合局部特征;52通过基于移动均值和区域哈希法的聚类算法对所述联合局部特征进行向量矢量化,从而选择聚类中心个数,以形成视觉词典;53根据所述视觉词典生成图像的特征表示,以建立图像分类器;54根据所述图像分类器分类所述训练图像数据集中的图像。2.如权利要求1所述的,其特征在于,所述步骤Sl具体包括Si. 1:利用Harris-AfTine算子或提取训练图像数据集的局部区域集合H= {h}; Si. 2:利用MSER算子提取训练图像数据集的局部区域集合E= {e}; Si. 3 利用SIFT算子提取训练图像数据集的特征点集合为Q = {q}; Si.4根据Si. 1 Si. 3得到所述联合局部特征为 U ~{u\u G Q and (u c H ο u c Ε)}。3 如权利要求2所述的,其特征在于,所述步骤Si.1具体包括Harris-Affine利用公式(1)所示的图像二阶自相关矩阵的特征值度量判断角点4.如权利要求2所述的,其特征在于,所述步骤Si.2具体包括对所述训练图像数据集中的图像按灰度值大小对像素排序;按所述排序将像素逐渐添加到空白图像,并记录相应连通成分及其面积函数,所述面积函数为灰度值的函数;根据所述面积函数变化率的局部极小值确定MSER,最终得到局部区域集合E = {e}。5.如权利要求3所述的,其特征在于,所述步骤Si.3具体包括使用高斯差分算子DoG来确定特征尺度,DoG定义如( 所示 DoG(s, σ ) = L(s, ko )+L(s, k)(5)其中σ是特征尺度,k为常数,L是尺度空间函数,用于在各个尺度上对图像进行平滑, 从而建立DoG金字塔尺度空间,得到各个尺度上的平滑图像后,SIFT算子将每个点与相邻的8个点以及上下层各9个点相比较,通过计算该点是否是极大值或极小值点来判断是否为特征点,同时利用梯度方向来判断该点的主方向,SIFT算子得到的特征点集合记为Q = {q}。6.如权利要求1所述的,其特征在于,所述步骤S2具体包括对于步骤Sl得到的d维图像局部特征向量空间,均值移动算法利用核函数处理不同的样本空间分布,并自动查找样本空间中的概率密度极值点,迭代过程如式(6)所示其中,a,和h是d维图像局部特征向量空间的样本点,GO是单位高斯核函数,ω (a,) 表示样本点%的权重系数,η表示样本空间的样本点总数; 迭代步骤包括S2. 1 查找与…的距离小于r的相邻点集合,具体查找方式为 对d维欧式空间X进行T次切分,每次切分需要随机选定Z维,建立不等式,并用布尔向量记录切分得到的子空间,如在随机选定的某一维dz上,取一个随机值Uz,这个值在整个样本空间第dz维的值域范围之内,根据式(7)来对样本点%进行切分7.如权利要求1所述的,其特征在于,步骤S3具体包括通过对每个图像统计所包含视觉单词的分布直方图,将图像转化为模式识别方法可以处理的数据集,即具有相同维度的特征向量集合;利用SVM、贝叶斯等分类算法对其进行训练和分类,并在训练过程中进行特征权重计算,选择最有效的特征。全文摘要本专利技术公开了一种,涉及数字图像处理
,包括以下步骤S1抽取训练图像数据集的联合局部特征;S2通过基于移动均值和区域哈希法的聚类算法对所述联合局部特征进行向量矢量化,从而选择聚类中心个数,以形成视觉词典;S3根据所述视觉词典生成图像的特征表示,以建立图像分类器;S4根据所述图像分类器分类所述训练图像数据集中的图像。本专利技术能够获得最具区分度的视觉词典,从而使分类方法对图像数据集的样本空间分布具有自适应性,可以抵抗各种仿射变换和光照变化,对于局部异常、噪声干扰、以及复杂背景具有更好的鲁棒性,而且具有很强的通用性,可以用于各种类型的图像分类,因而具有较高的实用价值。文档编号G06K9/66GK102208038SQ20111017510公开日2011年10月5日 申请日期2011年6月27日 优先权日2011年6月27日专利技术者李环, 纪磊, 覃征 申请人:东莞理工学院, 清华大学本文档来自技高网
...

【技术保护点】
1.一种基于视觉词典的图像分类方法,其特征在于,包括以下步骤:S1:抽取训练图像数据集的联合局部特征;S2:通过基于移动均值和区域哈希法的聚类算法对所述联合局部特征进行向量矢量化,从而选择聚类中心个数,以形成视觉词典;S3:根据所述视觉词典生成图像的特征表示,以建立图像分类器;S4:根据所述图像分类器分类所述训练图像数据集中的图像。

【技术特征摘要】

【专利技术属性】
技术研发人员:覃征纪磊李环
申请(专利权)人:清华大学东莞理工学院
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1