基于视觉词典的图像分类方法技术

技术编号：6612774 阅读：580 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种基于视觉词典的图像分类方法，涉及数字图像处理技术领域，包括以下步骤：S1：抽取训练图像数据集的联合局部特征；S2：通过基于移动均值和区域哈希法的聚类算法对所述联合局部特征进行向量矢量化，从而选择聚类中心个数，以形成视觉词典；S3：根据所述视觉词典生成图像的特征表示，以建立图像分类器；S4：根据所述图像分类器分类所述训练图像数据集中的图像。本发明专利技术能够获得最具区分度的视觉词典，从而使分类方法对图像数据集的样本空间分布具有自适应性，可以抵抗各种仿射变换和光照变化，对于局部异常、噪声干扰、以及复杂背景具有更好的鲁棒性，而且具有很强的通用性，可以用于各种类型的图像分类，因而具有较高的实用价值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数字图像处理
，特别涉及一种。
技术介绍
图像分类是对图像中的目标判定类别，从而将图像进行归类。目前，图像分类技术已经成为了人工智能和模式识别中的重要研究方向，在军事目标识别、遥感和医学图像识别、OCR、生物特征识别、票据识别、智能交通等领域中得到了应用。从技术上来说，基于内容的图像分类主要是利用图像的低层局部特征和高层语义特征，建立基于特征的向量表示，从而将其转化为人工智能领域的监督学习问题。在实际使用中，图像分类的难点在于目标由于不同程度的遮挡、观察视角不同、光照条件变化、仿射变换以及同类目标之间的差异性，造成分类失败。目前，基于局部区域特征提取算子(如HarriS-Affine、MSER、SIFT等)的图像分类识别方法在仿射变换、光照变化、遮挡等条件下都被证明可以取得较好的分类效果。该方法从图像中抽取局部关键区域，并用仿射不变性描述算子建立这些区域的特征向量，然后通过向量矢量化方法建立视觉词典(Visual Code Book)，并将图像用基于该视觉词典的频率直方图表示，最终建立分类模型实现对目标识别。常用的向量矢量化方法是k-means ( 一种硬聚类算法)，但该算法一般假设数据集是一个混合正态分布，在迭代过程中容易在样本点分布密集的地方陷入局部极值，而且还必须事先确定聚类个数，初始点不同可能结果也不一样，一个远离中心点的样本点可能会使中心点产生较大偏离，而且计算复杂度较高，在实际使用中无法得到最具区分度的视觉词典。
技术实现思路
(一)要解决的技术问题本专利技术要解决的技术问题是如何得到最具区分度的视觉词典，并根据该视觉词典进行...

【技术保护点】
１．一种基于视觉词典的图像分类方法，其特征在于，包括以下步骤：Ｓ１：抽取训练图像数据集的联合局部特征；Ｓ２：通过基于移动均值和区域哈希法的聚类算法对所述联合局部特征进行向量矢量化，从而选择聚类中心个数，以形成视觉词典；Ｓ３：根据所述视觉词典生成图像的特征表示，以建立图像分类器；Ｓ４：根据所述图像分类器分类所述训练图像数据集中的图像。

【技术特征摘要】

【专利技术属性】
技术研发人员：覃征，纪磊，李环，
申请(专利权)人：清华大学，东莞理工学院，
类型：发明
国别省市：11

全部详细技术资料下载我是这个专利的主人