基于核函数匹配的空间金字塔物体识别方法技术

技术编号：15059952 阅读：46 留言：0更新日期：2017-04-06 09:36

本发明专利技术公开了一种基于核函数匹配的空间金字塔物体识别方法。包含以下步骤：提取物体图像的ED-SIFT(Efficient Dense Scale-invariant Feature Transform)描述子；使用k-means++聚类算法将训练样本的ED-SIFT描述子聚类，获得视觉词典；引入空间金字塔，使用核函数匹配获得训练样本和测试样本的视觉单词直方图；使用SVM分类器完成训练样本的训练和测试样本的识别。本发明专利技术提出的算法对物体图像的识别具有较高的辨识度，并且在训练样本较少的情况下，采用简单的SVM分类器就可以获得良好的分类效果。

全部详细技术资料下载

【技术实现步骤摘要】

：本专利技术涉及机器视觉领域，特别涉及一种基于核函数匹配的空间金字塔物体识别方法。
技术介绍
：随着计算机和多媒体技术的飞速发展，数字图像和视频的规模急剧膨胀。海量的图像数据虽然方便了人们的生活，但是也给人们的生活带来了很大困扰。如何从海量的图像数据中快速准确的寻找我们自己感兴趣的物体图像，变得越来越困难。因此，如何充分准确的理解图像，如何有序、高效、合理的组织图像数据并检索到所需要的图像逐渐成为计算机视觉研究的热点之一。近年来，以词袋模型(BagofWords,BoW)为关键技术的物体识别算法取得的进步最为突出。近几十年来各国专家学者提出了很多方法，大大促进了该领域的进展。但是高精度的物体识别仍然是一项极具挑战的任务。原因之一就是物体的图像容易受到光线变化、视角变化、物体遮挡和背景等因素的影响。另外，同类物体间的差异进一步加剧了物体识别的难度。本专利针对如何获得具有代表性的视觉单词和如何构建具有判别力的视觉单词直方图的问题，提出了一种基于核函数匹配的空间金字塔物体识别方法，大大提高了物体识别的准确率。
技术实现思路
：本专利技术为了克服上述现有技术中的缺陷和提高物体识别的准确率，提供了一种基于核函数匹配的空间金字塔物体识别方法。为了实现上述目的，本专利技术提供如下技术方案：步骤一、采集物体样本图像，将待识别的样本图像数据分为训练样本和测试样本；步骤二、将训练样本和测试样本的图像转换为...

【技术保护点】
基于核函数匹配的空间金字塔物体识别方法，其特征在于，包括下列步骤：步骤一、采集物体样本图像，将待识别的样本图像数据分为训练样本和测试样本；步骤二、将训练样本和测试样本的图像转换为灰度图像，并将灰度图像的数据类型转化为双精度浮点类型。然后将图像的尺寸进行缩放处理，使其高度和宽度在[50,200]之间；步骤三、提取训练样本和测试样本图像的ED‑SIFT(Efficient Dense Scale‑invariant Feature Transform)描述子；步骤四、使用k‑means++聚类算法将训练样本的ED‑SIFT描述子聚类，获得视觉单词。所有的视觉单词构成了视觉词典；步骤五、引入空间金字塔，将训练样本的ED‑SIFT描述子、测试样本的ED‑SIFT描述子和视觉词典映射到高维空间，然后使用核函数匹配来获得训练样本和测试样本的视觉单词直方图；步骤六、将训练样本的视觉单词直方图输入到SVM分类器中进行训练；步骤七、基于训练后的SVM分类器，将测试样本的视觉单词直方图输入SVM分类器，完成物体的识别。

【技术特征摘要】
1.基于核函数匹配的空间金字塔物体识别方法，其特征在于，包括下列步骤：
步骤一、采集物体样本图像，将待识别的样本图像数据分为训练样本和测试样本；
步骤二、将训练样本和测试样本的图像转换为灰度图像，并将灰度图像的数据类型转
化为双精度浮点类型。然后将图像的尺寸进行缩放处理，使其高度和宽度在[50,200]之间；
步骤三、提取训练样本和测试样本图像的ED-SIFT(EfficientDenseScale-
invariantFeatureTransform)描述子；
步骤四、使用k-means++聚类算法将训练样本的ED-SIFT描述子聚类，获得视觉单词。所
有的视觉单词构成了视觉词典；
步骤五、引入空间金字塔，将训练样本的ED-SIFT描述子、测试样本的ED-SIFT描述子和
视觉词典映射到高维空间，然后使用核函数匹配来获得训练样本和测试样本的视觉单词直
方图；
步骤六、将训练样本的视觉单词直方图输入到SVM分类器中进行训练；
步骤七、基于训练后的SVM分类器，将测试样本的视觉单词直方图输入SVM分类器，完成
物体的识别。
2.根据权利要求1所述的基于核函数匹配的空间金字塔物体识别方法，其特征在于，步
骤三中提取训练样本和测试样本的ED-SIFT(EfficientDenseScale-invariantFeature
Transform)描述子的方法为：
1)将样本图像划分为均匀大小的单元格，每个单元格由4×4个像素组成，依次从图像中选取4
×4个单元格，步长为8个像素，遍历整个图像，使用高斯核函数将每个单元格中像素的梯度方向映射到梯度方向基向量中，得到样本图像的梯度方向直方
图；
其中z为图像中的像素点，为梯度方向基向
量；
α为调节因子，本专利取α＝5，梯度方向基向量为在平面直角坐标系的水平和垂直
方向分别将区间[-1,1]平均分成九等分，得到的100个点坐标；
使用归一化的梯度的模加权，每个4×4大小的单元格中每一个像素z的梯度模归一化
的公式为：(ε为小常量，...

【专利技术属性】
技术研发人员：孔军，张迎午，蒋敏，高坤，柳晨华，
申请(专利权)人：江南大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人