当前位置: 首页 > 专利查询>江南大学专利>正文

基于核函数匹配的空间金字塔物体识别方法技术

技术编号:15059952 阅读:46 留言:0更新日期:2017-04-06 09:36
本发明专利技术公开了一种基于核函数匹配的空间金字塔物体识别方法。包含以下步骤:提取物体图像的ED-SIFT(Efficient Dense Scale-invariant Feature Transform)描述子;使用k-means++聚类算法将训练样本的ED-SIFT描述子聚类,获得视觉词典;引入空间金字塔,使用核函数匹配获得训练样本和测试样本的视觉单词直方图;使用SVM分类器完成训练样本的训练和测试样本的识别。本发明专利技术提出的算法对物体图像的识别具有较高的辨识度,并且在训练样本较少的情况下,采用简单的SVM分类器就可以获得良好的分类效果。

【技术实现步骤摘要】

:本专利技术涉及机器视觉领域,特别涉及一种基于核函数匹配的空间金字塔物体识别方法
技术介绍
:随着计算机和多媒体技术的飞速发展,数字图像和视频的规模急剧膨胀。海量的图像数据虽然方便了人们的生活,但是也给人们的生活带来了很大困扰。如何从海量的图像数据中快速准确的寻找我们自己感兴趣的物体图像,变得越来越困难。因此,如何充分准确的理解图像,如何有序、高效、合理的组织图像数据并检索到所需要的图像逐渐成为计算机视觉研究的热点之一。近年来,以词袋模型(BagofWords,BoW)为关键技术的物体识别算法取得的进步最为突出。近几十年来各国专家学者提出了很多方法,大大促进了该领域的进展。但是高精度的物体识别仍然是一项极具挑战的任务。原因之一就是物体的图像容易受到光线变化、视角变化、物体遮挡和背景等因素的影响。另外,同类物体间的差异进一步加剧了物体识别的难度。本专利针对如何获得具有代表性的视觉单词和如何构建具有判别力的视觉单词直方图的问题,提出了一种基于核函数匹配的空间金字塔物体识别方法,大大提高了物体识别的准确率。
技术实现思路
:本专利技术为了克服上述现有技术中的缺陷和提高物体识别的准确率,提供了一种基于核函数匹配的空间金字塔物体识别方法。为了实现上述目的,本专利技术提供如下技术方案:步骤一、采集物体样本图像,将待识别的样本图像数据分为训练样本和测试样本;步骤二、将训练样本和测试样本的图像转换为灰度图像,并将灰度图像的数据类型转化为双精度浮点类型。然后将图像的尺寸进行缩放处理,使其高度和宽度在[50,200]之间;步骤三、提取训练样本和测试样本图像的ED-SIFT(EfficientDenseScale-invariantFeatureTransform)描述子;步骤四、使用k-means++聚类算法将训练样本的ED-SIFT描述子聚类,获得视觉单词。所有的视觉单词构成了视觉词典;步骤五、引入空间金字塔[1],将训练样本的ED-SIFT描述子、测试样本的ED-SIFT描述子和视觉词典映射到高维空间,然后使用核函数匹配来获得训练样本和测试样本的视觉单词直方图;步骤六、将训练样本的视觉单词直方图输入到SVM分类器中进行训练;步骤七、基于训练后的SVM分类器,将测试样本的视觉单词直方图输入SVM分类器,完成物体的识别。与现有的技术相比,本专利技术具有以下有益效果:1.通过步骤三提取样本的ED-SIFT描述子的兴趣点多、信息量丰富、均匀采样提取关键点、计算复杂度低。能够有效提高视觉单词的代表性,提高识别的准确度。2.通过步骤五引入空间金字塔,充分利用了图像的空间信息。将训练样本、测试样本和聚类的视觉单词映射到高维空间,然后使用核函数匹配来获得训练样本和测试样本的视觉单词直方图,大大提高了匹配精度。3.结合ED-SIFT特征的提取,k-means++聚类算法和空间金字塔核函数匹配共同构建了一个鲁棒的物体识别算法。通过实验结果表明本专利方法在物体的图像受到噪声、光照、尺度、视角和遮挡等因素的情况下,具有良好的识别效果。另外,本专利的方法可以在训练图片较少的情况下仍然保持良好的识别效果。因此,本专利技术在物体识别、图像分类和图像检索等领域都具有广泛的应用前景。附图说明:图1本专利技术的方法流程图;图2ED-SIFT描述子提取方法流程图;图3基于高斯核函数映射的梯度方向三维网格图表示;图4空间位置权重的伪彩图表示;图5基于空间金字塔匹配的词袋模型表示;图6本专利算法在Caltech-101数据集上的混淆矩阵;图7本专利算法在Caltech-256数据集上的混淆矩阵。具体实施方式为了更好的说明本专利技术的目的、具体步骤以及特点,下面结合附图对本专利技术作进一步详细的说明:参考图1,本专利技术提出的一种基于核函数匹配的空间金字塔物体识别方法,主要包含以下步骤:步骤一、采集待识别物体的样本图像,将采集的样本图像数据分为训练样本和测试样本;步骤二、将训练样本和测试样本的图像转换为灰度图像,并将灰度图像的数据类型转化为双精度浮点类型;然后对图像的尺寸进行缩放处理,使其高度和宽度在[50,200]之间;步骤三、提取训练样本和测试样本的ED-SIFT(EfficientDenseScale-invariantFeatureTransform)描述子;步骤四、使用k-means++聚类算法将训练样本的ED-SIFT描述子聚类,获得视觉单词;所有的视觉单词构成了视觉词典;步骤五、引入空间金字塔[1],将训练样本的ED-SIFT描述子、测试样本的ED-SIFT描述子和视觉词典映射到高维空间,然后使用核函数匹配来获得训练样本和测试样本的视觉单词直方图;步骤六、将训练样本的视觉单词直方图输入到SVM分类器中进行训练;步骤七、基于训练后的SVM分类器,将测试样本的视觉单词直方图输入SVM分类器,完成物体的识别。上述技术方案中,步骤一将物体图像样本分为训练样本和测试样本。对于图像样本,我们可以自己使用照相机拍摄物体来获得物体的图像,也可以使用计算机视觉中物体识别的经典的数据集。上述技术方案中,步骤三中ED-SIFT描述子的提取过程如图2所示。上述技术方案中,步骤三中ED-SIFT描述子的提取方法为:1.将样本图像划分为均匀大小的单元格,每个单元格由4×4个像素组成;2.对样本图像进行高斯滤波,计算每个像素的梯度。本专利中高斯滤波器的尺寸为5×5,标准差为1。然后归一化梯度向量;3.依次从图像中选取4×4个单元格,步长为8个像素,遍历整个图像,使用高斯核函数将每个单元格中的像素的梯度方向映射到梯度方向基向量中。其中z为图像中的像素点,为梯度方向基向量。如图3所示,本专利中梯度方向基向量是在平面直角坐标系的水平和垂直方向分别将区间[-1,1]平均分成九等分,得到的100个点坐标,然后使用高斯核函数将图像梯度的方向映射到梯度方向基向量中。取α=5,并使用梯度的模加权,得到样本图像的梯度方向直方图。对于图像中每个选取的4×4大小的单元格,对其中每一个像素z的梯度模归一化的公式为:(ε为小常量,防止分母为0);4.使用高斯核函数来增大靠近关键点的像素点的空间位置权重,减小远离关键点的像素点的空间位置权重。其中α为调节因子,本专利中取α=5。在4×4大小的单元格中,pz为关键点z的空间位置,qz′为像素点z′的空间位置。如图4所示,关键点pz的空间位置本文档来自技高网...

【技术保护点】
基于核函数匹配的空间金字塔物体识别方法,其特征在于,包括下列步骤:步骤一、采集物体样本图像,将待识别的样本图像数据分为训练样本和测试样本;步骤二、将训练样本和测试样本的图像转换为灰度图像,并将灰度图像的数据类型转化为双精度浮点类型。然后将图像的尺寸进行缩放处理,使其高度和宽度在[50,200]之间;步骤三、提取训练样本和测试样本图像的ED‑SIFT(Efficient Dense Scale‑invariant Feature Transform)描述子;步骤四、使用k‑means++聚类算法将训练样本的ED‑SIFT描述子聚类,获得视觉单词。所有的视觉单词构成了视觉词典;步骤五、引入空间金字塔,将训练样本的ED‑SIFT描述子、测试样本的ED‑SIFT描述子和视觉词典映射到高维空间,然后使用核函数匹配来获得训练样本和测试样本的视觉单词直方图;步骤六、将训练样本的视觉单词直方图输入到SVM分类器中进行训练;步骤七、基于训练后的SVM分类器,将测试样本的视觉单词直方图输入SVM分类器,完成物体的识别。

【技术特征摘要】
1.基于核函数匹配的空间金字塔物体识别方法,其特征在于,包括下列步骤:
步骤一、采集物体样本图像,将待识别的样本图像数据分为训练样本和测试样本;
步骤二、将训练样本和测试样本的图像转换为灰度图像,并将灰度图像的数据类型转
化为双精度浮点类型。然后将图像的尺寸进行缩放处理,使其高度和宽度在[50,200]之间;
步骤三、提取训练样本和测试样本图像的ED-SIFT(EfficientDenseScale-
invariantFeatureTransform)描述子;
步骤四、使用k-means++聚类算法将训练样本的ED-SIFT描述子聚类,获得视觉单词。所
有的视觉单词构成了视觉词典;
步骤五、引入空间金字塔,将训练样本的ED-SIFT描述子、测试样本的ED-SIFT描述子和
视觉词典映射到高维空间,然后使用核函数匹配来获得训练样本和测试样本的视觉单词直
方图;
步骤六、将训练样本的视觉单词直方图输入到SVM分类器中进行训练;
步骤七、基于训练后的SVM分类器,将测试样本的视觉单词直方图输入SVM分类器,完成
物体的识别。
2.根据权利要求1所述的基于核函数匹配的空间金字塔物体识别方法,其特征在于,步
骤三中提取训练样本和测试样本的ED-SIFT(EfficientDenseScale-invariantFeature
Transform)描述子的方法为:
1)将样本图像划分为均匀大小的单元格,每个单元格由4×4个像素组成,依次从图像中选取4
×4个单元格,步长为8个像素,遍历整个图像,使用高斯核函数将每个单元格中像素的梯度方向映射到梯度方向基向量中,得到样本图像的梯度方向直方
图;
其中z为图像中的像素点,为梯度方向基向
量;
α为调节因子,本专利取α=5,梯度方向基向量为在平面直角坐标系的水平和垂直
方向分别将区间[-1,1]平均分成九等分,得到的100个点坐标;
使用归一化的梯度的模加权,每个4×4大小的单元格中每一个像素z的梯度模归一化
的公式为:(ε为小常量,...

【专利技术属性】
技术研发人员:孔军张迎午蒋敏高坤柳晨华
申请(专利权)人:江南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1