一种基于显著区域词袋模型的物体识别方法技术

技术编号:15030580 阅读:104 留言:0更新日期:2017-04-05 08:05
本发明专利技术提供一种基于显著区域词袋模型的物体识别方法,包括以下步骤:角点检测,定位图像的显著区域,SIFT特征提取,图像区域特征相似性比较。该方法是在目标区域提取局部特征,一方面避免了采用复杂的图像分割技术;另一方面大大降低了与物体无关的特征点。

【技术实现步骤摘要】

本专利技术涉及数字图像处理的
,特别是一种基于显著区域词袋模型的物体识别方法。
技术介绍
随着机器学习和模式识别领域相关技术的飞速发展,计算机视觉技术的不断提高,利用计算机来模仿人类的认知能力进而处理减轻或协助人们完成日常工作任务已经成为可能。物体识别已经成为模式识别中一个极为重要的研究方向,在军事和民用领域中有着广泛的需求和应用。如:智能视频监控,自驾导航,人机交互,因特网中海量的基于内容的图像检索等。如何准确有效的识别物体,以满足日益增长集机器视觉,心理及实际应用需求,仍是一项具有挑战性的工作。研究表明,人类获取外部世界的信息,有60%来自视觉信息。计算机视觉领域中,视觉信息的表现形式主要为图像和视频,其中图像是视觉信息的主要载体。对图像进行分析,模拟人类视觉系统,对繁杂千万的物体进行认知识别,提取物体什么样的特征,并实现有效的物体表达,建立合理简便的物体模型,更加突出地去区分一个物体和另外一个物体,这些都是识别物体的核心问题。物体识别是计算机视觉领域中最话跃的研究课题之一,迅速和准确地识别出物体是一个重要的研究方向。物体识别往往受视角,尺度,遮挡,背景混杂等因素干扰,为应对这些挑战,很多学者提出利用局部特征对图像建立特征描述。基于局部关键点的特征包BOW表达方法在各种可视化分类任务中显示出良好的性能。传统的基于词袋模型的识别方法一般采用SIFT描述子、K均值聚类及分类器来实现。词袋模型的缺陷之一是前背景不分,用于形成BOW表达的视觉单词中,有些是提取于背景部分的。SIFT描述子提取特征点数量巨大,能很好抵抗尺度变换和旋转角度带来的影响,从数量上分析SIFT描述子能有效保证图像特征表达的充分性和鲁棒性。SIFT描述子作为局部特征描述算法中的代表也有其不足的方面,关键点的提取是基于整幅图像的,检测到的兴趣点很多来自于背景部分。而基于一般的兴趣点检测算子所检测的特征点存在数量不足的缺陷,使图像特征表达不够充分,但是往往检测到的特征点集中在目标位置。公开号为CN105654122A的专利文件公开了基于核函数匹配的空间金字塔物体识别方法。包含以下步骤:提取物体图像的ED-SIFT(EfficientDenseScale-invariantFeatureTransform)描述子;使用k-means++聚类算法将训练样本的ED-SIFT描述子聚类,获得视觉词典;引入空间金字塔,使用核函数匹配获得训练样本和测试样本的诗句单词直方图;使用SVM分类器完成训练样本的训练和测试样本识别。该方法提出的ED-SIFT描述子在关键点的提取是基于整幅图像的,检测到的兴趣点很多来自于背景部分,会造成前背景不分;另外K-means++聚类作为一种无监督学习算法,对异常数据敏感,一旦数据集中出现异常值会对实验结果造成不可小觑的影响;并且它依赖k值的选取,因而需要提前确定k值,而k值的选取对分类的影响至关重要,它的合适程度直接决定着分类的好坏。
技术实现思路
为了解决上述的技术问题,本专利技术针对常用的构建视觉词典的局部特征所表现的不稳定、不可靠或与物体无关的问题,提出一种基于显著区域词袋模型的物体识别方法。首先,该方法利用强角点检测器,确定图像的显著区域。然后,从显著区域中提取局部特征并建模为词袋模型,最后利用最近邻分类器给出识别结果。本专利技术提供一种基于显著区域词袋模型的物体识别方法,包括以下步骤:步骤1:角点检测;步骤2:定位图像的显著区域;步骤3:SIFT特征提取;步骤4:图像区域特征相似性比较。优选的是,所述角点为ShiTomasi角点,其通过计算梯度方向的变化率计算得到。在上述任一方案中优选的是,所述ShiTomasi角点是图像亮度变化剧烈或者曲率非常大的点。在上述任一方案中优选的是,所述步骤2为将定位图像关键区域转换为图像中角点分布的区域。在上述任一方案中优选的是,所述定位方法为:将图像分为m×n块,统计每块中角点的数量,将每块包含的角点数量记录一个m×n矩阵中。如果分块内角点数量≥q,认为角点所在连续集中区域为图像关键区域,其中q为判断分块内角点数量的阈值,用来筛选包含孤立或少量角点的背景区域。在上述任一方案中优选的是,所述步骤3包括DoG极值点提取和特征向量形成。在上述任一方案中优选的是,所述DoG极值点提取的方法为通过对原始图像进行尺度缩放,获取多尺度图像空间表示序列,完成不同分辨率上的特征提取。在上述任一方案中优选的是,所述尺度包括大尺度和小尺度中至少一种。在上述任一方案中优选的是,所述大尺度(低分辨率),体现物体的概貌特征。在上述任一方案中优选的是,所述小尺度(高分辨率),体现物体的细节特征。在上述任一方案中优选的是,一个图像的尺度空间L(x,y,σ)定义为原始图像I(x,y)与一个可变尺度的2维高斯函数G(x,y,σ)卷积运算。其中σ表示尺度大小,高斯函数定义如下:高斯卷积核与原图像卷积,得到尺度空间,定义为:L(x,y,σ)=G(x,y,σ)*I(x,y)为在多尺度空间上找到稳定的关键点,首先需要构建图像金字塔,然后在金字塔的每一层相邻作差构建出高斯差分尺度空间(DOG),D(x,y,σ)=(G(x,y,kσ)-G(x,y,σ))*I(x,y)=L(x,y,kσ)-L(x,y,σ)在上述任一方案中优选的是,采用梯度直方图统计法,极值点为原点,统计一定区域内像素点对极值点方向生成所作的贡献。直方图共36柱,每10度为一柱,将邻域内点的幅值按照角度所对应的柱加到直方图里,柱的长短代表了梯度幅值的大小。在上述任一方案中优选的是,所述特征向量形成的方法为通过DoG尺度空间求得极值点,使其具备尺度不变性,利用极值点邻域像素的梯度方向分布特性,经直方图统计确定极值点的主方向,为每个极值点指定方向参数,从而获得旋转不变性。利用下面计算每个像素的梯度幅值m(x,y)和梯度方向θ(x,y):在上述任一方案中优选的是,建立关键点描述向量之前,首先旋转坐标轴至该关键点的主方向,以关键点为中心,统计4×4个子区域的梯度方向分布直方图。其中,每个子区域是4×4个像素点组成的图像块,子区域的总大小是16×16像素。在上述任一方案中优选的是,所述步骤4为对图像库中的图像进行训练和测试过程。在上述任一方案中优选的是,所述训练过程包括以下步骤:步骤a1:读入训练物体图片,确定图像的显著区域;步骤a2:在显著区域提取训练样本的SIFT特征,假如训练图片共有i幅,每幅图像的SIFT特征点个数为n1,n2,…,ni,提取的SIFT特征总数为(n1+n2+…+ni);步骤a3:用一个大小为(n1+n2+…+ni)×128.的原始训练矩阵来存放所有样本的SIFT特征,采用k均值聚类算法创建BOW模型所需的视觉词典。k为视觉词典的大小,即为BOW直方图的维数;步骤a4:在视觉词典上进行映射,统计训练图片的BOW直方图,毎幅图像由一个大小k维向量表示,所有的训练图片可用一个i*k维的新的特征矩阵来存储。在上述任一方案中优选的是,所述测试过程包括以下步骤:步骤b1:读入训练物体图片,确定图像的显著区域;步骤b2:在显著区域提取训练样本的SIFT特征,假如训练图片共有i幅,每幅图像的SIFT特征点个数为n1,n2,…,ni,提取的SIFT特征总数本文档来自技高网
...

【技术保护点】
一种基于显著区域词袋模型的物体识别方法,包括以下步骤:步骤1:角点检测;步骤2:定位图像的显著区域;步骤3:SIFT特征提取;步骤4:图像区域特征相似性比较。

【技术特征摘要】
1.一种基于显著区域词袋模型的物体识别方法,包括以下步骤:步骤1:角点检测;步骤2:定位图像的显著区域;步骤3:SIFT特征提取;步骤4:图像区域特征相似性比较。2.如权利要求1所述的基于显著区域词袋模型的物体识别方法,其特征在于:所述角点为ShiTomasi角点,其通过计算梯度方向的变化率计算得到。3.如权利要求2所述的基于显著区域词袋模型的物体识别方法,其特征在于:所述ShiTomasi角点是图像亮度变化剧烈或者曲率非常大的点。4.如权利要求1所述的基于显著区域词袋模型的物体识别方法,其特征在于:所述步骤2为将定位图像关键区域转换为图像中角点分布的区域。5.如权利要求4所述的基于显著区域词袋模型的物体识别方法,其特征在于:所述定位方法为:将图像分为m×n块,统计每块中角点的数量,将每块包含的角点数量记录一个m×n矩阵中。如果分块内角点数量...

【专利技术属性】
技术研发人员:袁家政刘宏哲郭燕飞
申请(专利权)人:北京联合大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1