基于归一化非负稀疏编码器的图像快速特征表示方法技术

技术编号:12743066 阅读:86 留言:0更新日期:2016-01-21 10:24
本发明专利技术基于归一化非负稀疏编码器的图像快速特征表示方法,其实现步骤为:将数据集中图像稠密地提取SIFT特征;随机地选取若干个SIFT特征,以K-均值聚类的方法得到码书;利用得到的码书,按照基于归一化非负稀疏编码编码器的松弛模型,优化求解编码器参数;利用求解得到的编码器,将输入图像的SIFT特征的归一化非负稀疏编码系数计算出来,将编码系数按照空间金字塔最大池化的方式进行整合,所得到的高维的特征向量就是该图像的特征向量;利用得到的图像特征表示,可以进一步用于图像分类/检索等应用当中。本发明专利技术的编码方法所得到的编码判别性强,编码过程无需调节参数,编码速度相比较于传统方法大大提升,可以用于图像分类/检索等任务。

【技术实现步骤摘要】

: 本专利技术涉及计算机视觉图像处理
,具体涉及一种基于归一化非负稀疏编 码器的图像快速特征表示方法。
技术介绍
: 生物学研究表明,哺乳动物的初级视皮层对外界刺激的响应满足稀疏性,即只有 少数的神经元被激活,相应的编码应该为稀疏编码。稀疏编码,通俗地说,就是将一个信号 表示为一组基的组合,而且要求只需要少数的几个基就可以将信号重构出来。稀疏编码已 经广泛应用到计算机视觉、图像信号处理等领域,例如,信号重构、信号去噪、图像特征提 取、以及分类等应用。 传统的稀疏编码方法是基于最小均方误差意义下的重构,也就是使得重构误差尽 可能小,同时,尽可能使得相应的编码系数稀疏化。由于稀疏编码之后的过程通常是最大池 化(max pooling)。这使得负数编码系数直接被忽略,造成了信息泄漏。在传统的稀疏编码 基础之上,添加非负约束,引入了非负稀疏编码。 稀疏编码的基本理论模型: Z e ΚβχΛ记作N个D维的局部特征,S e彼_表示含有M个基元的码书, 表示对应的编码系数。并且X中第i个局部特征表示为X1,其对应的编码系数为C1。传统 的稀疏编码模型目标在于优化以下的目标函数: 其中λ为Ll范数的稀疏约束,通过调节λ,可以控制Ci的稀疏度。 非负稀疏编码模型在此基础之上,对于编码系数添加了非负约束: 以上两种编码方式,都需要手工调节λ,来达到控制稀疏度的目的。
技术实现思路
: 本专利技术的目的在于改进传统稀疏编码的特征表达能力,自适应地调节参数。同时 使用自编码器模型,学习得到归一化非负稀疏编码的编码系数,大大提升编码效率,从而能 够快速得到图像的特征表示。 为达到上述目的,本专利技术采用如下技术方案: ,包括以下步骤: 1)对待处理的图像数据集中所有图像分别稠密地提取SIFT特征; 2)对待处理的图像数据集中所有图像提取完SIFT特征后,随机地选取5万至50 万的SIFT特征,求解出待处理的图像数据集的码书; 3)建立基于归一化非负稀疏编码编码器的松弛模型; 4)利用步骤2)中求解得到的码书,按照步骤3)中建立的基于归一化非负稀疏编 码编码器的松弛模型,求解松弛模型的参数,得到基于归一化非负稀疏编码编码器; 5)利用求解得到的基于归一化非负稀疏编码编码器,对所有的SIFT特征进行编 码; 6)对图像数据集中每张图像的编码进行空间金字塔最大池化方法整合,得到每张 图像的特征向量。 本专利技术进一步的改进在于,步骤2)中,以K-均值聚类的方法求出待处理的图像数 据集的码书。 本专利技术进一步的改进在于,步骤3)中,基于归一化非负稀疏编码编码器的松弛模 型目标函数如下: 其中,ZeIfxiv记作N个D维的局部特征,X1表示其中第i个样本,Sef xli表示含 有M个基元的码书,Z为引入的松弛变量,fe (·)为编码器的表达式,Θ为编码器的参数, 包括W1, W2A1J2, β,γ分别为控制松弛变量的稀疏度和编码器输出与松弛变量的逼近度 的超参数; 使用两层神经网络模型来表示编码器f e ( ·),即 f ο (x) = soft max (W2 (sig mo id (WiX+bi)+b2)) 其中,W1, Id1分别为两层神经网络模型中第一层的权重系数和偏置系数;W2, b2分别 为两层神经网络模型中第二层的权重系数和偏置系数,X为两层神经网络模型的输入SIFT 特征。 本专利技术进一步的改进在于,步骤4)中,采用交替优化的策略求解参数Θ,Ζ,具体 方法如下: 401)固定参数Θ,求解参数Ζ,公式如下: 使用梯度下降法对上述公式进行优化; 402)固定参数Ζ,求解参数Θ,公式如下: 使用梯度下降法对上述公式进行优化; 403)交互迭代步骤401)和402),直至收敛;最终求得归一化非负稀疏编码的编码 器 f 〇 (X)。 本专利技术进一步的改进在于,步骤5)中,利用求解得到的基于归一化非负稀疏编码 编码器f e (X),对所有的SIFT特征进行编码。 相对于现有技术,本专利技术具有如下的优点: 传统稀疏编码方法需要手工调节控制稀疏程度的参数,本专利技术提出了归一化非负 稀疏编码方法,能够自适应的控制稀疏度,避免了繁琐的参数调节过程;研究表明,局部限 定约束的编码结果相较于稀疏约束来说更加平滑和鲁棒,本专利技术提出的归一化非负稀疏编 码模型,隐式地包含了局部限定约束条件,因此编码结果也更加鲁棒。具体来说,本专利技术使 用稠密SIFT特征,采用归一化非负稀疏编码器进行编码,之后对图像进行空间金字塔池化 (SPM Max pooling),从而形成整幅图像的特征表示,其核心耗时模块即编码模块的速度被 大大提升,这使得本专利技术提出的图像特征表示方法易于被使用与大规模的实时应用当中。 进一步,本专利技术使用松弛的自编码器模型,使得学习得到的非负稀疏编码的编码 器的结果更加平滑。 进一步,传统的稀疏编码模型在编码过程中需要迭代求解,计算复杂度较高,不宜 用于实时应用当中,本专利技术所提出的归一化非负稀疏编码器,对于输入的SIFT特征直接前 向计算得到编码系数,大大降低了编码复杂度。【附图说明】: 图I (a)至(c)分别为稀疏编码、局部限定性编码及归一化非负稀疏编码的编码示 意图。 图2为本专利技术基于归一化非负稀疏编码的图像分类方法的流程图。 图3为空间金字塔最大池化示意图。 图4为学习编码器参数的自编码器网络示意图;其中,图4(a)为自编码器网络结 构示意图,图4(b)为某个输入的SIFT特征编解码过程示例。【具体实施方式】: 本专利技术在非负稀疏编码基础之上,进一步添加平移不变形约束。一方面使得稀疏 编码系数的解释性得到加强,另一方面自动地使得传统的稀疏约束参数消失,避免了繁杂 的参数调节过程。此外,本专利技术进一步使用自编码器模型,通过学习得到归一化非负稀疏编 码的编码器,从而在编码过程中避免了迭代求解的过程。求解归一化非负稀疏编码只需要 计算矩阵与矩阵乘法,以及一些非线性激活函数操作,从而大大增加了编码速度。 本专利技术,包括以下几个步 骤: (1)对每一幅图片按照的一定大小的像素块,例如16X16,一定大小的步长,例如 6像素的上下和左右滑动步长,稠密地提取SIFT特征,所提取的特征为128维的列向量;事 实上,也可以提取HOG等图像的局部特征。 (2)对待处理的图像数据集中所有图像提取完SIFT特征后,随机地选取5万至50 万的SIFT特征,使用K-均值方法或者其他带约束的目标函数优化方法,求解出待处理的图 像数据集的码书; (3)推导建立基于归一化非负稀疏编码编码器的松弛模型; 在非负稀疏编码的基础上,我们进一步添加平移不变性约束,来达到归一化非负 稀疏编码: 其中记作N个D维的局部特征,表示含有M个基元的码书, C e R^v表示对应的编码系数。并且X中第i个局部特征表示为X1, X1对应的编码系数为 Cpl为元素全部为1的M维列向量,C1Cj)为向量C1的第j个分量。...

【技术保护点】
基于归一化非负稀疏编码器的图像快速特征表示方法,其特征在于,包括以下步骤:1)对待处理的图像数据集中所有图像分别稠密地提取SIFT特征;2)对待处理的图像数据集中所有图像提取完SIFT特征后,随机地选取5万至50万的SIFT特征,求解出待处理的图像数据集的码书;3)建立基于归一化非负稀疏编码编码器的松弛模型;4)利用步骤2)中求解得到的码书,按照步骤3)中建立的基于归一化非负稀疏编码编码器的松弛模型,求解松弛模型的参数,得到基于归一化非负稀疏编码编码器;5)利用求解得到的基于归一化非负稀疏编码编码器,对所有的SIFT特征进行编码;6)对图像数据集中每张图像的编码进行空间金字塔最大池化方法整合,得到每张图像的特征向量。

【技术特征摘要】

【专利技术属性】
技术研发人员:张世周王进军龚怡宏石伟伟
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1