基于多线索归一化非负稀疏编码器的图像快速特征表示方法技术

技术编号:12655215 阅读:190 留言:0更新日期:2016-01-06 13:30
本发明专利技术基于多线索归一化非负稀疏编码器的图像快速特征表示方法,具体步骤为:图像的局部特征提取:将数据集中每幅图像稠密地提取SIFT特征和颜色矩特征;从所提取的所有SIFT、颜色矩特征中,随机地选取若干对,以K-均值聚类的方法得到码书;利用求解得到的码书,按照基于多线索归一化非负稀疏编码编码器的松弛模型,优化求解编码器参数。测试阶段:利用训练过程得到的编码器,在对一幅图像进行特征表示时,仅提取一副输入图像的SIFT特征,利用编码器计算SIFT特征的编码系数,将所有编码系数按照空间金字塔最大池化的方式进行整合,所得到的高维的特征向量就是该图像的特征向量;利用所得的图像特征表示,进一步用于各种图像分类/检索等智能分析应用当中。

【技术实现步骤摘要】

: 本专利技术设及计算机视觉图像处理
,具体设及一种基于多线索归一化非负 稀疏编码器的图像快速特征表示方法。
技术介绍
: 生物学研究表明,哺乳动物的初级视皮层对外界刺激的响应满足稀疏性,即只有 少数的神经元被激活,相应的编码应该为稀疏编码。稀疏编码,通俗地说,就是将一个信号 表示为一组基的组合,而且要求只需要少数的几个基就可W将信号重构出来。稀疏编码已 经广泛应用到计算机视觉、图像信号处理等领域,例如,信号重构、信号去噪、图像特征提 取、W及分类等应用。 传统的稀疏编码方法是基于最小均方误差意义下的重构,也就是使得重构误差尽 可能小,同时,尽可能使得相应的编码系数稀疏化。由于稀疏编码之后的过程通常是最大池 化(maxpooling)。运使得负数编码系数直接被忽略,造成了信息泄漏。在传统的稀疏编 码基础之上,添加非负约束,引入了非负稀疏编码。在非负稀疏编码基础之上,进一步添加 平移不变形约束,得到所谓的归一化非负稀疏编码。一方面使得稀疏编码系数的解释性得 到加强,另一方面自动地使得传统的稀疏约束参数消失,避免了繁杂的参数调节过程。归一 化非负稀疏编码的精确求解复杂度较高,不适合大规模的图像应用。通过使用自编码器模 型,学习得到归一化非负稀疏编码的编码器,从而在编码过程中避免了迭代求解的过程,因 此求解归一化非负稀疏编码只需要计算矩阵与矩阵乘法,W及一些非线性激活函数操作, 从而大大增加了编码速度。 稀疏编码的基本理论模型: 阳00引 乂E腺4'记作N个D维的局部特征,友e吸。xM表示含有M个基元的码书,Ce肢'"xy 表示对应的编码系数。并且X中第i个局部特征表示为Xi,其对应的编码系数为Ci。传统 的稀疏编码模型目标在于优化W下的目标函数: 其中入为L1范数的稀疏约束参数,通过调节A,可W达到控制Ci稀疏程度的目 的。 非负稀疏编码模型的目标函数在此基础之上,对于编码系数额外添加了非负约 束: 其中Ci(j)表示向量Ci的第j个分量。W上两种编码方式,都需要手工调节入, 来达到控制稀疏度的目的。在非负稀疏编码的基础上,我们进一步添加平移不变性约束,来 达到归一化非负稀疏编码:阳012] 其中1为元素全部为1的M维列向量,Ci(j)为向量Ci的第j个分量。由于非负 约束和平移不变性约束的联合作用,使得Ci的L1范数变成常数1,因此最后一项可W省略 掉,从来达到了自适应的控制稀疏度的目的。尽管归一化非负稀疏编码的目标函数中没有 显示的稀疏约束(L1范数正则项),但是根据带约束凸优化的边界条件,归一化非负稀疏编 码的结果通常都是稀疏的。 如图1所示,图1分析了稀疏编码,局部限定性编码,归一化非负稀疏编码的编码 方案示意图。稀疏编码的结果趋向于局部性,但是并不严格地是局部性结果;局部限定性编 码挑选几个临近的码字去重构输入局部特征;尽管归一化非负稀疏编码的目标函数里面没 有显式的局部约束,事实上,它在目标函数里面从另一个角度隐含了局部约束。局部限定性 编码强制重构局部特征在输入局部特征的局部子空间中,因为它选择的基都是非常接近输 入局部特征的。而归一化非负稀疏编码仅仅允许重构局部特征存在于由所选择的基扩展成 的单纯形(simplex)之中。
技术实现思路
: 本专利技术的目的在于针对现有技术的不足,提供了一种基于多线索归一化非负稀疏 编码器的图像快速特征表示方法,用于改进单线索归一化非负稀疏编码的特征表达能力, 同时不增加任何计算复杂度。 为达到上述目的,本专利技术采用如下技术方案予W实现的: ,包括W下步骤: 1)对待处理的图像数据集中所有图像分别稠密地提取SIFT特征和颜色矩特征或 者HOG特征和颜色矩特征; 阳01引 2)对待处理的图像数据集中所有图像提取完SIFT特征后,随机地选取5万至50 万的SIFT特征和颜色矩特征,分别求解出待处理的图像数据集的SIFT特征码书和颜色矩 特征码书; 3)建立基于多线索归一化非负稀疏编码编码器的松弛模型; 4)利用步骤2)中求解得到的码书,按照步骤3)中建立的基于多线索归一化非负 稀疏编码编码器的松弛模型,求解松弛模型的参数,得到基于多线索归一化非负稀疏编码 编码器; 5)利用求解得到的基于多线索归一化非负稀疏编码编码器,对所有的SIFT特征 进行编码; 6)对图像数据集中每张图像的编码进行空间金字塔最大池化方法整合,得到每张 图像的特征向量。[002引本专利技术进一步的改进在于,步骤2)中,WK-均值聚类的方法分别求解出待处理的 图像数据集的SIFT特征码书和颜色矩特征码书。 本专利技术进一步的改进在于,步骤3)中,基于多线索归一化非负稀疏编码编码器的 松弛模型目标函数如下: 阳0巧] 其中,Xi,分别表示其中第i个SIFT特征和颜色矩特征,及巨龄气P€妒'"表示 对应于两种局部特征的含有M个基元的码书,山Dy分别表示SIFT特征和颜色矩特征的维 度,Z为引入的松弛变量矩阵,维度为MXN,Zi为对应于第i个局部特征的M维松弛变量向 量,fe(?)为编码器的表达式,0为编码器的参数,包括Wl,W2,bl,b2,e,丫分别为控制松 弛变量的稀疏度和编码器输出与松弛变量的逼近度的超参数; 使用两层神经网络模型来表示编码器fe( ?),即 f0(X)=softmax(W2(sigmoid(WiX+bi)+b2))其中,Wi,bi分别为两层神经网络模型中第一层的权重系数和偏置系数;W2,b2分别 为两层神经网络模型中第二层的权重系数和偏置系数,X为两层神经网络模型的输入SIFT 特征。 本专利技术进一步的改进在于,步骤4)中,采用交替优化的策略求解参数0,z,具体 方法如下: 401)固定参数0,求解参数Z,公式如下: 使用梯度下降法对上述公式进行优化; 402)固定参数Z,求解参数0,公式如下: 使用梯度下降法对上述公式进行优化;403)交互迭代步骤401)和402),直至收敛;最终求得多线索归一化非负稀疏编码 的编码器fe(X)。 本专利技术进一步的改进在于,步骤5)中,利用求解得到的基于多线索归一化非负稀 疏编码编码器fe(X),对输入图像的所有SIFT特征进行编码。 相对于现有技术,本专利技术具有如下的优点: 本专利技术使用自编码器模型,通过在编码器参数学习阶段,输入多种类型局部特征 进行训练,期望得到的归一化非负稀疏编码的编码系数,能够同时"记忆"多种特征信息,进 而能够进一步提升图像的特征表达能力;在图像编码阶段,在某些类型的局部特征不可获 得的前提下(例如灰度图不能够得到颜色矩特征),通过仅仅提取一种局部特征(SIFT)便 可得到接近于输入多种特征(SIFT和颜色矩特征)的特征表示。同时相较于单线索的归一 化非负稀疏编码来说,编码过程完全一致,不增加任何计算量。使用本专利技术的多线索归一化 非负稀疏编码器能够快速地获得判别力较强的图像特征表示。具体来说,本专利技术在单线索归一化非负稀疏编码的基础上,提出了多线索归一化 非负稀疏编码模型,使得图像的最终特征表达能力进一步增强。并且,推导证明了多线索归 一化非负稀疏编码器的优化与单线索完全等价。本专利技术使用松弛自编码器模型,优化求解 多线索归一化非负稀疏编码器参数。本专利技术使用学习得到的多线索非负稀疏编码器,在图 像编码阶段,只本文档来自技高网
...

【技术保护点】
基于多线索归一化非负稀疏编码器的图像快速特征表示方法,其特征在于,包括以下步骤:1)对待处理的图像数据集中所有图像分别稠密地提取SIFT特征和颜色矩特征或者HOG特征和颜色矩特征;2)对待处理的图像数据集中所有图像提取完SIFT特征后,随机地选取5万至50万的SIFT特征和颜色矩特征,分别求解出待处理的图像数据集的SIFT特征码书和颜色矩特征码书;3)建立基于多线索归一化非负稀疏编码编码器的松弛模型;4)利用步骤2)中求解得到的码书,按照步骤3)中建立的基于多线索归一化非负稀疏编码编码器的松弛模型,求解松弛模型的参数,得到基于多线索归一化非负稀疏编码编码器;5)利用求解得到的基于多线索归一化非负稀疏编码编码器,对所有的SIFT特征进行编码;6)对图像数据集中每张图像的编码进行空间金字塔最大池化方法整合,得到每张图像的特征向量。

【技术特征摘要】

【专利技术属性】
技术研发人员:王进军张世周龚怡宏石伟伟
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1