一种针对视觉映射的稀疏高斯过程回归方法技术

技术编号:15297419 阅读:51 留言:0更新日期:2017-05-11 19:48
本发明专利技术提出了一种带有特征选择性能的高斯过程回归方法,解决了利用高斯过程回归解决视觉映射问题时存在特征输入维数过高和特征冗余的问题。该方法首先假设分布参数中与特征权重有关的参数满足拉普拉斯先验分布;接着再通过最大后验概率估计方法估计参数,这样使得与特征相关的权重存在稀疏性,即特征选择性;之后通过求解稀疏问题得到回归参数。当对新样本视觉估计时,直接利用稀疏回归参数进行特征选择并得到估计目标值。该方法简单有效,具有良好的性能。

A sparse Gauss process regression method for visual mapping

The invention provides a Gauss process regression method with feature selection performance, which solves the problem that the feature input dimension is too high and the feature redundancy is solved when the visual mapping problem is solved by using the Gauss process regression. Firstly, assuming Laplasse prior distribution parameters associated with the feature weight distribution parameters meet; then the maximum posteriori probability estimation method to estimate the parameters, so that the weight and the characteristics related to existing sparsity, i.e. feature selectivity; after by solving the sparse problem of regression parameters. When the new samples are visually estimated, the sparse regression parameters are selected to obtain the estimated target values. The method is simple, effective and has good performance.

【技术实现步骤摘要】

本专利技术属于计算机视觉
,涉及视觉映射技术,主要应用于头部姿态估计,视线跟踪和年龄估计等视觉估计问题中。
技术介绍
在计算机视觉中,视觉映射是指学习输入图像特征与输出变量之间映射函数的过程,以便在输入新图像时,估计该输入图像对应的目标输出值。具体来讲,视觉映射包括:人体姿态估计、头部姿态估计、视线估计和物体跟踪等。详见参考文献:O.Williams,A.Blake,andR.Cipolla,SparseandSemi-SupervisedVisualMappingwiththeS3GP,inIEEEConferenceComputeronComputerVisionandPatternRecognition,pp.230-237,2006.作为计算机视觉的一个重要分支,视觉映射改变了许多场合下由人逐一根据图像内容估计目标输出的情况。取而代之,由计算机根据输入图像内容,通过已有视觉映射函数预测输出,从而实现由摄像机和电脑代替人眼和大脑对图像进行全自动分析和估计。目前,该技术已开始被应用于与人们生活密切相关的多个产业。其中,头部姿态估计被应用于汽车安全驾驶产业,视线估计和人体姿态估计被应用于智能人机接口及游戏产业,物体跟踪被应用于智能交通等产业,人体姿态估计被应用于人机交互领域。相信随着计算机硬件处理能力的不断提高和视觉映射中关键技术问题的逐步解决,其应用前景将更加广阔。视觉映射问题实质是一个非线性映射拟合问题,解决该问题高斯过程回归模型被证实为一种有效的方法。它无需假设视觉特征和目标值之间满足某种具体的映射函数关系,而只是假设目标值的分布与输入特征分布相关,因此灵活性强。而现有的解决视觉映射问题的高斯过程方法通常没有特征选择功能,过于高维的输入特征常常会造成过拟合问题。参考文献:ChristopherM.Bishop,PatternRecognitionandMachineLearning,Springer,2006。
技术实现思路
本专利针对此问题提出了一种基于特征选择的高斯过程回归方法,该方法直接对输入图像特征进行选择,并且选择的特征是最适合后续目标值估计的,这样有助于提高视觉映射的总体估计性能。为了方便地描述本
技术实现思路
,首先对一些术语进行定义。定义1:视觉映射。对图像提取视觉特征,并将视觉特征映射到对应的目标值(见图1)。例如:头部姿态估计是一个视觉映射问题,对包含头部的图像提取梯度方向直方图特征,并将该特征映射到姿态角度。定义2:梯度方向直方图特征。利用像素强度梯度或边缘的方向分布描述一幅图像中的物体的表象和形状的视觉特征提取方法。其实现方法先将图像分成小的叫做方格单元的连通区域;然后采集方格单元中各像素点的梯度方向或边缘方向直方图;最后把这些直方图组合起来就可以构成特征描述子。为了提高精确度,还可以把这些局部直方图在图像的更大的区间(block)中进行对比度归一化(contrast-normalized),此方法通过先计算各直方图在这个区间(block)中的密度,然后根据这个密度值对区间中的各个方格单元做归一化。通过该归一化能对光照变化和阴影有更强的鲁棒性。定义7:回归函数。由未知参数构成的与输入变量有关的函数,用于估计输出值。定义8:高斯过程先验。对于任意函数y(x),对x的任意观测值x1,…,xN,对应的函数值构成向量[y(x1),…,y(xN)]都满足多维高斯分布,则函数y(x)满足高斯过程先验。定义9:高斯过程回归。已知N个输入观测向量x1,x2,…xN和其对应的输出观测值y1,y2,…yN,高斯过程回归假设输入与输出之间存在下述关系:tn=y(xn)+εnh(·)为回归函数,εn为噪声,同时假设由x1,x2,…xN处的函数值构成的向量y=[y(x1),…,y(xN)]满足零均值的多维高斯分布,其中,X为所有输入特征集合[x1,x2,…xN],K为高斯分布的协方差,K的第m行n列元素为:D为观测向量xn的维数,为xm的第i个元素,为xn的第i个元素,参数为θ={θ0,θ1,θ2,η1,…,ηD本文档来自技高网
...
一种<a href="http://www.xjishu.com/zhuanli/55/201611181324.html" title="一种针对视觉映射的稀疏高斯过程回归方法原文来自X技术">针对视觉映射的稀疏高斯过程回归方法</a>

【技术保护点】
一种针对视觉映射的稀疏高斯过程回归方法,该方法包括:步骤1:采集针对某视觉映射问题的N幅图像,同时记录目标值tn,下标n表示第n幅图像对应的姿态。步骤2:对采集的图像进行彩色图像转灰度图像的处理,若采集图像已经为灰度图像则无需在进行转化处理;步骤3:将输入图像归一化为固定大小的图像,对每一幅输入图像提取梯度方向直方图特征;步骤4:将所有的N幅图像对应的梯度方向直方图特征向量在列方向上,按顺序排列可以得到输入数据矩阵X,即X=[x1,x2,...,xN];步骤5:将N幅图像对应的目标值按顺序排列为目标值向量t;步骤6:假设视觉特征与其对应的目标值之间存在以下高斯过程回归关系:tn=y(xn)+εn,εn~N(0,σ2)xn和tn为第n个样本对应的视觉特征和目标值,y(xn)是回归函数,εn为随机噪声变量,服从均值为0方差为σ2的高斯分布;步骤7:假设步骤6中的回归函数输出值满足高斯过程先验,即:其中为输入图像视觉特征集合,D表示输入图像特征的维数,N为图像的总个数,为零向量,K为大小N×N的协方差矩阵,其第m行n列的元素k(xn,xm)表示回归函数在xn和xm处,即y(xn)和y(xm)的协方差k(xn,xm)=θ0exp{-12Σi=1Dηi(xmi-xni)2}+θ1+θ2Σi=1Dxmixni]]>xmi为xm的第i个元素,xni为xn的第i个元素,参数为θ={θ0,θ1,θ2,η1,...,ηD}决定核函数的具体形式;步骤8:根据步骤6中变量tn和回归函数y(xn)之间的关系,可以得到p(t|y,σ2)的满足分布IN有N个对角线元素的单位矩阵,再根据步骤7中对回归函数输出值的高斯过程先验假设,得到输入图像特征X已知条件下t的分布函数:令根据正态分布的表达式并对上式取对数得到ln p(t|X,θ,σ2)=-12ln|K~|-12tTK~-1t-N2ln2π]]>步骤9:假设步骤7中与协方差矩阵计算有关的参数η=(η1,...,ηD)T都符合相同的拉普拉斯先验分布p(ηd)=12bexp(-|ηd|b)]]>其中b为控制拉普拉斯分布的宽度;步骤10:根据最大后验概率分布和贝叶斯定理p(θ|X,t,σ2)∝p(t|X,θ,σ2)p(θ)建立目标函数,由于对参数的先验假设p(θ)只包含p(η)部分,因此最大后验概率下的目标函数为:ln p(t|X,θ,σ2)+ln p(η)步骤11:根据步骤8中ln p(t|X,θ,σ2)的表达式,代入步骤10中的目标函数得到-12ln|K~|-12tTK~-1t-N2ln2π-D2lnb-1b||η||1]]>其中D为输入图像特征的维数;步骤14:为了寻找使得后验概率分布p(θ|X,t,σ2)取最大值时的参数θ,σ2,利用Nesterov梯度法求解参数θ和σ2;步骤15:给定待估计目标值的图像(对于头部姿态估计,估计目标值是头部姿态,输入图像为头部图像;对于视线估计,估计值是视线方向,输入图像为眼部图像),按照步骤2中的方法提取图像梯度方向直方图特征x*,可得到所有观测值t=[t1,...,tN]和目标值t*的联合分布函数如下:其中k*=(k(x1,x*),...,k(xN,x*))T;根据上式,可以求得p(t*|X,t,x*,θ,σ2)服从高斯分布,下标*表示和待估计样本有关的参数或变量,均值μ*与方差如下表示μ*=k*TK~-1t]]>σ*2=k(x*,x*)-k*TK~-1k*+σ2]]>将μ*作为对待估计输入图像特征x*的对应的目标值t*的估计值。...

【技术特征摘要】
1.一种针对视觉映射的稀疏高斯过程回归方法,该方法包括:步骤1:采集针对某视觉映射问题的N幅图像,同时记录目标值tn,下标n表示第n幅图像对应的姿态。步骤2:对采集的图像进行彩色图像转灰度图像的处理,若采集图像已经为灰度图像则无需在进行转化处理;步骤3:将输入图像归一化为固定大小的图像,对每一幅输入图像提取梯度方向直方图特征;步骤4:将所有的N幅图像对应的梯度方向直方图特征向量在列方向上,按顺序排列可以得到输入数据矩阵X,即X=[x1,x2,...,xN];步骤5:将N幅图像对应的目标值按顺序排列为目标值向量t;步骤6:假设视觉特征与其对应的目标值之...

【专利技术属性】
技术研发人员:潘力立
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1