一种基于混合组回归方法的视觉映射方法技术

技术编号:13338101 阅读:123 留言:0更新日期:2016-07-13 10:14
该发明专利技术公开了一种基于混合组回归方法的视觉映射方法,属于计算机视觉技术领域,涉及混合回归技术。本发明专利技术以头部姿态估计问题为例进行具体说明。首先对采集到的头部图像进行梯度方向直方图特征提取,并记录对应的头部姿态;之后,在输入梯度方向直方图和对应头部姿态之间建立混合组回归模型;接着,初始化混合组回归模型,根据初始化聚类中心划分分组,并求解回归参数;最后,在给定一个待估计头部图像时,提取图像的梯度方向直方图特征,再利用已学到的混合组回归模型估计头部姿态。提高了在头部姿态估计的鲁棒性。

【技术实现步骤摘要】

本专利技术属于计算机视觉
,涉及混合回归技术,主要应用于姿态估计,视线跟踪和年龄估计等视觉估计问题中。
技术介绍
在计算机视觉中,视觉映射是指学习输入图像特征与输出变量之间映射函数的过程,以便在输入新图像时,估计该输入图像对应的目标输出值。具体来讲,视觉映射包括:人体姿态估计、头部姿态估计、视线估计和物体跟踪等。详见参考文献:O.Williams,A.Blake,andR.Cipolla,SparseandSemi-supervisedVisualMappingwiththeS3GP,inIEEEConferenceComputeronComputerVisionandPatternRecognition,pp.230-237,2006.作为计算机视觉的一个重要分支,视觉映射改变了许多场合下由人逐一根据图像内容估计目标输出的情况。取而代之,由计算机根据输入图像内容,通过已有视觉映射函数预测输出,从而实现由摄像机和电脑代替人眼和大脑对图像进行全自动分析和估计。目前,该技术已开始被应用于与人们生活密切相关的多个产业。其中,头部姿态估计被应用于汽车安全驾驶产业,视线估计和人体姿态估计被应用于智能人机接口及游戏产业,物体跟踪被应用于智能交通等产业。相信随着计算机硬件处理能力的不断提高和视觉映射中关键技术问题的逐步解决,其应用前景将更加广阔。混合回归模型最早由多伦多大学的GeoffreyHinton和加州大学伯克利分校的r>MichealJordan在1991年提出,原始模型假设输出变量服从混合高斯分布,并且认为属于不同高斯的输入和输出数据之间存在局部线性映射关系。近几年,INRIA研究机构的BillTriggs成功地将混合回归模型应用人体姿态估计问题,并假设输入特征和输出变量联合服从混合高斯分布,从而建立从输入图像特征到人体姿态的概率估计模型。详见参考文献:A.AgarwalandB.Triggs,MonocularHumanMotionCapturewithaMixtureofRegressors,inIEEEWorkshoponVisionforHumanComputerInteractioninConjunctionwithIEEEConferenceonComputerVisionandPatternRecognition,pp.72-80,2005.在用于视觉映射问题的模型中,混合回归模型已被证实为解决该问题最好的模型之一。由于其高准确性、低复杂度和强通用性,混合回归模型也是目前被最为广泛应用的模型。近年来,国外很多学者将研究集中在如何克服以上缺陷,提高现有基于混合回归视觉映射模型的准确性,尤其是在有干扰和噪声存在情况下的鲁棒性。然而,现有研究工作大都存在建模和解法上的不足,还需要进行深入的研究和完善。此外,国内在该领域也开始有少量研究工作出现,但多数研究还处于起步阶段。
技术实现思路
本专利技术提供了一种基于混合组回归方法的视觉映射方法,本专利以头部姿态估计问题为例进行具体说明。首先对采集到的头部图像进行梯度方向直方图特征提取,并记录对应的头部姿态;之后,在输入梯度方向直方图和对应头部姿态之间建立混合组回归模型;接着,初始化混合组回归模型,根据初始化聚类中心划分分组,并求解回归参数;最后,在给定一个待估计头部图像时,提取图像的梯度方向直方图特征,再利用已学到的混合组回归模型估计头部姿态。算法示意图参见图3。为了方便地描述本
技术实现思路
,首先对一些术语进行定义。定义1:头部姿态。在三维空间中头部旋转的角度通常由一个向量表示,该向量由三个元素构成,第一个元素为俯仰角,第二个元素为偏航角,第三个元素为旋转角。定义3:俯仰角。在图2(b)所示的x-y-z坐标系中,俯仰角是指以x轴为中心旋转的角度θ。定义3:偏航角。在图2(a)所示的x-y-z坐标系中,偏航角是指以z轴为中心旋转的角度φ。定义4:旋转角。在图2(c)所示的x-y-z坐标系中,旋转角是指以z′为中心旋转的角度Ψ。定义5:梯度方向直方图特征。利用像素强度梯度或边缘的方向分布描述一幅图像中的物体的表象和形状的视觉特征提取方法。其实现方法先将图像分成小的叫做方格单元的连通区域;然后采集方格单元中各像素点的梯度方向或边缘方向直方图;最后把这些直方图组合起来就可以构成特征描述子。为了提高精确度,还可以把这些局部直方图在图像的更大的区间(block)中进行对比度归一化(contrast-normalized),此方法通过先计算各直方图在这个区间(block)中的密度,然后根据这个密度值对区间中的各个方格单元做归一化。通过该归一化能对光照变化和阴影有更强的鲁棒性。定义6:高斯分布。又名正态分布,是一个在数学、物理及工程等领域都非常重要的概率分布。具体是指:对于任意随机变量x,若其概率密度函数满足其中μ为正态分布的中心,σ为正态分布的方差,则称其满足高斯分布,常用符号表示。若随机变量为向量x,则对应高维高斯分布μ为高维正态分布的中心,Σ为高维正态分布的协方差,或记为定义7:混合高斯分布。是指随机变量服从由多个高斯函数混合组成的分布函数,即:其中K为高斯分布的个数,z为指示变量x属于哪一个高斯分布的隐变量。z为一个K维的状态向量,该向量只有一个元素为1,其余元素为0,当第k个元素zk为1时,则表示x属于第k个高斯分布。p(z)表示隐变量z的出现概率,该概率通常用符号πk表示,即:p(zk=1)=πk。定义8:隐变量。无法被观测到的变量,例如在混合高斯分布中,z指示变量x属于哪一个高斯分布,无法被观测即为隐变量。定义9:混合系数。在混合高斯分布中代表变量x属于某一高斯分布的概率,即πk为混合系数。定义10:线性回归。是指输出变量(向量)y和输入变量(向量)x之间存在线性映射关系,即:y=ATx+b,其中AT代表回归矩阵,b代表偏差向量。定义11:混合回归关系。是指输出变量(向量)y和输入变量(向量)x之间存在非线性映射关系,即:其中代表第k个回归矩阵,bk代表第k个偏差向量。πk(x)表示x属于某一线性回归模型的概率。定义12:似然函数。似然函数是一种关于统计模型中的参数的函数,表示模型参数的似然性或可能性。定义13:期望最大值算法。一种求解混合高斯分布参数似然函数最大值的优化方法,它通常包含两个基本的步骤,即:期望步骤(E步)和最大化步骤(M步)。定义14:Q函数。在求解混合高斯分布似然函数最大值的期望最大值算法中,Q函数为似然函数的下界函数。定义15:本文档来自技高网...

【技术保护点】
一种基于混合组回归方法的视觉映射方法,具体步骤如下:步骤1:采集N幅包含不同姿态的头部图像,并根据采集每幅图像时各图像对应的头部俯仰、偏航和旋转角,即头部姿态做记录,yn的第一维表示俯仰角,第二维表示倾斜角,第三维表示旋转角,下标n表示第n幅图像对应的姿态;步骤2:将彩色图像转换为灰度图像,若采集图像已为灰度图像则无需进行转化;步骤3:将步骤2中得到图像的头部区域进行尺寸归一化处理,并提取梯度方向直方图特征,并记任意第n幅图像对应的梯度方向直方图特征向量步骤4:将所有N幅图像对应的梯度方向直方图特征向量按顺序排列可以得到输入数据矩阵X,即X=[x1,x2,…,xN];步骤5:将N幅图像对应的头部姿态向量按顺序排列为数据矩阵Y,即Y=[y1,y2,…,yN];步骤6:头部姿态估计问题中,所有输入特征和输出姿态联合服从混合高斯分布,因此任一输入输出观测对{xn,yn}的概率分布为:各高斯分布中心、协方差和混合系数,分别用符号μk,∑k和πk表示,其中下角标k表示第k个高斯分布,为隐变量,决定第n个观测样本{xn,yn}属于哪一个高斯,Θ表示此混合回归模型中的所有参数;同时,已知{xn,yn}属于某一高斯的条件下,输入与输出之间存在线性回归关系,回归参数为参数矩阵Ak,偏差向量bk和噪声方差水平γk,即:其中为单位矩阵;根据上述假设,最后得到,参数Θ={μk,∑k,πk,Ak,bk,γk};另外,由上述假设可以推断输入梯度方向直方图特征也分别服从混合高斯分布,即:其中表示输入特征的各高斯分布中心和协方差;由输入和输出之间的线性关系,可知:步骤7:为了提高混合回归模型的鲁棒性,假设上述聚类可以分为不同的L个分组,即这里代表属于第l个组的聚类标号;并假设同组聚类对应的回归参数Ak有相同的先验假设,即:其中表示高斯先验的均值,τlIDH代表协方差矩阵。这样假设的依据是同一组的聚类为数据 流形分布上邻近的聚类,具有相似的输入输出映射关系;同时,我们假设分组是根据初始化时聚类中心的位置确定的,我们将邻近的聚类中心对应的聚类归为一组;步骤8:根据步骤6和步骤7得到混合组回归模型的所有参数Θ,给定输入数据矩阵X和输出数据矩阵Y时的联合后验概率分布为:ln p(Θ|X,Y)∝ln p(X,Y|Θ)+In p(Θ)混合组回归模型对应的图模型见图4。将参数步骤7中的先验分布p(Θ)和步骤6中的似然函数ln p(X,Y|Θ)的具体表达式代入到上式中,可以得到参数Θ的后验分布为:步骤9:为了求解步骤8中的参数Θ,我们采用EM算法进行参数优化。EM算法包括E步骤和M步骤;其中E步骤为:在E步中利用上一步的参数估计结果Θold计算任意第n个样本属于第k个聚类的后验概率符号wkn代表此后验概率。同时建立关于参数Θ的Q函数,其中为隐含变量矩阵,其第k行n列的元素为zkn;其中M步骤为:最大化Q函数Q(Θ,Θold)来更新参数Θ,根据上式的第一行得到关于回归参数的优化目标函数λ>0为回归噪声方差水平γk和参数τl之间的比值,这里假设同一组的子回归器有相同的回归噪声水平γk。并得到{Ak}和{bk}的解分别为:这里所有回归参数构成的参数矩阵训练样本输出值构成的向量其中由训练样本输入特征构成的矩阵而分组矩阵G的任意一个元素为如果否则gkl=0;根据Q函数第二行可以得到关于聚类参数{πk}的目标函数最后得到解为:步骤10:一直重复步骤9中的E步和M步,直到收敛,即:前后两次参数的值不再改变。...

【技术特征摘要】
1.一种基于混合组回归方法的视觉映射方法,具体步骤如下:
步骤1:采集N幅包含不同姿态的头部图像,并根据采集每幅图像时各图像对应的头部
俯仰、偏航和旋转角,即头部姿态做记录,yn的第一维表示俯仰角,第二维表示倾斜
角,第三维表示旋转角,下标n表示第n幅图像对应的姿态;
步骤2:将彩色图像转换为灰度图像,若采集图像已为灰度图像则无需进行转化;
步骤3:将步骤2中得到图像的头部区域进行尺寸归一化处理...

【专利技术属性】
技术研发人员:潘力立王正宁郑亚莉
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1