一种基于混合组回归方法的视觉映射方法技术

技术编号：13338101 阅读：123 留言：0更新日期：2016-07-13 10:14

该发明专利技术公开了一种基于混合组回归方法的视觉映射方法，属于计算机视觉技术领域，涉及混合回归技术。本发明专利技术以头部姿态估计问题为例进行具体说明。首先对采集到的头部图像进行梯度方向直方图特征提取，并记录对应的头部姿态；之后，在输入梯度方向直方图和对应头部姿态之间建立混合组回归模型；接着，初始化混合组回归模型，根据初始化聚类中心划分分组，并求解回归参数；最后，在给定一个待估计头部图像时，提取图像的梯度方向直方图特征，再利用已学到的混合组回归模型估计头部姿态。提高了在头部姿态估计的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机视觉
，涉及混合回归技术，主要应用于姿态估计，视线跟踪和年龄估计等视觉估计问题中。
技术介绍
在计算机视觉中，视觉映射是指学习输入图像特征与输出变量之间映射函数的过程，以便在输入新图像时，估计该输入图像对应的目标输出值。具体来讲，视觉映射包括：人体姿态估计、头部姿态估计、视线估计和物体跟踪等。详见参考文献：O.Williams,A.Blake,andR.Cipolla,SparseandSemi-supervisedVisualMappingwiththeS3GP,inIEEEConferenceComputeronComputerVisionandPatternRecognition,pp.230-237,2006.作为计算机视觉的一个重要分支，视觉映射改变了许多场合下由人逐一根据图像内容估计目标输出的情况。取而代之，由计算机根据输入图像内容，通过已有视觉映射函数预测输出，从而实现由摄像机和电脑代替人眼和大脑对图像进行全自动分析和估计。目前，该技术已开始被应用于与人们生活密切相关的多个产业。其中，头部姿态估计被应用于汽车安全驾驶产业，视线估计和人体姿态估计被应用于智能人机接口及游戏产业，物体跟踪被应用于智能交通等产业。相信随着计算机硬件处理能力的不断提高和视觉映射中关键技术问题的逐步解决，其应用前景将更加广阔。混合回归模型最早由多伦多大学的GeoffreyHinton和加州大学伯克利分校的r>MichealJordan在1991年提出，原始模型假设输出变量服从混合高斯分布，并且认为属于不同高斯的输入和输出数据之间存在局部线性映射关系。近几年，INRIA研究机构的BillTriggs成功地将混合回归模型应用人体姿态估计问题，并假设输入特征和输出变量联合服从混合高斯分布，从而建立从输入图像特征到人体姿态的概率估计模型。详见参考文献：A.AgarwalandB.Triggs,MonocularHumanMotionCapturewithaMixtureofRegressors,inIEEEWorkshoponVisionforHumanComputerInteractioninConjunctionwithIEEEConferenceonComputerVisionandPatternRecognition,pp.72-80,2005.在用于视觉映射问题的模型中，混合回归模型已被证实为解决该问题最好的模型之一。由于其高准确性、低复杂度和强通用性，混合回归模型也是目前被最为广泛应用的模型。近年来，国外很多学者将研究集中在如何克服以上缺陷，提高现有基于混合回归视觉映射模型的准确性，尤其是在有干扰和噪声存在情况下的鲁棒性。然而，现有研究工作大都存在建模和解法上的不足，还需要进行深入的研究和完善。此外，国内在该领域也开始有少量研究工作出现，但多数研究还处于起步阶段。
技术实现思路
本专利技术提供了一种基于混合组回归方法的视觉映射方法，本专利以头部姿态估计问题为例进行具体说明。首先对采集到的头部图像进行梯度方向直方图特征提取，并记录对应的头部姿态；之后，在输入梯度方向直方图和对应头部姿态之间建立混合组回归模型；接着，初始化混合组回归模型，根据初始化聚类中心划分分组，并求解回归参数；最后，在给定一个待估计头部图像时，提取图像的梯度方向直方图特征，再利用已学到的混合组回归模型估计头部姿态。算法示意图参见图3。为了方便地描述本
技术实现思路
，首先对一些术语进行定义。定义1：头部姿态。在三维空间中头部旋转的角度通常由一个向量表示，该向量由三个元素构成，第一个元素为俯仰角，第二个元素为偏航角，第三个元素为旋转角。定义3：俯仰角。在图2(b)所示的x-y-z坐标系中，俯仰角是指以x轴为中心旋转的角度θ。定义3：偏航角。在图2(a)所示的x-y-z坐标系中，偏航角是指以z轴为中心旋转的角度φ。定义4：旋转角。在图2(c)所示的x-y-z坐标系中，旋转角是指以z′为中心旋转的角度Ψ。定义5：梯度方向直方图特征。利用像素强度梯度或边缘的方向分布描述一幅图像中的物体的表象和形状的视觉特征提取方法。其实现方法先将图像分成小的叫做方格单元的连通区域；然后采集方格单元中各像素点的梯度方向或边缘方向直方图；最后把这些直方图组合起来就可以构成特征描述子。为了提高精确度，还可以把这些局部直方图在图像的更大的区间(block)中进行对比度归一化(contrast-normalized)，此方法通过先计算各直方图在这个区间(block)中的密度，然后根据这个密度值对区间中的各个方格单元做归一化。通过该归一化能对光照变化和阴影有更强的鲁棒性。定义6：高斯分布。又名正态分布，是一个在数学、物理及工程等领域都非常重要的概率分布。具体是指：对于任意随机变量x，若其概率密度函数满足其中μ为正态分布的中心，σ为正态分布的方差，则称其满足高斯分布，常用符号表示。若随机变量为向量x，则对应高维高斯分布μ为高维正态分布的中心，Σ为高维正态分布的协方差，或记为定义7：混合高斯分布。是指随机变量服从由多个高斯函数混合组成的分布函数，即：其中K为高斯分布的个数，z为指示变量x属于哪一个高斯分布的隐变量。z为一个K维的状态向量，该向量只有一个元素为1，其余元素为0，当第k个元素zk为1时，则表示x属于第k个高斯分布。p(z)表示隐变量z的出现概率，该概率通常用符号πk表示，即：p(zk＝1)＝πk。定义8：隐变量。无法被观测到的变量，例如在混合高斯分布中，z指示变量x属于哪一个高斯分布，无法被观测即为隐变量。定义9：混合系数。在混合高斯分布中代表变量x属于某一高斯分布的概率，即πk为混合系数。定义10：线性回归。是指输出变量(向量)y和输入变量(向量)x之间存在线性映射关系，即：y＝ATx+b，其中AT代表回归矩阵，b代表偏差向量。定义11：混合回归关系。是指输出变量(向量)y和输入变量(向量)x之间存在非线性映射关系，即：其中代表第k个回归矩阵，bk代表第k个偏差向量。πk(x)表示x属于某一线性回归模型的概率。定义12：似然函数。似然函数是一种关于统计模型中的参数的函数，表示模型参数的似然性或可能性。定义13：期望最大值算法。一种求解混合高斯分布参数似然函数最大值的优化方法，它通常包含两个基本的步骤，即：期望步骤(E步)和最大化步骤(M步)。定义14：Q函数。在求解混合高斯分布似然函数最大值的期望最大值算法中，Q函数为似然函数的下界函数。定义15：本文档来自技高网...

【技术保护点】
一种基于混合组回归方法的视觉映射方法，具体步骤如下：步骤1：采集N幅包含不同姿态的头部图像，并根据采集每幅图像时各图像对应的头部俯仰、偏航和旋转角，即头部姿态做记录，yn的第一维表示俯仰角，第二维表示倾斜角，第三维表示旋转角，下标n表示第n幅图像对应的姿态；步骤2：将彩色图像转换为灰度图像，若采集图像已为灰度图像则无需进行转化；步骤3：将步骤2中得到图像的头部区域进行尺寸归一化处理，并提取梯度方向直方图特征，并记任意第n幅图像对应的梯度方向直方图特征向量步骤4：将所有N幅图像对应的梯度方向直方图特征向量按顺序排列可以得到输入数据矩阵X，即X＝[x1,x2,…,xN]；步骤5：将N幅图像对应的头部姿态向量按顺序排列为数据矩阵Y，即Y＝[y1,y2,…,yN]；步骤6：头部姿态估计问题中，所有输入特征和输出姿态联合服从混合高斯分布，因此任一输入输出观测对{xn,yn}的概率分布为：各高斯分布中心、协方差和混合系数，分别用符号μk，∑k和πk表示，其中下角标k表示第k个高斯分布，为隐变量，决定第n个观测样本{xn,yn}属于哪一个高斯，Θ表示此混合回归模型中的所有参数；同时，已知{xn,yn...

【技术特征摘要】
1.一种基于混合组回归方法的视觉映射方法，具体步骤如下：
步骤1：采集N幅包含不同姿态的头部图像，并根据采集每幅图像时各图像对应的头部
俯仰、偏航和旋转角，即头部姿态做记录，yn的第一维表示俯仰角，第二维表示倾斜
角，第三维表示旋转角，下标n表示第n幅图像对应的姿态；
步骤2：将彩色图像转换为灰度图像，若采集图像已为灰度图像则无需进行转化；
步骤3：将步骤2中得到图像的头部区域进行尺寸归一化处理...

【专利技术属性】
技术研发人员：潘力立，王正宁，郑亚莉，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人