一种基于累计属性的头部姿态估计方法技术

技术编号:15501890 阅读:72 留言:0更新日期:2017-06-03 23:02
本发明专利技术提供了一种基于累积属性的头部姿态估计方法。首先采集一定数量的头部图像,并记录头部头像对应的头部姿态;之后,对图像提取梯度方向直方图特征,并将头部姿态转化为累积属性;然后,建立头部图像的梯度方向直方图特征和累积属性之间的映射关系,以及累积属性和头部姿态之间的映射关系;最后,给定一幅待估计姿态的头部图像时,提取梯度方向直方图特征,并根据上述学到的映射模型映射到累积属性,再从累积属性映射到头部姿态角度。由于上述创新,使得本发明专利技术提出的头部姿态估计方法有较为理想的估计准确性。

A method of head pose estimation based on cumulative attributes

The invention provides a head pose estimation method based on cumulative attributes. The head image is first collected, and record the corresponding head head head posture; after that, the image histogram of gradient extraction, and head pose into cumulative attributes; then, establishing the mapping relation between the histogram of gradient head image and accumulation properties, as well as between the cumulative attribute and head pose mapping finally, given a picture; to estimate the head pose image, extract the histogram of gradient, and to accumulate attributes according to the mapping model mapping the learned, from the accumulation of attribute mapping to head pose angle. Because of the above innovation, the head pose estimation method proposed by the invention has better estimation accuracy.

【技术实现步骤摘要】
一种基于累计属性的头部姿态估计方法
本专利技术属于计算机视觉
,涉及头部姿态估计技术,主要应用于安全驾驶,和人机交互问题中。
技术介绍
头部姿态估计是指根据包含头部的数字图像,利用机器学习和计算机视觉的方法准确快速地估计该图像中对应头部的偏转角度,也称为头部姿态。它是近年来计算机视觉和机器学习领域研究的热门问题,在人机交互、安全驾驶和关注度分析等方面都有非常广泛的应用。例如:在人机交互领域,头部的偏转角度可以用于控制电脑或机器显示的方向和位置;在安全驾驶领域,头部姿态可用于辅助视线估计,从而提示驾驶员正确的视线方向。近年来,头部姿态估计在流形学习和子空间理论发展的基础上,有了进一步的发展。现有头部姿态估计方法可以分为三个大的类别:1.基于容貌的方法,2.基于分类的方法和3.基于回归的方法。基于容貌的头部姿态估计方法的基本原理是将输入的头部图像与数据库中已有的图像进行一一比对,并将找到的最相似的图像所对应的角度作为待估计图像的头部姿态(即角度)。该类方法最大的缺陷在于其只能输出离散的头部偏转角度,并且由于需要与所有已有图像进行依次比对,运算量巨大。参见文献:D.J.Beymer,FaceRecognitionunderVaryingPose,IEEEConferenceonComputerVisionandPatternRecognition,pp.756-761,1994和J.Sherrah,S.Gong,andE.J.Ong,FaceDistributionsinSimilaritySpaceunderVaryingHeadposeImageandVisionComputing,vol.19,no.12,pp.807-819,2001。基于分类的头部姿态估计方法是指根据输入图像的特征和对应头部偏转角度训练分类器,并利用学习好的分类器区分待估计图像头部偏转角度所属的类别,从而确定头部姿态的大致范围。该类方法中常用的分类器包括支持向量机(SupportVectorMachine,SVM),线性判决分析(LinearDiscriminativeAnalysis,LDA),核线性判决分析(KernelLinearDiscriminativeAnalysis,KLDA),这类方法的主要缺点是无法估计输出连续的头部姿态,参见文献:J.Huang,X.Shao,andH.Wechsler,FacePoseDiscriminationusingSupportVectorMachines(SVM),InternationalConferenceonPatternRecognition,pp.154-156,1998。基于回归的头部姿态估计方法是目前最常用的估计方法,该方法的基本原理是利用已有图像特征和对应的头部角度建立映射函数,并利用映射函数估计待处理图像对应的头部姿态。该类方法解决了前述两种方法无法估计输出连续姿态的问题,同时减少了运算复杂度,参见文献G.Fanelli,J.Gall,andL.VanGool,RealTimeHeadPoseEstimationwithRandomRegressionForests,IEEEConferenceonComputerVisionandPatternRecognition,2011,pp.617-624和文献H.Ji,R.Liu,F.Su,Z.Su,andY.Tian,ConvexRegularizedSparseRegressionforHeadPoseEstimation,IEEEInternationalConferenceonImageProcessing,pp.3617-3620,2011。上述方法都是直接建立从输入特征到目标值的映射函数,其局限性在于当训练数据存在稀疏或分布不均匀问题时,估计误差增大。为了解决上述问题,本专利提出了一种基于累积属性的头部姿态估计方法,该方法首先将头部姿态图像映射到累积属性,在将累积属性转换为姿态。
技术实现思路
本专利技术提供了一种基于累积属性的头部姿态估计方法。首先采集一定数量的头部图像,并记录头部头像对应的头部姿态;之后,对图像提取梯度方向直方图特征,并将头部姿态转化为累积属性;然后,建立头部图像的梯度方向直方图特征和累积属性之间的映射关系,以及累积属性和头部姿态之间的映射关系;最后,给定一幅待估计姿态的头部图像时,提取梯度方向直方图特征,并根据上述学到的映射模型映射到累积属性,再从累积属性映射到头部姿态角度。为了方便地描述本
技术实现思路
,首先对一些术语进行定义。定义1:头部姿态。在三维空间中头部旋转的角度通常由一个向量表示,该向量由三个元素构成,第一个元素为俯仰角,第二个元素为偏航角,第三个元素为旋转角。定义3:俯仰角。在图1(b)所示的x-y-z坐标系中,俯仰角是指以x轴为中心旋转的角度θ。定义3:偏航角。在图1(a)所示的x-y-z坐标系中,偏航角是指以z轴为中心旋转的角度φ。定义4:旋转角。在图1(c)所示的x-y-z坐标系中,旋转角是指以z’为中心旋转的角度Ψ。定义5:梯度方向直方图特征。利用像素强度梯度或边缘的方向分布描述一幅图像中的物体的表象和形状的视觉特征提取方法。其实现方法先将图像分成小的叫做方格单元的连通区域;然后采集方格单元中各像素点的梯度方向或边缘方向直方图;最后把这些直方图组合起来就可以构成特征描述子。为了提高精确度,还可以把这些局部直方图在图像的更大的区间(block)中进行对比度归一化(contrast-normalized),此方法通过先计算各直方图在这个区间(block)中的密度,然后根据这个密度值对区间中的各个方格单元做归一化。通过该归一化能对光照变化和阴影有更强的鲁棒性。定义6:累积属性。累积属性是姿态角度的另一种有效表示,被用在视觉估计中,作为从面部特征到年龄映射的中间层。若已知一个人的头部姿态为y,首先将姿态的第k维yk(k=1,2,3)转化为累计属性由构成的累计属性向量将姿态数据的每一维都有进行这样的变换,最后可以得到姿态y对应的累积属性向量这里H=361×3。定义7:梯度。当函数y=f(x)的自变量x的维数为D时候,梯度定义为为函数f(x)关于变量xd的偏导数。定义8:后向传播算法。是一种监督学习算法,常被用来训练多层神经网络。一般包含两个阶段:(1)前向传播阶段将训练输入送入网络以获得激励响应;(2)反向传播阶段将激励响应同训练输入对应的目标输出求差,从而获得隐层和输出层的响应误差。定义9:梯度下降法。梯度下降法是一个最优化算法,为求解函数f(x)取极值时,自变量的取值可以迭代求解,即:直到梯度值为零,得到解。本专利技术详细技术方案为一种基于累计属性的头部姿态估计方法,该方法包括:步骤1:采集N幅包含不同姿态的头部图像(见图1),并根据采集每幅图像时各图像对应的标记头部俯仰、偏航和旋转角(见图2),即头部姿态做记录,yn的第一维表示俯仰角,第二维表示倾斜角,第三维表示旋转角,下标n表示第n幅图像;步骤2:将彩色图像转换为灰度图像,若采集图像已为灰度图像则无需进行转化;步骤3:将步骤2中得到头部图像归一化为大小为64×64像素的归一化图像,并提取梯度方向直方图特征(Histog本文档来自技高网
...
一种基于累计属性的头部姿态估计方法

【技术保护点】
一种基于累计属性的头部姿态估计方法,该方法包括:步骤1:采集N幅包含不同姿态的头部图像,并根据采集每幅图像时各图像对应的标记头部俯仰、偏航和旋转角,即头部姿态

【技术特征摘要】
1.一种基于累计属性的头部姿态估计方法,该方法包括:步骤1:采集N幅包含不同姿态的头部图像,并根据采集每幅图像时各图像对应的标记头部俯仰、偏航和旋转角,即头部姿态做记录,yn的第一维表示俯仰角,第二维表示倾斜角,第三维表示旋转角,下标n表示第n幅图像;步骤2:将彩色图像转换为灰度图像,若采集图像已为灰度图像则无需进行转化;步骤3:将步骤2中得到头部图像归一化为大小为64×64像素的归一化图像,并提取梯度方向直方图特征,并记任意第n幅图像对应的梯度方向直方图特征向量D表示该梯度方向直方图特征向量的维度;步骤4:将所有N幅图像对应的梯度方向直方图特征向量按顺序排列可以得到输入数据矩阵X,即X=[x1,x2,...,xN];步骤5:将N幅图像对应的头部姿态转化为对应的累积属性,对于任意一幅图像对应的头部姿态yn,将其第k维ynk(k=1,2,3)转化为累积属性,转化方法为:最后由j=1,...,361构成的累计属性向量将姿态数据的每一维都进行这样的变换,最后可以得到姿态yn对应的累计属性向量这里H=361×3,将所有图像对应的累计属性向量按顺序排列为矩阵A=[a1,a2,...,aN];步骤5:将N幅图像对应的头部姿态向量按顺序排列为数据矩阵Y,即Y=[y1,y2,...,yN];步骤6:通过栈式自编码模型建立梯度方向直方图X=[x1,x2,...,xN]和累计属性A=[a1,a2,...,aN]之间的非线性映射关系,栈式自编码的参数用符号θ表示,目标函数为:

【专利技术属性】
技术研发人员:潘力立
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1