一种基于累计属性的头部姿态估计方法技术

技术编号：15501890 阅读：72 留言：0更新日期：2017-06-03 23:02

本发明专利技术提供了一种基于累积属性的头部姿态估计方法。首先采集一定数量的头部图像，并记录头部头像对应的头部姿态；之后，对图像提取梯度方向直方图特征，并将头部姿态转化为累积属性；然后，建立头部图像的梯度方向直方图特征和累积属性之间的映射关系，以及累积属性和头部姿态之间的映射关系；最后，给定一幅待估计姿态的头部图像时，提取梯度方向直方图特征，并根据上述学到的映射模型映射到累积属性，再从累积属性映射到头部姿态角度。由于上述创新，使得本发明专利技术提出的头部姿态估计方法有较为理想的估计准确性。

A method of head pose estimation based on cumulative attributes

The invention provides a head pose estimation method based on cumulative attributes. The head image is first collected, and record the corresponding head head head posture; after that, the image histogram of gradient extraction, and head pose into cumulative attributes; then, establishing the mapping relation between the histogram of gradient head image and accumulation properties, as well as between the cumulative attribute and head pose mapping finally, given a picture; to estimate the head pose image, extract the histogram of gradient, and to accumulate attributes according to the mapping model mapping the learned, from the accumulation of attribute mapping to head pose angle. Because of the above innovation, the head pose estimation method proposed by the invention has better estimation accuracy.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于累计属性的头部姿态估计方法
本专利技术属于计算机视觉
，涉及头部姿态估计技术，主要应用于安全驾驶，和人机交互问题中。
技术介绍
头部姿态估计是指根据包含头部的数字图像，利用机器学习和计算机视觉的方法准确快速地估计该图像中对应头部的偏转角度，也称为头部姿态。它是近年来计算机视觉和机器学习领域研究的热门问题，在人机交互、安全驾驶和关注度分析等方面都有非常广泛的应用。例如：在人机交互领域，头部的偏转角度可以用于控制电脑或机器显示的方向和位置；在安全驾驶领域，头部姿态可用于辅助视线估计，从而提示驾驶员正确的视线方向。近年来，头部姿态估计在流形学习和子空间理论发展的基础上，有了进一步的发展。现有头部姿态估计方法可以分为三个大的类别：1.基于容貌的方法，2.基于分类的方法和3.基于回归的方法。基于容貌的头部姿态估计方法的基本原理是将输入的头部图像与数据库中已有的图像进行一一比对，并将找到的最相似的图像所对应的角度作为待估计图像的头部姿态(即角度)。该类方法最大的缺陷在于其只能输出离散的头部偏转角度，并且由于需要与所有已有图像进行依次比对，运算量巨大。参见文献：D.J.Beymer,FaceRecognitionunderVaryingPose,IEEEConferenceonComputerVisionandPatternRecognition,pp.756-761,1994和J.Sherrah,S.Gong,andE.J.Ong,FaceDistributionsinSimilaritySpaceunderVaryingHeadposeImageand...
一种基于累计属性的头部姿态估计方法

【技术保护点】
一种基于累计属性的头部姿态估计方法，该方法包括：步骤1：采集N幅包含不同姿态的头部图像，并根据采集每幅图像时各图像对应的标记头部俯仰、偏航和旋转角，即头部姿态

【技术特征摘要】
1.一种基于累计属性的头部姿态估计方法，该方法包括：步骤1：采集N幅包含不同姿态的头部图像，并根据采集每幅图像时各图像对应的标记头部俯仰、偏航和旋转角，即头部姿态做记录，yn的第一维表示俯仰角，第二维表示倾斜角，第三维表示旋转角，下标n表示第n幅图像；步骤2：将彩色图像转换为灰度图像，若采集图像已为灰度图像则无需进行转化；步骤3：将步骤2中得到头部图像归一化为大小为64×64像素的归一化图像，并提取梯度方向直方图特征，并记任意第n幅图像对应的梯度方向直方图特征向量D表示该梯度方向直方图特征向量的维度；步骤4：将所有N幅图像对应的梯度方向直方图特征向量按顺序排列可以得到输入数据矩阵X，即X＝[x1，x2，...，xN]；步骤5：将N幅图像对应的头部姿态转化为对应的累积属性，对于任意一幅图像对应的头部姿态yn，将其第k维ynk(k＝1，2，3)转化为累积属性，转化方法为：最后由j＝1，...，361构成的累计属性向量将姿态数据的每一维都进行这样的变换，最后可以得到姿态yn对应的累计属性向量这里H＝361×3，将所有图像对应的累计属性向量按顺序排列为矩阵A＝[a1，a2，...，aN]；步骤5：将N幅图像对应的头部姿态向量按顺序排列为数据矩阵Y，即Y＝[y1，y2，...，yN]；步骤6：通过栈式自编码模型建立梯度方向直方图X＝[x1，x2，...，xN]和累计属性A＝[a1，a2，...，aN]之间的非线性映射关系，栈式自编码的参数用符号θ表示，目标函数为：

【专利技术属性】
技术研发人员：潘力立，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人