【技术实现步骤摘要】
一种基于相关熵的注视点估计方法
本专利技术涉及人机交互的注视点估计领域,具体涉及基于相关熵的注视点估计方法。
技术介绍
近年来,眼睛注视跟踪技术复杂性和应用性已经引起了商业部门的极大兴趣。各种各样的学科中使用眼睛注视追踪技术,包括认知科学、心理学(特别是心理语言学、视觉世界的范式),人机交互(HCI)、市场研究和医学研究(神经诊断)。具体应用包括跟踪眼动在语言阅读,音乐阅读,人类活动识别,广告设计,和运动设计。因此,对注视追踪的研究一直吸引着研究者的兴趣。注视点估计精度通常会受到提取的人眼图像的影响,对人眼图像的超像素级别的提取有利于提高注视估计精度。对于传统的对人眼提取算法,这些算法主要是利用提取特征点的方法对人眼内外眼角点进行判断,然后利用人眼图像高和宽的比例对人眼进行分割。但是根据这些算法提取出来的人眼图像跟真正的人眼图像有很大的偏差,而且在实际中实验对象头部姿态会有一些偏差,这样更不利于对人眼图像的精确提取。对注视点的估计主要依据注视点空间与人眼特征空间的相似性,根据空间结构的权重共享关系,从而对注视点进行估计。但是在对人眼特征空间和注视点空间进行建模中, ...
【技术保护点】
一种基于相关熵的注视点估计方法,其特征在于:该方法只需要单摄像头以及在屏幕上均匀标定点,具体包括如下步骤:步骤1:人脸图像提取:在对注视点估计过程中,采用adboost人脸检测算法对人脸图像进行提取;步骤2:人眼图像亚像素提取:在经过步骤(1)对人脸图像进行提取后,采用亚像素级的方法对人眼图像进行精准提取,具体方法为:主要是在不同的头部姿态条件下,寻找最优的人眼区域图像;首先初始化人眼区域的初始顶点坐标eQ
【技术特征摘要】
1.一种基于相关熵的注视点估计方法,其特征在于:该方法只需要单摄像头以及在屏幕上均匀标定点,具体包括如下步骤:步骤1:人脸图像提取:在对注视点估计过程中,采用adboost人脸检测算法对人脸图像进行提取;步骤2:人眼图像亚像素提取:在经过步骤(1)对人脸图像进行提取后,采用亚像素级的方法对人眼图像进行精准提取,具体方法为:主要是在不同的头部姿态条件下,寻找最优的人眼区域图像;首先初始化人眼区域的初始顶点坐标eQ(x,y),通过对齐操作后的位置信息为e(x,y),二者之间的变换函数如下:在公式中transform(x,y)是对齐变换函数,s为图像缩放比例,θ是旋转角度,tx,ty是在x、y方向上的偏移像素位移;假设E={vec(e1)|...|vec(en)}是标准的裁剪的人眼图像集,作为训练样本,通过人眼区域图像对齐操作使下面目标函数实现最小化实现对人眼图像提取:公式中τ为变换矩阵,表示对测试人眼图像进行相似性变换,在目标函数中τ含有未知参数:s,θ,tx,ty,其中w表示训练样本与人眼变换后的样本之间的线性关系;步骤3:人眼特征降维:在经过对步骤(2)提取的人眼图像进行提取后,对人眼图像进行HoG特征提取,然后使用KL散度算法对人眼图像的HoG特征进行降维操作;具体方法为:假设α,β,γ分别代表人眼特征空间、注视点空间和人眼特征投影空间,对于不同的空间结构,特征降维的目的主要过程是通过人眼特征空间转换,使转换后的空间γ与注视点空间β更加的相似;为了更好学习度量测度,使用欧式距离表示空间的距离测度关系,即:D(i,j)=||i-j||2;假设对于训练样本集,定义训练样本之间的条件分布如下:式(11)中:D(i,j)=||i-j||2表示空间位置(i,j)之间的距离测度关系。对于人眼特征投影空间和注视点空间的条件分布分别是:
【专利技术属性】
技术研发人员:张雪涛,李中常,王飞,陈霸东,王颖,姜沛林,郑南宁,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。