凝视位置估计方法、计算机设备及存储介质技术

技术编号：20993191 阅读：29 留言：0更新日期：2019-04-29 22:59

本发明专利技术提供凝视位置估计方法、计算机设备及存储介质，根据人脸RGBD图像中目标人物的双眼图像提取双眼的眼球姿态特征；根据人脸RGBD图像获取头部姿态特征及头部深度特征；将人脸RGBD图像中眼部所在位置的图像坐标同所述头部深度特征中的对应位置的深度信息合成以得到眼部的空间位置特征；合成所述眼球姿态特征、头部姿态特征、及眼部的空间位置特征为综合特征，并输入一凝视位置估计模型以估计凝视位置；本发明专利技术利用多种与凝视位置相关的带有深度信息的姿态因素进行特征提取并组合，并通过消除原始深度信息中的噪声干扰，有效提升预测凝视位置的精准度，解决现有技术的问题。

Staring Position Estimation Method, Computer Equipment and Storage Media

The invention provides gaze position estimation method, computer equipment and storage medium, extracts eye posture features of binocular objects from binocular images of target persons in RGBD images of faces, obtains head posture features and head depth features from RGBD images of faces, and takes the image coordinates of eye positions in RGBD images of faces and the depth information of corresponding positions in the head depth features. The method synthesizes the spatial position characteristics of the eye; synthesizes the eye posture characteristics, head posture characteristics and eye spatial position characteristics as comprehensive features, and inputs a gaze position estimation model to estimate the gaze position; the method extracts and combines features using a variety of attitude factors with depth information related to the gaze position, and eliminates the original depth information. Noise interference can effectively improve the accuracy of predicting gaze position and solve the problems of existing technology.

全部详细技术资料下载

【技术实现步骤摘要】
凝视位置估计方法、计算机设备及存储介质
本专利技术涉及图像处理
，尤其涉及凝视位置估计方法、计算机设备及存储介质。
技术介绍
凝视估计是指通过人眼或人脸信息来估计人们所注视的方向或位置的一项技术。这种技术已被广泛应用于各个领域，包括人机交互，视觉行为分析和心理学研究。例如，在人机交互中，凝视估计技术被用于虚拟现实游戏，人们可以通过眼球控制游戏中物体的移动；在视觉行为分析中，可以通过凝视点估计技术开发出能够商用的预测凝视位置的仪器——眼动仪，可以通过收集志愿者所看的位置来判断图像的显著性，有助于帮助网页的广告显示位置、图像压缩等；另外，凝视点估计也能帮助我们更多的分析人们的心理，在心理测试、心理治疗中有诸多帮助。因此，凝视估计这项技术有巨大的潜在价值和研究必要。早期的凝视估计技术是基于眼睛的几何模型和特征的方法，此种方法需要首先对志愿者进行校准，然后利用额外的红外光源等专用硬件来提取眼睛特征。如此的方法所需步骤较繁琐，校准步骤使得此种方法无法对不受干扰的人直接进行凝视点预测，额外的红外光源使得设备造价较高，不能大规模使用。最近的研究主要集中在基于外观的估计上，与基于模型的方法不同，基于外观的方法实现了令人满意的性能，同时保持了用户友好的数据采集程序，而不需要在面部姿势上进行额外的先验或进行精细的系统校准。但是，尽管基于外观的估计是理想的凝视估计器，但现有的解决方案仍然对头部姿势、光照不一致、遮挡、低图像质量等比较敏感。特别是，凝视估计的准确性在不同受试者中仍然显著不同。
技术实现思路
鉴于以上所述现有技术的缺点，本专利技术的目的在于提供凝视位置估计方法、计...

【技术保护点】
1.一种凝视位置估计方法，其特征在于，包括：根据人脸RGBD图像中目标人物的双眼图像提取双眼的眼球姿态特征；根据人脸RGBD图像获取头部姿态特征及头部深度特征；将人脸RGBD图像中眼部所在位置的图像坐标同所述头部深度特征中的对应位置的深度信息合成以得到眼部的空间位置特征；合成所述眼球姿态特征、头部姿态特征、及眼部的空间位置特征为综合特征，并输入一凝视位置估计模型以估计凝视位置。

【技术特征摘要】
1.一种凝视位置估计方法，其特征在于，包括：根据人脸RGBD图像中目标人物的双眼图像提取双眼的眼球姿态特征；根据人脸RGBD图像获取头部姿态特征及头部深度特征；将人脸RGBD图像中眼部所在位置的图像坐标同所述头部深度特征中的对应位置的深度信息合成以得到眼部的空间位置特征；合成所述眼球姿态特征、头部姿态特征、及眼部的空间位置特征为综合特征，并输入一凝视位置估计模型以估计凝视位置。2.根据权利要求1所述的凝视位置估计方法，其特征在于，所述眼球姿态特征通过基于ResNet模型的提取器提取。3.根据权利要求1所述的凝视位置估计方法，其特征在于，所述头部姿态特征和/或头部深度特征是通过生成对抗网络模型生成的。4.根据权利要求3所述的凝视位置估计方法，其特征在于，所述头部姿态特征的方式包括：从所述人脸RGBD图像截取包含眼部的子图像，并从所述子图像提取其原始彩色特征及原始深度特征；对所述原始彩色特征与原始深度特征分别进行特征提取以形成待用彩色特征和待用深度特征，合成所述待用彩色特征和待用深度特征为合成特征；将所述合成特征按所述原始深度特征的尺寸进行还原，以得到所述头部姿态特征；和/或，所述头部深度特征的提取方式包括：将所述合成特征按能与所述头部姿态特征合成的预定尺寸进行处理，以得到所述头部深度特征。5.根据权利要求3所述的凝视位置估计方法，其特征在于，所述生成对抗网络模型具有的生成器包含一...

【专利技术属性】
技术研发人员：高盛华，廉东泽，张子恒，
申请(专利权)人：上海科技大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人