当前位置: 首页 > 专利查询>董伟专利>正文

一种基于深度学习算法的人眼注意力检测方法技术

技术编号：17780334 阅读：29 留言：0更新日期：2018-04-22 09:10

本发明专利技术公开了一种基于深度学习算法的人眼注意力检测方法，包括以下步骤：对于给定的图像，先做直方图均衡化；用AdaBoost算法进行人脸检测；采用回归树方法估计人脸特征点坐标，实现高精度的人脸对齐；根据特征点线性回归，回归出头部姿态角度；抠取ROI中小矩形区域，得到左右眼两幅小图片进行归一化处理；最后进行人眼闭合程度检测。本发明专利技术在卷积神经网络中，卷积层的每一个卷积滤波器重复的作用于整个感受野中，每一个卷积滤波器共享相同的参数，即权重共享，包括相同的权重矩阵和偏置项。共享权重的好处是在对图像进行特征提取时不用考虑局部特征的位置。而且权重共享提供了一种有效的方式，使要学习的卷积神经网络模型参数数量大大降低。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习算法的人眼注意力检测方法
本专利技术涉及一种基于深度学习算法的人眼注意力检测方法，属于深度学习领域。
技术介绍
人眼注意力检测是指通过眼球追踪设备，测量人体眼位与目光凝视点的运动。这种新兴的技术能提高计算机的智能交互性。人眼追踪被长期运用于研究个体的视觉注意力，最常用的眼球跟踪技术是瞳孔检测法。深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。深度学习的概念由Hinton等人于2006年提出。基于深度置信网络(DBN)提出非监督贪心逐层训练算法，为解决深层结构相关的优化难题带来希望，随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法，它利用空间相对关系减少参数数目以提高训练性能。深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表示，如每个像素强度值的向量，或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如，人脸识别或面部表情识别)。深度学习的好处是，用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本。同机器学习方法一样，深度机器学习方法也有监督学习与无监督学习之分.不同的学习框架下建立的学习模型很是不同.例如，卷积神经网络(Con...
一种基于深度学习算法的人眼注意力检测方法

【技术保护点】
一种基于深度学习算法的人眼注意力检测方法，其特征在于，包括以下步骤：步骤一，对于给定的图像F(x,y)，先做直方图均衡化，其中，x，y表示像素点的坐标值；步骤二，用AdaBoost算法进行人脸检测，将检测到的人脸区域设为感兴趣区域ROI；步骤三，采用回归树方法从ROI中估计人脸特征点坐标，实现高精度的人脸对齐；步骤四，根据特征点线性回归，回归出头部姿态角度(α,β,γ)；步骤五，抠取ROI中L、R小矩形区域，得到左右眼两幅小图片，分别表示为L(x,y)，R(x,y)；步骤六，将L(x,y)、R(x,y)大小归一化为L'(x,y)、R'(x,y)；步骤七，对L'(x,y)进行人眼闭合程度检测，返回结果范围[0,1]，其中0表示闭眼，1表示完全睁眼；步骤八，将L'(x,y)传入卷积神经网络模型进行识别分类，分类识别的结果是：视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ；步骤九，将R'(x,y)左右镜像处理为R”(x,y)＝R’(W‑x,y)，其中W为图片宽度；步骤十，对R”(x,y)进行人眼闭合程度检测，返回结果范围[0,1]，其中0表示闭眼，1表示完全睁眼；步骤十一，将R”...

【技术特征摘要】
1.一种基于深度学习算法的人眼注意力检测方法，其特征在于，包括以下步骤：步骤一，对于给定的图像F(x,y)，先做直方图均衡化，其中，x，y表示像素点的坐标值；步骤二，用AdaBoost算法进行人脸检测，将检测到的人脸区域设为感兴趣区域ROI；步骤三，采用回归树方法从ROI中估计人脸特征点坐标，实现高精度的人脸对齐；步骤四，根据特征点线性回归，回归出头部姿态角度(α,β,γ)；步骤五，抠取ROI中L、R小矩形区域，得到左右眼两幅小图片，分别表示为L(x,y)，R(x,y)；步骤六，将L(x,y)、R(x,y)大小归一化为L'(x,y)、R'(x,y)；步骤七，对L'(x,y)进行人眼闭合程度检测，返回结果范围[0,1]，其中0表示闭眼，1表示完全睁眼；步骤八，将L'(x,y)传入卷积神经网络模型进行识别分类，分类识别的结果是：视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ；步骤九，将R'(x,y)左右镜像处理为R”(x,y)＝R’(W-x,y)，其中W为图片宽度；步骤十，对R”(x,y)进行人眼闭合程度检测，返回结果范围[0,1]，其中0表示闭眼，1表示完全睁眼；步骤十一，将R”(x,y)传入卷积神经网络模型，进行识别，并还原到左右镜像处理前的结果，视线向左和视线向右结果相反，分类识别的结果是：视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ；步骤十二，将步骤六和步骤九结果输入注意力检测模型：得到结果y，对应视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ；其中φL、φR表示左、右眼最大似然视线方向；N表示模型分析区间长度；i∈[1,2,3,4,5]对应于视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ。2.根据权利要求1所述的一种基于深度学习算法的人眼注意力检测方法，其特征在于，步骤二中采用AdaBoost算法进行人脸检测，具体为：给定一个训练数据集N＝Nface+Nnon-face，其中Nface表示人脸数据，Nnon-face表示非人脸数据；其中，Adaboost算法的目的就是从训练数据中学习一系列弱分类器或基本分类器，然后将这些弱分类器组合成一个强分类器；其中f(x)表示强分类器，αm表示权重参数，Φm(x)表示弱分类器。3.根据权利要求1所述的一种基于深度学习算法的人眼注意力检测方法，其特征在于，步骤四包括回归出头部姿态角度，其回归公式如下：其中，(α,β,γ)代表人脸姿态三个旋转角度，n代表着一张人脸上标定特征点的个数，qi代表着待测试人脸特征点，pi代表对应着的三维通用标准模型特征点，R代表旋转矩阵，t为空间偏移...

【专利技术属性】
技术研发人员：董伟，何兵，
申请(专利权)人：董伟，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人