当前位置: 首页 > 专利查询>董伟专利>正文

一种基于深度学习算法的人眼注意力检测方法技术

技术编号:17780334 阅读:29 留言:0更新日期:2018-04-22 09:10
本发明专利技术公开了一种基于深度学习算法的人眼注意力检测方法,包括以下步骤:对于给定的图像,先做直方图均衡化;用AdaBoost算法进行人脸检测;采用回归树方法估计人脸特征点坐标,实现高精度的人脸对齐;根据特征点线性回归,回归出头部姿态角度;抠取ROI中小矩形区域,得到左右眼两幅小图片进行归一化处理;最后进行人眼闭合程度检测。本发明专利技术在卷积神经网络中,卷积层的每一个卷积滤波器重复的作用于整个感受野中,每一个卷积滤波器共享相同的参数,即权重共享,包括相同的权重矩阵和偏置项。共享权重的好处是在对图像进行特征提取时不用考虑局部特征的位置。而且权重共享提供了一种有效的方式,使要学习的卷积神经网络模型参数数量大大降低。

【技术实现步骤摘要】
一种基于深度学习算法的人眼注意力检测方法
本专利技术涉及一种基于深度学习算法的人眼注意力检测方法,属于深度学习领域。
技术介绍
人眼注意力检测是指通过眼球追踪设备,测量人体眼位与目光凝视点的运动。这种新兴的技术能提高计算机的智能交互性。人眼追踪被长期运用于研究个体的视觉注意力,最常用的眼球跟踪技术是瞳孔检测法。深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习的概念由Hinton等人于2006年提出。基于深度置信网络(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是,用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。同机器学习方法一样,深度机器学习方法也有监督学习与无监督学习之分.不同的学习框架下建立的学习模型很是不同.例如,卷积神经网络(Convolutionalneuralnetworks,简称CNNs)就是一种深度的监督学习下的机器学习模型,而深度置信网(DeepBeliefNets,简称DBNs)就是一种无监督学习下的机器学习模型。深度学习用于人眼注意力检测是一种新的方法,并且取得了很好的效果,具有很高的市场价值。
技术实现思路
基于此,本专利技术提出了一种专利技术目的:本专利技术所要解决的技术问题是针对现有技术的不足,提供一种鲁棒高效、效果好的基于深度学习算法的人眼注意力检测方法。技术方案:本专利技术公开了一种基于深度学习算法的人眼注意力检测方法,包括以下步骤:步骤一,对于给定的图像F(x,y),其中x,y表示像素点的坐标值,做直方图均衡化处理,目的是在一定程度上消除光照等外界因素的影响;步骤二,用AdaBoost算法进行人脸检测(FaceDetection),将检测到的人脸区域设为感兴趣区域(ROI);步骤三,采用回归树方法(EnsembleofRegressionTrees,ERT)从ROI中估计人脸特征点坐标,实现高精度的人脸对齐(FaceAlignment);步骤四,根据特征点线性回归,回归出头部姿态角度(α,β,γ);步骤五,抠取ROI中L、R小矩形区域,得到左右眼两幅小图片,分别表示为L(x,y),R(x,y);步骤六,将L(x,y)、R(x,y)大小归一化为L'(x,y)、R'(x,y);步骤七,对L'(x,y)进行人眼闭合程度检测,返回结果范围[0,1],其中0表示闭眼,1表示完全睁眼;步骤八,将L'(x,y)传入卷积神经网络(CNN)模型进行识别分类,分类识别的结果是:视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ;步骤九,将R'(x,y)左右镜像处理为R”(x,y)=R’(W-x,y),其中W为图片宽度;步骤十,对R”(x,y)进行人眼闭合程度检测,返回结果范围[0,1],其中0表示闭眼,1表示完全睁眼;步骤十一,将R”(x,y)传入卷积神经网络模型,进行识别,并还原到左右镜像处理前的结果(视线向左和视线向右结果相反),分类识别的结果是:视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ;步骤十二,将步骤六和步骤九结果输入注意力检测模型:得到结果y,对应视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ;其中φL、φR表示左、右眼最大似然视线方向;N表示模型分析区间长度;y∈[1,2,3,4,5]对应于视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ,注意力监测模型区间长度N为100帧。本专利技术步骤二中,采用AdaBoost算法进行人脸检测的具体原理步骤是:给定一个训练数据集N=Nface+Nnon-face,其中Nface表示人脸数据,Nnon-face表示非人脸数据;其中,Adaboost的目的就是从训练数据中学习一系列弱分类器或基本分类器,然后将这些弱分类器组合成一个强分类器;其中f(x)表示强分类器,αm表示权重参数,Φm(x)表示弱分类器。本专利技术步骤三中,采用回归树方法(EnsembleofRegressionTrees,ERT)实现高精度人脸对齐的原理。本专利技术步骤四中,回归出头部姿态角度,具体原理步骤是:首先,需要准备一个三维正面标准模型,该模型含有人脸特征点,包括眉毛、眼睛、嘴巴、鼻子等处的像素位置坐标。然后,旋转三维标准模型一定角度,直到模型上三维特征点的二维投影,与待测试图像上的二维特征点尽量重合,以回归出实现人脸姿态估计(α,β,γ),回归公式如下:其中,(α,β,γ)代表人脸姿态三个旋转角度,n代表着一张人脸上标定特征点的个数,qi代表着待测试人脸特征点,pi代表对应着的三维通用标准模型特征点,R代表旋转矩阵,t为空间偏移向量,C为伸缩因子;R的具体形式是如下三个矩阵相乘:R=Rx(α)·Ry(β)·Rz(γ),其中:本专利技术步骤七中,人眼闭合程度检测原理:其中λt表示人眼闭合程度,Max{Lt|t∈[0,t]}表示人眼历史睁开最大L值,λt∈[0,1]。本专利技术步骤八、步骤十一中,卷积神经网络模型为稀疏连接(局部感知),如图6所示。卷积神经网络中,层与层之间的神经元节点不再是全连接形式,利用层间局部空间相关性将相邻每一层的神经元节点只与和它相近的上层神经元节点连接,即局部连接。这样大大降低了神经网络架构的参数规模。具体模型包括特征学习和分类器设计,具体公式为:其中,X为输入x信号的抽象特征,W是卷积核,b是偏置,分别为:Softmax函数应用于多分类问题,能给出属于每一个类别的概率,概率和等于1,k为多分类数目,其实现公式为:本专利技术相比于现有技术的有益效果在于:本专利技术在卷积神经网络中,卷积层的每一个卷积滤波器重复的作用于整个感受野中,每一个卷积滤波器共享相同的参数,即权重共享,包括相同的权重矩阵和偏置项。共享权重的好处是在对图像进行特征提取时不用考虑局部特征的位置。而且权重共享提供了一种有效的方式,使要学习的卷积神经网络模型参数数量大大降低。附图说明图1为本专利技术的流程图;图2为本专利技术神经网络模型训练流程图;图3为本专利技术人脸对齐展示图;图4为本专利技术人眼闭合程度图;图5为本专利技术头部姿态角度旋转图;图6为本专利技术人眼睁开状态示意图;图7为本专利技术神经网络稀疏连接模型图;图8为本专利技术人眼注视区域划分图。具体实施方式以下结合附图,对本专利技术上述的和另外的技术特征和优点进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的部分实施例,而不是全部实施例。如图1所示,本专利技术包括以下步骤:步骤一,对于给定的图像F(x,y),先做直方图均衡本文档来自技高网
...
一种基于深度学习算法的人眼注意力检测方法

【技术保护点】
一种基于深度学习算法的人眼注意力检测方法,其特征在于,包括以下步骤:步骤一,对于给定的图像F(x,y),先做直方图均衡化,其中,x,y表示像素点的坐标值;步骤二,用AdaBoost算法进行人脸检测,将检测到的人脸区域设为感兴趣区域ROI;步骤三,采用回归树方法从ROI中估计人脸特征点坐标,实现高精度的人脸对齐;步骤四,根据特征点线性回归,回归出头部姿态角度(α,β,γ);步骤五,抠取ROI中L、R小矩形区域,得到左右眼两幅小图片,分别表示为L(x,y),R(x,y);步骤六,将L(x,y)、R(x,y)大小归一化为L'(x,y)、R'(x,y);步骤七,对L'(x,y)进行人眼闭合程度检测,返回结果范围[0,1],其中0表示闭眼,1表示完全睁眼;步骤八,将L'(x,y)传入卷积神经网络模型进行识别分类,分类识别的结果是:视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ;步骤九,将R'(x,y)左右镜像处理为R”(x,y)=R’(W‑x,y),其中W为图片宽度;步骤十,对R”(x,y)进行人眼闭合程度检测,返回结果范围[0,1],其中0表示闭眼,1表示完全睁眼;步骤十一,将R”(x,y)传入卷积神经网络模型,进行识别,并还原到左右镜像处理前的结果,视线向左和视线向右结果相反,分类识别的结果是:视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ;步骤十二,将步骤六和步骤九结果输入注意力检测模型:...

【技术特征摘要】
1.一种基于深度学习算法的人眼注意力检测方法,其特征在于,包括以下步骤:步骤一,对于给定的图像F(x,y),先做直方图均衡化,其中,x,y表示像素点的坐标值;步骤二,用AdaBoost算法进行人脸检测,将检测到的人脸区域设为感兴趣区域ROI;步骤三,采用回归树方法从ROI中估计人脸特征点坐标,实现高精度的人脸对齐;步骤四,根据特征点线性回归,回归出头部姿态角度(α,β,γ);步骤五,抠取ROI中L、R小矩形区域,得到左右眼两幅小图片,分别表示为L(x,y),R(x,y);步骤六,将L(x,y)、R(x,y)大小归一化为L'(x,y)、R'(x,y);步骤七,对L'(x,y)进行人眼闭合程度检测,返回结果范围[0,1],其中0表示闭眼,1表示完全睁眼;步骤八,将L'(x,y)传入卷积神经网络模型进行识别分类,分类识别的结果是:视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ;步骤九,将R'(x,y)左右镜像处理为R”(x,y)=R’(W-x,y),其中W为图片宽度;步骤十,对R”(x,y)进行人眼闭合程度检测,返回结果范围[0,1],其中0表示闭眼,1表示完全睁眼;步骤十一,将R”(x,y)传入卷积神经网络模型,进行识别,并还原到左右镜像处理前的结果,视线向左和视线向右结果相反,分类识别的结果是:视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ;步骤十二,将步骤六和步骤九结果输入注意力检测模型:得到结果y,对应视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ;其中φL、φR表示左、右眼最大似然视线方向;N表示模型分析区间长度;i∈[1,2,3,4,5]对应于视线向右I、视线向上Ⅱ、视线向左Ⅲ、视线向下Ⅳ、视线向前Ⅴ。2.根据权利要求1所述的一种基于深度学习算法的人眼注意力检测方法,其特征在于,步骤二中采用AdaBoost算法进行人脸检测,具体为:给定一个训练数据集N=Nface+Nnon-face,其中Nface表示人脸数据,Nnon-face表示非人脸数据;其中,Adaboost算法的目的就是从训练数据中学习一系列弱分类器或基本分类器,然后将这些弱分类器组合成一个强分类器;其中f(x)表示强分类器,αm表示权重参数,Φm(x)表示弱分类器。3.根据权利要求1所述的一种基于深度学习算法的人眼注意力检测方法,其特征在于,步骤四包括回归出头部姿态角度,其回归公式如下:其中,(α,β,γ)代表人脸姿态三个旋转角度,n代表着一张人脸上标定特征点的个数,qi代表着待测试人脸特征点,pi代表对应着的三维通用标准模型特征点,R代表旋转矩阵,t为空间偏移...

【专利技术属性】
技术研发人员:董伟何兵
申请(专利权)人:董伟
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1