计算机基于层叠式主成分分析法智能识别视频中人眼状态的方法技术

技术编号:9955664 阅读:121 留言:0更新日期:2014-04-23 12:01
本发明专利技术公开了一种计算机基于层叠式主成分分析法智能识别视频中人眼状态的方法,包括以下步骤:(1)采集人眼训练图像,对人眼训练图像进行主成分分析,获得特征眼子空间和系数子空间;(2)将视频中每幅待测人眼图像投影到特征眼子空间和系数子空间中得到另一组新系数向量;取出所有新系数向量的第一个值作为系数值;以视频中的帧数为x轴,相应帧人眼图像对应的系数值为Y轴构建一条帧数-系数值的原始数据曲线;(3)获得一条与原始数据曲线相对应的基准曲线以及差值曲线;(4)将差值曲线上的差值与预设的系数阈值作比较;判断视频中人眼状态。该方法具有很强的自适应性,能够有效克服不同人眼睛的差别带来的影响。

【技术实现步骤摘要】
计算机基于层叠式主成分分析法智能识别视频中人眼状态的方法
本专利技术属于智能交通
,具体涉及一种计算机基于层叠式主成分分析法智能识别视频中眼睛状态的方法。
技术介绍
眼睛是人体面部最重要的特征,在数字图像处理和计算机视觉研究与应用中有着极为重要的作用,眼睛睁闭状态的检测是虹膜识别、视线跟踪和驾驶员疲劳检测等系统的关键环节,检测的准确率直接影响到系统的性能。然而,在实际应用过程中,不均匀光照、光斑、睫毛和眼镜框等诸多因素的影响,使眼睛睁闭状态识别成为了一个极具挑战性的任务。目前的眼睛睁闭状态检测方法主要有以下两大类:基于眼球/瞳孔检测的方法和基于眼部结构特征的方法。前者主要通过检测眼部图像是否含有眼球/瞳孔来判断眼睛的状态;后者主要根据眼部整体结构特征的变化,如上下眼睑的变化来判断眼睛的状态。基于眼球/瞳孔检测的方法主要有灰度积分投影法和Hough变换检测瞳孔等算法:灰度积分投影法由于只用到图像的灰度信息,计算量少,速度快,但当出现睫毛、镜框和光斑等因素干扰时,该算法将变得不再适用;Hough变换算法需要进行边缘提取,而边缘的提取往往难度较大,易受到睫毛和不均匀光斑等的干扰,且拟合速度较慢,很难达到实时要求。基于眼部结构特征的算法主要有可变性模板法和神经网络法:可变性模板或将主动形状模型(ASM,ActiveShapeModel)用于检测上下眼睑的方法较为耗时,且检测效果受模板参数的影响;神经网络法的泛化能力较差,而样本的选取往往很难覆盖实际应用中的各种情况。而基于多种策略组合的研究状态检测方法,需要过多的人为参与,检测效果因人而异,且此方法流程流于繁琐,检测速度很难达到实时要求。本专利技术因此而来。
技术实现思路
本专利技术提供的一种计算机基于层叠式主成分分析法智能识别视频中眼睛状态的方法,解决了现有技术中计算机进行眼睛睁闭状态的识别时普遍存在方法实时性差、易受多种因素的影响、鲁棒性差的问题。为了解决现有技术中的这些问题,本专利技术提供的技术方案是:一种计算机基于层叠式主成分分析法智能识别视频中人眼状态的方法,其特征在于所述方法包括以下步骤:(1)采集人眼训练图像,对人眼训练图像进行第一层主成分分析,获得特征眼子空间;将每幅人眼训练图像投影到特征眼子空间中,分别得到一组系数向量,组合得到一个系数矩阵;对系数矩阵进行第二层主成分分析,得到系数子空间;(2)将视频中每幅待测人眼图像投影到步骤(1)得到的特征眼子空间上,分别得到一组系数向量;将系数向量分别投影到步骤(1)获得的系数子空间中得到另一组新系数向量;取出所有新系数向量的第一个值作为系数值;以视频中的帧数为X轴,相应帧人眼图像对应的系数值为Y轴构建一条帧数-系数值的原始数据曲线;(3)进行均值滤波处理获得一条与原始数据曲线相对应的基准曲线;将原始数据曲线和基准曲线上的对应值相减并取绝对值,就得到一条差值曲线;(4)将差值曲线上的差值与预设的系数阈值作比较;若差值小于系数阈值,则判定为视频中人眼状态为睁眼状态;若差值大于系数阈值,则判定视频中人眼状态为闭眼状态。优选的,所述方法步骤(3)中均值滤波处理是以某一帧人眼图像为中心获取前后若干帧人眼图像对应的系数值,然后求取它们的平均值作为该帧原始系数值的基准值;以视频中的帧数为X轴,相应帧原始系数值的基准值为Y轴构建一条帧数-基准值的基准曲线。优选的,所述方法中每一帧的待测人眼图像和人眼训练图像均经归一化处理成大小相同,且人眼区域均为右眼区域或左眼区域的图像。优选的,所述方法步骤(1)中假设人眼训练图像共有K幅,归一化处理后大小均为n×m的图像,将每幅图像按列优先构成一个n×m的列向量,即:x=(b11b21…bn1,b12b22…bn2,…,b1mb2m…bnm);以每幅图像的列向量为一列,构成一个维数为(n×m)×K的矩阵X,即:X=(x1,x2,...,xi),i=1,2,...,K。优选的,所述方法步骤(1)中对人眼训练图像进行第一层主成分分析,获得特征眼子空间的步骤包括:1)定义平均人眼为:则所有训练样本的协方差矩阵为:2)每个人眼xi与平均人眼ux的差值向量为:wi=xi-ux,记W=(w1,w2,...,wK),则矩阵Ψ为K-L变换的生成矩阵;3)假设差值向量为W∈RK,其中(n×m)>>K,则WWT∈RK的特征值由WTW∈RK得到;对WTW进行奇异值(SVD)分解得到其非零特征值(λ1,λ2,...,λr)及对应的特征向量V=(v1,v2,...,vr),则WWT正交归一化特征向量为其中λ1,λ2,...,λr从大到小排序,1≤r<K;则获得Ψ的非零特征值为(λ1/K,λ2/K,...,λr/K)及其对应的单位正交特征向量(u1,u2,...,ur)后,得到人眼特征子空间U=(u1,u2,...,ur)∈Rn×m×r。优选的,所述方法步骤(1)或(2)中将每幅人眼图像投影到特征眼子空间中,分别得到一组系数向量的步骤为将人眼图像x投影到特征眼子空间中,得到其对应的投影系数向量y为:y=UT(x-ux),不同的图像得到不同的系数向量y。优选的,所述方法中当每一幅人眼训练图像x投影到特征眼子空间中,分别得到一组系数向量y,将其组合在一起就得到一个系数矩阵Y;对系数矩阵Y再次进行主成分分析,得到一个新的特征子空间,即系数子空间P。为弥补现有技术的不足,本专利技术的目的在于提供一种计算机基于层叠式主成分分析法智能识别视频中人眼状态的方法,该方法根据驾驶员的眼睛状态判断驾驶员的疲劳程度,可以对驾驶员进行提醒,约束司机的违规驾驶行为。本专利技术解决了目前眼睛睁闭状态的识别方法普遍存在实时性差、易受多种因素的影响、鲁棒性差的问题。本专利技术技术方案的基本原理在于主成分分析法(PCA,PrincipalComponentAnalysis),是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。主成分分析法基于降维的思想,把多指标转化为少数几个综合指标。具体的基于层叠式主成分分析法(PCA,PrincipalComponentAnalysis)来判断眼睛睁闭状态的方法,包括以下步骤:1.读入人眼训练图像离线采集人眼图像构成人眼库。设有K幅大小为n×m的图像,将每幅图像按列优先构成一个n×m的列向量,以每幅图像的列向量为一列,构成一个维数为(n×m)×K的矩阵X=(x1,x2,...,xi),i=1,2,...,K。2.利用主成分分析得到人眼特征子空间(第一层主成分分析)PCA是统计学中分析数据的一种有效的方法,其基本的数学思想是将原来具有一定相关性的指标重新组合成一组新的线性无关的综合指标来代替原来的指标。它的基础是K-L变换,通过求解训练样本的散布矩阵的特征值问题,给出一组远远小于样本空间维数的正交基来表示训练样本张成的子空间。3.把图像投影到特征眼子空间每一幅人眼图像向特征子空间投影,得到一组坐标系数(向量),对应于子空间中的一个点。反过来,子空间中的任意一点也对应于一幅图像。由此对应关系,这组系数向量就可以作为人眼状态识别的依据,即这张人眼图像的特征眼特征。即,任一幅人眼图像都可表示为这组特征眼的线性组合,各个加权系数就是K-L变换的展开本文档来自技高网
...
计算机基于层叠式主成分分析法智能识别视频中人眼状态的方法

【技术保护点】
一种计算机基于层叠式主成分分析法智能识别视频中人眼状态的方法,其特征在于所述方法包括以下步骤:(1)采集人眼训练图像,对人眼训练图像进行第一层主成分分析,获得特征眼子空间;将每幅人眼训练图像投影到特征眼子空间中,分别得到一组系数向量,组合得到一个系数矩阵;对系数矩阵进行第二层主成分分析,得到系数子空间;(2)将视频中每幅待测人眼图像投影到步骤(1)得到的特征眼子空间上,分别得到一组系数向量;将系数向量分别投影到步骤(1)获得的系数子空间中得到另一组新系数向量;取出所有新系数向量的第一个值作为系数值;以视频中的帧数为x轴,相应帧人眼图像对应的系数值为Y轴构建一条帧数‑系数值的原始数据曲线;(3)对原始数据曲线进行均值滤波处理获得一条与原始数据曲线相对应的基准曲线;将原始数据曲线和基准曲线上的对应值相减并取绝对值,就得到一条差值曲线;(4)将差值曲线上的差值与预设的系数阈值作比较;若差值小于系数阈值,则判定为视频中人眼状态为睁眼状态;若差值大于系数阈值,则判定视频中人眼状态为闭眼状态。

【技术特征摘要】
1.一种计算机基于层叠式主成分分析法智能识别视频中人眼状态的方法,其特征在于所述方法包括以下步骤:(1)采集人眼训练图像,对人眼训练图像进行第一层主成分分析,获得特征眼子空间;将每幅人眼训练图像投影到特征眼子空间中,分别得到一组系数向量,组合得到一个系数矩阵;对系数矩阵进行第二层主成分分析,得到系数子空间;(2)将视频中每幅待测人眼图像投影到步骤(1)得到的特征眼子空间上,分别得到一组系数向量;将系数向量分别投影到步骤(1)获得的系数子空间中得到另一组新系数向量;取出所有新系数向量的第一个值作为系数值;以视频中的帧数为X轴,相应帧人眼图像对应的系数值为Y轴构建一条帧数-系数值的原始数据曲线;(3)对原始数据曲线进行均值滤波处理获得一条与原始数据曲线相对应的基准曲线;将原始数据曲线和基准曲线上的对应值相减并取绝对值,就得到一条差值曲线;(4)将差值曲线上的差值与预设的系数阈值作比较;若差值小于系数阈值,则判定为视频中人眼状态为睁眼状态;若差值大于系数阈值,则判定视频中人眼状态为闭眼状态。2.根据权利要求1所述的方法,其特征在于所述方法步骤(3)中均值滤波处理是以某一帧人眼图像为中心获取前后若干帧人眼图像对应的系数值,然后求取它们的平均值作为该帧原始系数值的基准值;以视频中的帧数为X轴,相应帧原始系数值的基准值为Y轴构建一条帧数-基准值的基准曲线。3.根据权利要求1所述的方法,其特征在于所述方法中每一帧的待测人眼图像和人眼训练图像均经归一化处理成大小相同,且人眼区域均为右眼区域或左眼区域的图像。4.根据权利要求1所述的方法,其特征在于所述方法步骤(1)中假设人眼训练图像共有K幅,归一化处理后大小均为n×m的图像,将每幅图像按列优先构成一个n×m的列向量,即:x=(...

【专利技术属性】
技术研发人员:张伟成波
申请(专利权)人:苏州清研微视电子科技有限公司 清华大学苏州汽车研究院吴江
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1