基于Gabor特征与字典学习的人脸姿态识别方法技术

技术编号:13167902 阅读:57 留言:0更新日期:2016-05-10 12:54
本发明专利技术公开一种基于Gabor特征与字典学习的人脸姿态识别方法,包括下述步骤:首先,将人脸姿态离散化为不同的子空间,使用K-SVD为每个子空间训练一个子字典使其对应一个类别;然后,将所有子字典组合成超完备字典;最后,采用基于gabor特征与稀疏表示的方法进行姿态分类。为了提高算法的鲁棒性,本发明专利技术重构一个遮挡人脸字典,解决人脸姿态识别中人脸遮挡问题。本发明专利技术能够解决人脸姿态估计中的光照、噪声和遮挡等问题,快速鲁棒性地识别出正脸、抬头、点头、左偏转、左侧脸、右偏转和右侧脸。可以较好地应用于安全驾驶、人机交互和人脸识别等领域。

【技术实现步骤摘要】

本专利技术属于图像处理、模式识别、计算机视觉和人机交互
,涉及一种人脸 姿态识别方法,具体涉及一种基于字典学习与稀疏表示的人脸姿态识别方法。
技术介绍
人脸姿态估计在智能视频监控、人脸识别、人机交互和虚拟现实领域具有巨大的 应用前景。例如,在智能视频监控方面,人脸姿态估计可以应用于驾驶监控系统,通过监控 司机的人脸姿态变化来识别司机是否集中注意力开车,避免撞车情况的发生。此外,人脸姿 态估计对人脸识别的准确度有很大的影响,许多人脸识别算法对正面人脸图像能够达到很 好的识别率,但对于多姿态的非正面人脸图像,它的识别准确率会严重下降,而通过人脸姿 态预估计是解决多人脸姿态识别的一种重要途径。 目前现有的人脸姿态检测方法大体上可以分为三类:纹理子空间方法,3D方法,其 它类方法。第一类方法通过基于2D人脸外观的学习方法实现姿态的检测与估计。其中比较 典型的有主成份分析(PCA)和线性判别(LDA)等。由于PCA是一种线性降维方法,而人脸姿态 3D旋转变化很大程度上是一种非线性变化。因此学者们使用核主成份分析(KPCA),流型学 习方法解决这种非线性变化问题。但是,核方法和流型学习方法有一个缺陷:随着人脸训练 样本增加,它很难分离出身份和姿态。这就意味着,当人脸训练库足够大时,姿态估计的准 确率会根据人的不同而变化。第一类方法最大的特点是处理速度快,容易实现,但是需要通 过大量样本的训练,对人脸的光照、表情等变化较为敏感,特别是对光照极差的视频人脸图 像其准确率下降明显。 第二类方法认为人脸姿态检测本身就是一个3D问题,只有通过3D信息才能表征人 脸姿态的本质特征。因此这类方法往往通过抽取3D特征来表征不同姿态,或者利用不同视 角下的多幅图像,在三维空间中重建人脸的3D模型实现姿态的检测。这类方法往往对图像 的大小和质量要求很高,并且会花费大量的运算时间。第二类方法通过3D方法能够得到很 高准确率,但是实时性不高,同时对视频监控中的超低分辨率和遮挡人脸图像效果不是很 好。 第三类方法是一些非主流方法,只能解决人脸姿态估计中部分问题或只能应用于 某些特定场合。例如,Rafael Μιι?οζ-Salinas等人提出多相机的人脸姿态估计方法。为了正 确估计人脸姿态,他们方法中需要利用前后左右6个相机拍照的6幅图像进行融合判别。 J.Nuevo等人提出块聚类的方法进行人脸姿态估计,取得了不错的效果,但是他们的方法估 计的姿态范围有限(只能识别45度范围的姿态变化)。山东大学的陈振学等人提出三角形的 人脸姿态估计方法,得到了 91%左右的准确率,但是他们的方法只能对人脸绕Y和Z轴偏转 有效,而对于绕X轴旋转人脸姿态无效,即对人脸上下旋转情况失效。 目前想要计算机具备和人类一样的姿态识别能力还很难,主要原因是光照、噪声、 遮挡、分辨率、身份、表情等因素的变化都会对姿态估计的准确性产生巨大的影响,如何消 除这些因素的影响是目前亟需解决的问题。
技术实现思路
本专利技术的目的在于克服以上方法的不足,提出一种基于Gabor特征与字典学习的 人脸姿态识别方法,解决人脸姿态识别中的光照、噪声和遮挡等问题,鲁棒性的识别出正 面、抬头、点头、左偏转、左侧脸、右偏转和右侧脸。 本专利技术的目的通过下述技术方案实现: 一种,包括下列步骤: 对在线输入的待识别人脸姿态图像进行Gabor特征提取,构建Gabor特征向量y; 对所述Gabor特征向量7使用姿态完备字典进行线性组合表示,建立稀疏表示模型 并求解系数向量,其中Gabor特征向量e ,m为Gabor特征向量维数; 根据上述求解的线性组合的系数向量进行人脸姿态分类识别。 进一步地,所述人脸姿态划分为7个不同姿态类别,分别定义为左偏转、左侧脸、右 偏转、右侧脸、正面、抬头和点头,其各对应不同的子空间。 进一步地,对所述Gabor特征向量y使用姿态完备字典进行线性组合表示之前,还 包括所述姿态完备字典的训练步骤,其中所述姿态完备字典包括对应无遮挡的人脸姿态的 第一姿态完备字典D和对应有遮挡的人脸姿态第二姿态完备字典D e,所述第一姿态完备字 典D和所述第二姿态完备字典的训练分别独立完成。 进一步地,所述第一姿态完备字典D的训练过程具体如下: 分别收集各姿态类别的人脸姿态图像样本,并对所述人脸姿态图像样本进行 Gabor滤波处理以及特征提取并向量化组成各姿态类别的人脸姿态Gabor特征训练集; 对每类姿态类别的人脸姿态Gabor特征训练集使用K-SVD进行训练优化分别得出 最佳子字典Di,i = l,2,~,7; 将各类最佳子字典Di组成第一姿态完备字典 进一步地,所述人脸姿态图像的Gabor特征提取为:其中,是通过对Gabor滤波系数的模进行p次采样而得到的列向量,μ,ν为 Gabor滤波器的方向与尺度,采用方向与尺度不变的Gabor滤波器描述人脸姿态图像的特 征,A·/匕>为人脸姿态图像与Gabor核φμ, v的卷积,Gabor核定义为: 其中,z(x,y)表示像素;^",ν= 为小波项,kv = kmax/fv,Φμ = πμ/8,σ = 1·5π控制 着高斯窗口宽度与波长的比例。 进一步地,所述在线输入的待识别人脸姿态图像为无遮挡的人脸姿态图像时,提 取所述待估计人脸姿态图像的Gabor特征向量,m为Gabor特征向量维数,将y看成所 述第一姿态完备字典e 的线性组合表示:J = & e ,其中N为字典原子总个数,所述 稀疏表示模型即为J = M e 。 进一步地,所述稀疏表示模型J =伙e通过带稀疏约束的最小二乘法进行求解: 其中,λ为平衡因子,起到平衡重建误差与稀疏性的作用。 进一步地,所述在线输入的待识别人脸姿态图像为有遮挡的人脸姿态图像时,提 取所述待估计人脸姿态图像的Gabor特征向量J e ,m为Gabor特征向量维数,将y看成由 所述的第一完备字典D和第二姿态完备字典A e 的线性组合表示: 其中召^从/^^沢-^十无遮挡图像抑与遮挡误差图像创分别可由第一姿态完 备字典D和第二姿态完备字典A 稀疏表示,为正交单位矩阵,所述稀疏表示模型即 = Βω e 〇 进一步地,所述稀疏表示模型将有遮挡的人脸姿态图像识别问题转化 成如下的优化问题: 该问题可以通过标准的线性规范方法进行求解。 进一步地,所述根据上述求解的线性组合的系数向量进行人脸姿态分类识别具体 为通过对所述求解的线性组合的系数向量进行有效性累计,以累计值最大作为判定分类的 依据,即 其中,f( ·)是特殊函数,用于将稀疏表示模型的表示系数的负因子置0, 6?, :%~->9Τ是选取函数,用于仅选择稀疏表示模型的表示系数&中第i类子空间矩阵所对 应的表示系数,并且将其它表示系数置〇, Pl(y)是训练样本集合中第i类姿态类别对应的子 空间与其对应的稀疏表示模型的表示系数的有效性累计因子。 本专利技术相对于现有技术具有如下的优点及效果: 1)目前大多数人脸姿态识别方法只对人脸左右偏转进行了分类,本专利技术不仅可以 对人脸左右偏转进行分类,同还可以进行上下姿态分类。本专利技术可以在0.3秒左右识别出人 脸图像的大致左右上下偏转状态,识别精度在95%以上,可以较好地应用于安全驾驶和本文档来自技高网
...

【技术保护点】
一种基于Gabor特征与字典学习的人脸姿态识别方法,其特征在于,包括下列步骤:对在线输入的待识别人脸姿态图像进行Gabor特征提取,构建Gabor特征向量y;对所述Gabor特征向量y使用姿态完备字典进行线性组合表示,建立稀疏表示模型并求解系数向量,其中Gabor特征向量m为Gabor特征向量维数;根据上述求解的线性组合的系数向量进行人脸姿态分类识别。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈友斌廖海斌
申请(专利权)人:广东微模式软件股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1