一种基于自适应多列深度模型的人脸图像正规化方法技术

技术编号:11057732 阅读:113 留言:0更新日期:2015-02-18 20:48
本发明专利技术涉及一种基于自适应多列深度模型的人脸图像正规化方法,该方法包括以下步骤S1:建立自适应多列深度模型;S2:自适应多列深度模型的训练;S3:目标人脸图像正规化。本发明专利技术提供的一种基于多列自适应深度模型的人脸正规化方法,通过将多列深度模型进行线性组合实现多种影响人脸识别的不利因素的联合矫正,同时利用非线性优化方法自适应地计算每一列深度模型的最优权值,即根据输入图像自适应调整每种因素的矫正因子。与传统的利用单一深度神经网络模型进行人脸矫正的方法相比,本发明专利技术提供的基于多列自适应深度模型的人脸正规化方法对各种变化因素的鲁棒性更强。

【技术实现步骤摘要】

本专利技术属于人脸识别
,涉及一种基于自适应多列深度模型的人脸图像正 规化方法。
技术介绍
作为一种典型的生物特征识别技术,人脸识别以其自然性、可接受性高、便于隐蔽 等优势受到了人们的青睐,在国家公共安全、军事安全、金融安全和人机交互等方面有着广 阔的应用前景。然而,目前世界上最好的人脸识别系统也只能在用户比较配合、采集条件比 较理想的情况下才能基本满足一般应用的要求。而在非约束环境(用户不配合、非理想采 集条件)下,由于人脸特征稳定性较差、受各种外界条件(如不同的光照条件及遮挡等因 素)的影响大等原因,人脸识别存在很大的困难。人脸图像正规化是指将受光照变化、角度 变化、表情变化、遮挡等因素影响的人脸图像矫正到标准条件下的正面人脸,能够有效解决 人脸识别的以上难题。现有的人脸图像正规化方法通常只对一到两种因素进行去除矫正, 可以分为人脸姿态矫正、人脸光照矫正两种。 姿态矫正通常可以分为两类:基于2D的姿态矫正及基于3D的姿态矫正。基 于2D的方法通过2D图像匹配或者采用基函数或样本来编码测试图像的方法进行角 度矫正。例如,文献C.D.CastilloandD.W.Jacobs, Wide-baselinestereofor facerecognitionwithlargeposevariation,inIEEEConferenceonComputer VisionandPatternRecognition(CVPR) 2011,pp. 537-544 米用立体匹配计算两张人 脸之间的相似度。文献A.Li,S.Shan,andW.Gao,''Coupledbias-variancetradeoff forcross-posefacerecognition,^IEEETransactionsonImageProcessing vol. 21,pp. 305-315, 2012通过训练图像的线性组合来表示待测试人脸图像,并采用线性 回归系数作为特征进行人脸识别。3D方法则通常先从2D图像中获取3D人脸数据或估 计3D模型,然后与2D的测试人脸图像进行匹配。文献S.Li,X.Liu,X.Chai,H.Zhang,S. Lao,andS.Shan,^Morphabledisplacementfieldbasedimagematchingforface recognitionacrosspose,〃inECCV:Springer, 2012,pp. 102-115 首先通过一系列从3D人 脸数据库中采样而得的3D位移场(displacementfields)为测试人脸图像生成一个虚拟的 角度,然后将该合成的人脸与注册人脸进行匹配。类似的,文献A.Asthana,T.K.Marks,M. J.Jones,K.H.Tieu,andM.Rohith,''Fullyautomaticpose-invariantfacerecognition via3dposenormalization,inIEEEInternationalConferenceonComputer Vision(ICCV)2011,pp. 937-944 采用基于角度的主动外观模型(ActiveAppearance Model,AAM)实现3D模型与2D图像的匹配。 人脸光照预处理方法可以分为三种:光照归一化方法、对光照变化建模的方法、以 及提取光照不变特征的方法。光照归一化通过采用图像处理技术将人脸图像进行预处理, 得到统一光照条件下的人脸图像。直方图均衡(HistogramEqulization,HE)、Gamma矫正、 对数变换(LogarithmTransform,LT)是最常见的光照归一化方法。对光照变化建模的方 法通常先假设光照对人脸图像的影响,然后利用这些假设来建模或去除光照影响。光照变 化建模方法可以分为基于统计模型和基于物理模型两类。基于统计模型的方法通过对每个 人在不同光照条件下所形成的图像进行学习得到一个近似光照变化的线性子空间,常见的 有£1861^306、?181163〇6、分段线性子空间方法等。基于物理模型的方法对物体表面的光 照反射属性提出假设(如Lambertian表面假设),根据假设得到不同光照条件下的人脸图 像模型,典型的有光照锥、球谐函数。基于模型的方法的一个缺点是需要大量的不同光照条 件和不同3D模型信息下的人脸图片进行训练。而且,人脸也不是一个完美的Lambertian 表面。以上缺点限制了光照变化建模方法的应用。提取光照不变特征的方法是基于寻找对 光照不变的人脸表达方式这一朴素的思想。提取光照不变特征方法包括梯度特征方法、商 图像(QuaotientImage,QI)方法及基于Retinex模型的方法。典型的梯度特征有边缘图、 图像梯度、及局部二元模式(LocalBinaryPattern,LBP)。该类方法不依赖于物理模型, 且实现简单,但对识别效果的提高比较有限,仅在光照变化不剧烈的情况下效果明显。商 图像是测试图像和合成图像(不在同一光照条件下的3幅图像的线性组合)的比值,由于 Lambertian反射模型中该比值只与物体的反射率有关,因此可以看作光照不变量。Retinex 模型是Lambertian模型的简化形式。与商图像方法相比,基于Retinex的方法的优点是只 需要一幅图像来提取图像的光照不变量,不需要对图像进行对齐。基于Retinex的光照预 处理方法包括单尺度Retinex(SingleScaleRetinex,SSR)、多尺度Retinex(Multi-Scale Retinex,MSR)、自商图像(Self-QuotientImage,SQI)、以及形态学商图像(Morphological QuotientImage,MQI)等。 以上人脸图像正规化方法具有一定的局限性。比如,获取3D数据需要额外的计算 量和资源;而且用2D数据推导3D模型是一个不适定问题;统计光照模型通常是从约束环 境下获得,不能很好地推广到实际应用中。更重要的是,以上方法只能去除少数一两种不利 因素的影响。而在实际情况下,光照、角度、表情、遮挡等各种影响因素之间通常是相互作用 的,一种变化因素的作用与其它变化因素之间通常是相互联系的,在这种情况下单独处理 某种或某两种变化因素将因为受到其他因素的影响而难以达到真正实用的效果。因此,亟 需一种效果更好的人脸图像正规化方法。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于自适应多列深度模型的人脸图像正规 化方法, 为达到上述目的,本专利技术提供如下技术方案: -种基于自适应多列深度模型的人脸图像正规化方法,该方法包括以下步骤: SI:建立自适应多列深度模型; S2 :自适应多列深度模型的训练;所述训练包括S21 :深度神经网络的训练;S22 : 训练数据权重的预测;S23 :权重预测模块的训练; S3 :目标人脸图像正规化。 进一步,所述S21中的深度神经网络的训练包括S211 :栈式稀疏去噪自编码器 SSDA的训练;S212 :深度卷积神经网络DCNN的训练。 进一步,本文档来自技高网
...

【技术保护点】
一种基于自适应多列深度模型的人脸图像正规化方法,其特征在于:该方法包括以下步骤:S1:建立自适应多列深度模型;S2:自适应多列深度模型的训练;所述训练包括S21:深度神经网络DNN的训练;S22:训练数据权重的预测;S23:权重预测模块的训练;S3:目标人脸图像正规化。

【技术特征摘要】
1. 一种基于自适应多列深度模型的人脸图像正规化方法,其特征在于:该方法包括以 下步骤: 51 :建立自适应多列深度模型; 52 :自适应多列深度模型的训练; 所述训练包括S21 :深度神经网络DNN的训练;S22 :训练数据权重的预测;S23 :权重预 测模块的训练; 53 :目标人脸图像正规化。2. 根据权利要求1所述的一种基于自适应多列深度模型的人脸图像正规化方法,其特 征在于:所述S21中的深度神经网络的训练包括S211 :栈式稀疏去噪自编码器SSDA的训 练; S212 :深度卷积神经网络DCNN的训练。3. 根据权利要求2所述的一种基于自适应多列深度模型的人脸图像正规化方法,其特 征在于:所述SSDA的训练包括以下步骤: 52111 :SSDA由K个去噪自编码器DA构成,SSDA的训练为每个DA的训练,DA可以通过 优化如下稀疏正则化重建损失函数进行训练:其中,y表示干净的训练图像,X表示y被噪声污染后的图像,给定N个训练数据D = {(X1J1),…,(xN,yN)} ; ^(X)是DA的输出;? = {ff,b, W',b' }是需要优化的参数;入、3和 P是超参数,J是隐层节点的个数,A是隐层节点的平均输出值向量,稀疏诱导项KL(Plh) 是目标激活值P和第j个隐层节点平均激活值色之间的KL散度,通过选择较小的目标激 活值P使得A的分量尽量小; 52112 :训练完第一个DA之后,将干净图像和污染图像的隐层输出分别作为干净和污 染图像来训练第二个DA,重复上述过程直到完成K个DA的训练; 52113 :通过最小化以下的损失函数,利用标准的反向传播算法对整个网络的参数进行 精确调整:其中W(1)表示SSDA中第1层的参数。4....

【专利技术属性】
技术研发人员:刘艳飞周祥东周曦
申请(专利权)人:中国科学院重庆绿色智能技术研究院
类型:发明
国别省市:重庆;85

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1