基于多任务自编码器的交互式人脸活体检测方法和装置制造方法及图纸

技术编号：14311695 阅读：87 留言：0更新日期：2016-12-27 20:32

本发明专利技术公开了一种基于多任务自编码器的人脸活体检测方法和装置。方法包括：通过摄像头进行人脸检测并且跟踪，获得人脸图像；提示用户做指定动作；根据所获得的人脸图像，通过多任务自编码器进行人脸关键点检测以及面部器官状态的判定；多任务自编码器进行人脸位置跟踪，并通过一段时间的视频判断用户是否做指定的动作，同时获取用户图片；重复步骤S2‑S4，经过预定时间后，根据用户完成指定动作情况判断活体检测是否成功。本发明专利技术通过多任务自编码器，既可以定位关键点，也可以自然的加入对指定各种动作的判断，在不增加额外模型运算的同时，能够有效的防止活体检测中的图像及视频攻击。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模式识别，计算机视觉，人脸检测和对齐等
，具体涉及一种基于深度学习的交互式人脸活体检测方法和装置。
技术介绍
人脸识别技术在近年来得到快速的发展，由于其易用性越来越多的场合开始使用人脸识别技术进行身份认定。由于人脸识别系统极易受到照片和视频片段的攻击，因此在判断所采集的人脸图像和注册数据库中人脸图像进行比对的同时，还需要判定所采集的人脸图像是否为真人，即活体检测，活体检测就是用于确定目标为有生命的个体的。目前，对于人脸识别系统有三种较为常见的攻击方式：打印的人脸照片，显示屏上的人脸图像，人脸面具和三维模型。由于伪造方式各种各样，所采用的材料、设备和技术也不尽相同，给人脸活体检测带来了很大的挑战。为了检测这些常用的攻击手段，人们提出了各种活体检测方法。常用的活体检测方法大致可以分为四类，第一类是检测人脸固有的特征，包括眨眼检测，频谱分析等。眨眼检测根据用户无意识的行为特征，但是不能抵抗视频攻击，准确度和鲁棒性都难以做的很好。依据照片的高频成分低于活体人脸图像的假设，频谱分析也是进行活体检测的一种方法。只是此方法需要高分辨率的图像。第二类是利用光源或者传感设备等，热图像传感器在红外光下，通过探测活体人脸和虚假图像的反射区别检测欺骗攻击。但是这一类方法需要增加设备，加大花费的成本。第三类是从视频和音频中提取特征信息，人说话时嘴部运动和声音是同步的。最后一类需要用户的参与，如用户被要求做指定的动作，通过动作判定验证它们是否同步来进行活体检测，传统的交互式人脸活体检测需要单独进行人脸关键点定位、姿态估计、嘴巴张闭状态判断等各种任务，增加了模型的...

【技术保护点】
一种基于多任务自编码器的人脸活体检测方法，其特征在于，包括如下步骤：步骤S1，通过摄像头进行人脸检测并且跟踪，获得人脸图像；步骤S2，按下预定按键，提示用户做指定动作；步骤S3，根据所获得的人脸图像，通过多任务自编码器进行人脸关键点检测以及面部器官状态的判定；步骤S4，多任务自编码器进行人脸位置跟踪，并通过一段时间的视频判断用户是否做指定的动作，同时获取用户图片；步骤S5，重复步骤S2‑S4，经过预定时间后，根据用户完成指定动作情况判断活体检测是否成功。

【技术特征摘要】
1.一种基于多任务自编码器的人脸活体检测方法，其特征在于，包括如下步骤：步骤S1，通过摄像头进行人脸检测并且跟踪，获得人脸图像；步骤S2，按下预定按键，提示用户做指定动作；步骤S3，根据所获得的人脸图像，通过多任务自编码器进行人脸关键点检测以及面部器官状态的判定；步骤S4，多任务自编码器进行人脸位置跟踪，并通过一段时间的视频判断用户是否做指定的动作，同时获取用户图片；步骤S5，重复步骤S2-S4，经过预定时间后，根据用户完成指定动作情况判断活体检测是否成功。2.根据权利要求1所述的方法，其特征在于，步骤S1包括：步骤S11，在没有人脸图像情况下，开启人脸检测器，检测视频中人脸。3.根据权利要求1所述的方法，其特征在于，所述步骤S2中指定动作包括以下的一种或几种的组合：左摇头，右摇头，点头，张嘴和眨眼。4.根据权利要求1所述的方法，其特征在于，所述步骤S3中多任务自编码器通过以下步骤训练得到：步骤S31，收集人脸图像数据，标定关键点位置坐标Sg、头部姿态信息Pg、嘴巴张闭状态Mg和眼睛张闭状态Eg；步骤S32，把人脸图像缩放到第一指定分辨率大小步骤S33，把缩放的人脸图像输入到第一阶段的多任务自编码器，检测人脸图像中初始的人脸关键点位置坐标S0，同时得到头部姿态信息P0、嘴巴张闭状态M0和睛张闭状态E0；步骤S34，再次把人脸图像缩放到第二指定分辨率大小，同时根据初始的人脸关键点位置坐标S0，计算出缩放后的人脸图像关键点位置坐标S01；步骤S35，根据缩放后的人脸图像和缩放后的人脸图像关键点位置坐标S01，在每个人脸关键点周围提取特征，将这些提取的特征串联起来输入到第二阶段的多任务自编码器，得到最终的人脸关键点位置坐标S1、头部姿态信息P1、嘴巴张闭状态M1和眼睛张闭状态E1。5.根据权利要求4所述的方法，其特征在于，所述步骤S31中，第一阶段多任务自编码器的目标函数为： J = J r 1 ( S g , f ( I ; W r ) ) + J r 2 ( P g , f ( I ; W r ) ) + J l 1 ( M g , f ( I ; W l ) ) + J l 2 ( E g , f ( I ; W l ) ) ]]>其中表示关键点检测的损失函数，表示头部姿态估计的损失函数，表示嘴巴张闭损失函数，表示眼睛张闭损失函数，Sg，Pg，Mg，Eg分别是人脸关键点位置坐标、头部姿态信息、嘴巴张闭状态和眼睛张闭状态，I为输入图像，f(·)是第一阶段的多任务自编码器的...

【专利技术属性】
技术研发人员：赫然，孙哲南，谭铁牛，李海青，张曼，李琦，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人