一种基于卷积神经网络的活体人脸检测方法技术

技术编号：13736606 阅读：92 留言：0更新日期：2016-09-22 04:51

一种基于卷积神经网络的活体人脸检测方法，涉及机器学习以及模式识别领域。本发明专利技术是面向人脸识别中的欺骗问题提出的。传统的人脸识别技术很容易被攻击，攻击者经常采用照片、视频以及3D模型等方法对合法用户的人脸进行复制。如果人脸识别系统不能有效地区分真实人脸和假冒人脸，入侵者就很容易以假冒身份通过识别系统。基于这个问题，本发明专利技术提出了一种针基于卷积神经网络的活体人脸检测方法。本发明专利技术所提出的方法中的卷积神经网络是基于cuda_convnet框架实现的，网络结构包括四个卷积层，两个max‑pooling层，以及一个全连接层和一个soft‑max层，soft‑max层包括两个神经元，用来预测真假人脸的概率分布。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及机器学习和模式识别领域，具体涉及一种基于卷积神经网络的活体人脸检测的研究和实现。
技术介绍
人脸识别是生物特征技术的一项热门的研究领域，与其他生物特征技术相比，人脸识别技术具有非接触性、友好性等优势。人脸识别系统已经在越来越多的场合进行使用，例如移动终端解锁系统、电脑开机登录系统、门禁系统。另外，人脸识别还应用在刑事侦查，监控系统等领域。但是，在人脸识别技术迅速发展的背后，存在着巨大的安全隐患。人脸识别系统可以判别人脸的真实身份，但是却无法判别摄像头前的人脸图像是来自合法用户还是非法用户。因为，非法用户可以使用合法用户的照片，视频，或者3D模型来欺骗人脸识别系统。国际知名的信息安全会议Black Hat指出，目前大部分的人脸识别系统都可以被一张彩色的打印照片所攻击。所以人脸识别技术目前还存在严重的安全隐患。针对上述人脸识别技术遇到的这一挑战，人脸活体检测技术应运而生。并且人脸活体检测技术的研究已经成为生物认证领域的一个研究热点。人脸识别技术的主要攻击包括：照片，视频，以及3D模型。人脸假冒欺骗手段的多样化给人脸欺骗检测技术的研究带来了极大的挑战。真实人脸与假冒人脸两者的主要区别主要来自一下三个方面：(1)图像纹理：假冒的人脸图像经过了二次采集甚至更多次采集。经过多次采集之后，图像的纹理信息会发生变化。(2)三维结构：真实人脸是三维结构，而照片人脸以及视频人脸都是二维结构。(3)运动模式：运动模式包括两方面，一方面是人脸自身的运动，这种运动模式多种多样，例如眨眼运动，嘴唇运动以及表情的变化等等。照片人脸很难模拟出这样的运动，而视频可以通过人机...

【技术保护点】
一种基于卷积神经网络的活体人脸检测方法,其特征在于，包括以下步骤：A、对摄像头采集的视频进行分帧采样；B、对样本图像进行归一化；C、利用卷积神经网络对归一化后的图像进行特征提取；步骤C具体包括：C1、设计卷积神经网络的网络结构；该网络结构包括一个输入层，4个卷积层一个全连接层以及一个soft‑max层；输入层的图像大小是X*X，包括RGB三个通道，所以输入为X*X*3；输入层的图像在进行卷积神经网络处理前需要进行预处理，将X*X像素的图像的四个角进行裁剪，并将图像再以中心为基准进行裁剪，裁剪后总共得到5幅大小为S*S像素(S<X)的图像，然后将5幅图像进行水平翻转；这样一幅图像经过裁剪以及翻转后得到10幅图像；第一个卷积层与第二个卷积层的是权值共享的，它们分别包括64个卷积核，每个卷积核的大小为5*5；在第一个卷积层与第二个卷积层后面分别连接了一个max‑pooling层，max‑pooling层的大小为3*3；一幅S*S像素的图像经过第一个卷积层后得到64个S*S的图像块，即特征图；经过第一个max‑pooling层后，得到64个S1*S1像素的特征图，S1＝S/2，特征图的大...

【技术特征摘要】
1.一种基于卷积神经网络的活体人脸检测方法,其特征在于，包括以下步骤：A、对摄像头采集的视频进行分帧采样；B、对样本图像进行归一化；C、利用卷积神经网络对归一化后的图像进行特征提取；步骤C具体包括：C1、设计卷积神经网络的网络结构；该网络结构包括一个输入层，4个卷积层一个全连接层以及一个soft-max层；输入层的图像大小是X*X，包括RGB三个通道，所以输入为X*X*3；输入层的图像在进行卷积神经网络处理前需要进行预处理，将X*X像素的图像的四个角进行裁剪，并将图像再以中心为基准进行裁剪，裁剪后总共得到5幅大小为S*S像素(S<X)的图像，然后将5幅图像进行水平翻转；这样一幅图像经过裁剪以及翻转后得到10幅图像；第一个卷积层与第二个卷积层的是权值共享的，它们分别包括64个卷积核，每个卷积核的大小为5*5；在第一个卷积层与第二个卷积层后面分别连接了一个max-pooling层，max-pooling层的大小为3*3；一幅S*S像素的图像经过第一个卷积层后得到64个S*S的图像块，即特征图；经过第一个max-pooling层后，得到64个S1*S1像素的特征图，S1＝S/2，特征图的大小变为原来的一半，也就是说经过max-pooling层后进行了降维，特征向量的维数变为原来的一半；这样，经过第二个卷积层与第二个max-pooling层后，特征图的大小为S2*S2像素，S2＝...

【专利技术属性】
技术研发人员：毋立芳，许晓，漆薇，贺娇瑜，徐姚文，张洪嘉，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人