当前位置: 首页 > 专利查询>复旦大学专利>正文

基于深度卷积神经网络模型的大规模人脸识别方法技术

技术编号:15691491 阅读:589 留言:0更新日期:2017-06-24 04:44
本发明专利技术属于计算机视觉、人工智能技术领域,具体为一种基于深度卷积神经网络模型的大规模人脸识别方法。本发明专利技术首先提出面向大规模人脸识别的残差学习深度网络模型,该模型由卷积层、下采样层、残差层以及全连接层组成,其中残差层由两路数据(一路是若干个卷积层级联的数据和一路原始数据)相加求和构成,并且模型中每一个卷积层之后都做批量归一化操作。本发明专利技术利用深度卷积神经网络学习能力强和残差学习收敛好的特性,在网络模型层数方面,把模型的层数增加;在残差层结构方面,本发明专利技术提出一个高效的残差层结构。在面向大规模人脸识别领域,本发明专利技术较之基线模型在准确率方面得到了极大提升,在百万级人脸数据库中人脸检索的准确率达到了74.25%。

Large scale face recognition method based on depth convolution neural network model

The invention belongs to the technical field of computer vision and artificial intelligence, in particular to a large-scale face recognition method based on a deep convolution neural network model. The present invention first proposed residuals for face recognition large-scale learning depth network model, the model is composed of coil layers, sampling layer, residual layer and connection layer, wherein the residual layer consists of two data (a road is a plurality of cascaded convolutional layer and one channel of original data) the sum of the sum, and model each volume layer do after batch normalization operation. The invention uses deep convolutional neural network has strong learning ability and good convergence characteristics of residual learning in the network model, the model number, the number increased; in the residual layer structure, the invention proposes an efficient residual layer structure. In the face of large-scale face recognition, the proposed method has greatly improved the accuracy rate compared with the baseline model, and the accuracy of face retrieval has reached 74.25% in a million face database.

【技术实现步骤摘要】
基于深度卷积神经网络模型的大规模人脸识别方法
本专利技术属于计算机视觉、人工智能
,具体涉及大规模人脸识别方法。
技术介绍
在当前机器学习技术及计算机硬件性能高速提升的情况下,近年来计算机视觉、自然语言处理和语音识别等应用领域取得了突破性进展。人脸识别作为计算机视觉领域一项基础的任务,其精度也得到了大幅提升。在过去的几年当中,许多大型科技公司以及著名的研究机构提出了许多高效的人脸识别的方法,在行业内最著名的人脸评测集LFW上的准确率超过了99%。这样显著的成绩主要归功与两个方面:深度学习和海量数据。深度学习解决了人脸识别当中的特征表达的问题,相比传统的方法,能够更加全面地学习人脸的特征。海量的训练数据直接提升了人脸识别的精度。在实际运用场景中,当需要识别的对象在百万量级的数据库当中,LFW评测集上表现接近完美的模型性能也大打折扣。MegaFace评测集是第一个百万级别的人脸评测数据集,更加接近现实生活。目前提升人脸识别性能的方法主要有三种:(1)增加训练数据;(2)通过多任务学习的方式训练模型;(3)利用度量学习找到更加合适的学习方法。通过海量的数据训练能够提升人脸识别模型的性能,然而收集大量的人脸数据是一件极其困难的工作;训练多个模型,然后进行模型混合的方法会让人脸识别的过程变得过于复杂,不利于实际场景中的运用;度量学习对训练模型的技巧要求太高,而且模型的泛化能力不强。因此通过一种高效的深度卷积神经网络模型来提升人脸识别精度成为了一种新的有效的途径。
技术实现思路
本专利技术的目的在于提供一种基于深度卷积神经网络模型的大规模人脸识别方法,来提升人脸识别精度,以解决当前实际运用场景下大规模人脸识别困难的问题。本专利技术首先提出一个全新的基于残差学习的深度卷积神经网络模型,此模型能够学习到更多的特征,更好地进行特征表达,更加适合大规模的人脸识别任务。本专利技术提出的大规模人脸识别方法,采用上述基于残差学习的深度卷积神经网络模型,实现的硬件平台需要一张NVIDIATITANX显卡。本专利技术首先对数据集图片进行预处理,然后训练深度卷积神经网络模型,最后通过深度卷积神经网络模型提取特征,利用特征向量计算相似度,实现人脸识别。具体包括3个过程:预处理图片、训练深度卷积神经网络模型、面向大规模人脸识别:步骤1、预处理图片(1)检测图片中的人脸;(2)检测人脸中的5个关键点(两眼、鼻尖、两边嘴角);(3)进行人脸对齐操作;(4)将人脸图片大小归一化,例如把人脸图片大小归一化至112×96。步骤2、训练深度卷积神经网络模型(1)搭建基于残差学习的深度卷积神经网络模型;(2)前向传播计算损失误差(SoftMaxLoss);(3)反向传播损失误差(SoftMaxLoss)更新模型参数;(4)获得训练好的深度卷积神经网络模型。步骤3、大规模人脸识别(1)测试图片通过深度卷积神经网络模型;(2)提取特征向量;(3)利用特征向量进行相似度计算;(4)输出识别结果。步骤2训练深度卷积神经网络模型,具体介绍如下:(1)搭建本专利技术提出的基于残差学习的深度卷积神经网络模型:本专利技术提出的模型由卷积层、下采样层、残差层以及全连接层组成,其中残差层由两路数据(一路是若干个卷积层级联的数据和一路原始数据)相加求和构成,并且网络结构中每一个卷积层之后都做批量归一化(BatchNormalization)操作;具体的网络模型从输入层I开始,依次经过卷积层C1,卷积层C2,下采样层P1,残差层R1_1,残差层R1_2,残差层R1_3,卷积层C3,下采样层P2,残差层R2_1,残差层R2_2,残差层R2_3,残差层R2_4,卷积层C4,下采样层P3,残差层R3_1,残差层R3_2,残差层R3_3,残差层R3_4,残差层R3_5,残差层R3_6,卷积层C5,下采样层P4,残差层R4_1,残差层R4_2,残差层R4_3,最后到全连接层F1;(2)用10575个人的49万张图片作为训练数据,分批次输入搭建好的网络模型;(3)训练集图片通过模型,前向传播用全连接层参数计算损失误差(SoftMaxLoss);(4)将损失误差(SoftMaxLoss)反向传播更新模型参数;(5)获得训练好的深度卷积神经网络模型。步骤3面向大规模人脸识别,具体介绍如下:(1)将一百万张人脸图片作为测试数据,依次输入训练好的网络模型;(2)取网络模型中全连接层的1024个参数作为人脸图片的特征向量;(3)利用特征向量进行相似度计算;(4)输出识别结果。本专利技术方法的主要特点有:(1)利用此模型在百万级别的人脸识别任务中取得了极好的效果;(2)模型训练数据量少,仅使用不到50万张人脸图片作为训练数据;(3)模型结构简单,不需要使用模型混合、多任务训练以及度量学习等方法。本专利技术方法利用了深度卷积神经网络学习能力强和残差学习收敛好的特性,在百万级人脸数据库中检索人脸这项高难度的任务中取得很高的准确率。相比于传统的计算机视觉方法,本专利技术方法利用深度卷积神经网络结构,充分学习输入图片特征,更加完整地进行图片特征表达,大幅提升了人脸识别的精度,尤其是在百万级人脸识别任务中取得了优秀的成绩。并且不同于目前广泛运用的度量学习、模型混合和多任务学习的方法,本专利技术方法提出的深度卷积神经网络模型简单高效,有效解决了百万级人脸识别任务中准确率不高以及模型搭建复杂的问题。在面向大规模人脸识别领域,本专利技术较之基线模型在准确率方面得到了极大提升,在百万级人脸数据库中人脸检索的准确率达到了74.25%。附图说明图1一种面向大规模人脸识别的残差学习深度网络模型流程图。图2本专利技术提出的基于残差学习的深度卷积神经网络模型结构图。图3残差层网络结构图。具体实施方式以下结合附图解释运用了本专利技术,基于残差学习的深度卷积神经网络模型在百万级别的人脸识别任务中的具体实施,实现的具体运算步骤如附图1所示。1、预处理图片首先利用图片处理工具MTCNN[19]检测图片中的人脸,然后利用MTCNN检测人脸中的5个关键点(两眼、鼻尖、两边嘴角),然后人脸对齐方法[20]进行人脸对齐操作,最后将处理过的图片大小归一化至112×96。2、搭建本专利技术提出的基于残差学习的深度卷积神经网络模型利用深度学习框架Caffe,搭建本专利技术提出的基于残差学习的深度卷积神经网络模型,如附图2所示。此模型由卷积层,下采样层,残差层以及全连接层组成,其中残差层由两路数据(一路是若干个卷积层级联的数据和一路原始数据)相加求和构成,如附图3所示,并且网络结构中每一个卷积层之后都做批量归一化(BatchNormalization)操作;其中,输入层I大小为112×96×3,卷积层C1(卷积核大小为3×3,滑动步长为1,填充为0,输出为32),卷积层C2(卷积核大小为3×3,滑动步长为1,填充为0,输出为64),下采样层P1(最大池化,大小为2×2,滑动步长为2,输出为64),残差层R1_1(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为64)级联的数据和一路原始数据相加),残差层R1_2(一路由3个卷积层(卷积核大小为3×3,滑动步长为1,填充为0,输出为64)级联的数据和一路原始数据相加),残差层R1_3(一路由3个卷积层(卷积核大小为3×3,滑动步本文档来自技高网...
基于深度卷积神经网络模型的大规模人脸识别方法

【技术保护点】
基于深度卷积神经网络模型的大规模人脸识别方法,其特征在于,采用基于残差学习的深度卷积神经网络模型,具体包括3个步骤:预处理图片、训练深度卷积神经网络模型、面向大规模人脸识别:步骤1、预处理图片(1)检测图片中的人脸;(2)检测人脸中的5个关键点:两眼、鼻尖、两边嘴角;(3)进行人脸对齐操作;(4)将人脸图片大小归一化;步骤2、训练深度卷积神经网络模型(1)搭建基于残差学习的深度卷积神经网络模型;(2)前向传播计算损失误差;(3)反向传播损失误差更新模型参数;(4)获得训练好的深度卷积神经网络模型;步骤3、大规模人脸识别(1)测试图片通过深度卷积神经网络模型;(2)提取特征向量;(3)利用特征向量进行相似度计算;(4)输出识别结果。

【技术特征摘要】
1.基于深度卷积神经网络模型的大规模人脸识别方法,其特征在于,采用基于残差学习的深度卷积神经网络模型,具体包括3个步骤:预处理图片、训练深度卷积神经网络模型、面向大规模人脸识别:步骤1、预处理图片(1)检测图片中的人脸;(2)检测人脸中的5个关键点:两眼、鼻尖、两边嘴角;(3)进行人脸对齐操作;(4)将人脸图片大小归一化;步骤2、训练深度卷积神经网络模型(1)搭建基于残差学习的深度卷积神经网络模型;(2)前向传播计算损失误差;(3)反向传播损失误差更新模型参数;(4)获得训练好的深度卷积神经网络模型;步骤3、大规模人脸识别(1)测试图片通过深度卷积神经网络模型;(2)提取特征向量;(3)利用特征向量进行相似度计算;(4)输出识别结果。2.根据权利要求1所述的大规模人脸识别方法,其特征在于,步骤2中所述基于残差学习的深度卷积神经网络模型,具体如下:模型由卷积层、下采样层、残差层以及全连接层组成,其中,残差层由两路数据:一路是若干个卷积层级联的数据和一路...

【专利技术属性】
技术研发人员:王展雄邵蔚元冯瑞
申请(专利权)人:复旦大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1