基于深度神经网络的实时人脸识别方法技术

技术编号:10022109 阅读:278 留言:1更新日期:2014-05-09 03:57
本发明专利技术提出了一种基于深度神经网络和邻近元分析的实时人脸识别方法。本发明专利技术首先利用多样性较好的大规模人脸库训练出一种多层神经网络,其中除最后一层外的每层为非线性层,尾层为线性层;然后利用有监督的邻近元分析的方法在混合人脸库的基础上继续训练得到的网络,使得网络对于人脸图像的理解加深,达到缩短同一个体间人脸图像距离、增大不同个体间人脸图像距离的目的,最后在实际的人脸识别阶段,本发明专利技术提出了一种“搜索半径”的概念,在确保识别率的前提下,缩短了识别所需时间,实现了实时的人脸识别。本发明专利技术的识别正确率较高,同时,本发明专利技术的识别速度较快,适合应用于实时人脸识别任务中。

【技术实现步骤摘要】
【专利摘要】本专利技术提出了一种基于深度神经网络和邻近元分析的实时人脸识别方法。本专利技术首先利用多样性较好的大规模人脸库训练出一种多层神经网络,其中除最后一层外的每层为非线性层,尾层为线性层;然后利用有监督的邻近元分析的方法在混合人脸库的基础上继续训练得到的网络,使得网络对于人脸图像的理解加深,达到缩短同一个体间人脸图像距离、增大不同个体间人脸图像距离的目的,最后在实际的人脸识别阶段,本专利技术提出了一种“搜索半径”的概念,在确保识别率的前提下,缩短了识别所需时间,实现了实时的人脸识别。本专利技术的识别正确率较高,同时,本专利技术的识别速度较快,适合应用于实时人脸识别任务中。【专利说明】
本专利技术属于模式识别领域,涉及一种人脸识别方法,特别涉及一种可实时进行人脸识别任务的人脸识别方法。
技术介绍
作为生物认证技术的一种,人脸识别凭借着非接触性、良好的用户体验等特性,以及稳步上升的识别率,有着巨大的市场潜力与科学研究价值。人脸识别属于图像识别的一种,图像识别的重难点在于赋予机器理解图像所蕴含隐含信息的能力,而作为一种可提取数据深层信息的特征提取方法,深度神经网络对基于图像的人脸识别技术有着一定的启发。目前,深度神经网络在模式识别领域已经有多项突破:微软采用深度神经网络技术进行语音识别,达到了现今最高的语音识别率;百度采用纽约大学Yann LeCun教授提出的深度卷积网络搭建了百度识图等应用,并组建了百度深度学习研究院;最新消息指出,谷歌搭建的深度学习系统在“学习”存储在服务器中大规模数据库的基础上已经可以做到独立思考的程度。然而,鲜有研究者将深度神经网络应用于人脸识别领域, 申请人:认为原因在于两点:一方面传统的深度神经网络+softmax的框架需要多张图像为每个个体建立一个模型,对于人脸识别这种类别数目不确定的任务适用性较差;另一方面,人脸识别所需要的图片尺寸较大,一般情况下,30X 30以上的图片才能达到满意效果,这样就加大了训练深度网络模型的难度。
技术实现思路
为探究深度神经网络对于人脸识别任务的识别效果,本专利技术提出了一种。首先利用多样性较好的大规模人脸库训练出一种多层神经网络,其中除最后一层外的每层为非线性层,尾层为线性层;然后利用有监督的邻近元分析的方法在混合人脸库的基础上继续训练得到的网络,使得网络对于人脸图像的理解加深,达到缩短同一个体间人脸图像距离、增大不同个体间人脸图像距离的目的,最后在实际的人脸识别阶段,本专利技术提出了一种“搜索半径”的概念,在确保识别率的前提下,缩短了识别所需时间,实现了实时的人脸识别。为了实现以上目的,本专利技术方法主要包括以下步骤:步骤(I).获取网络训练数据,具体是:选取多样性较好的人脸库作为大规模人脸库。另外,从多个人脸库中选取一部分图像组合成混合人脸库,其中对部分光照变化较强烈的图像进行光照归一化操作,减小光照的影响。采用Viola-Jones人脸检测器检测并剪切大规模人脸库与混合人脸库中图像内人脸部分。将大规模人脸库与混合人脸库中每张图像的像素值按行或列拉伸为一列,组合成行数为图像像素点数,列数为图像张数的矩阵,矩阵除以255,使得数据分布在0-1范围。步骤(2).使用深度神经网络在步骤(1)获取的大规模人脸库中人脸部分图像的基础上以无监督方式训练深度神经网络,具体算法如下。本专利技术以Autoencoder深度神经网络为框架,通过恢复大规模人脸库中人脸图像,以达到训练深度神经网络的目的,首先用反向传导算法训练每层网络,最后同样用反向传导算法调整网络整体表现。算法具体步聚如下:I)初始化每一层网络的权重惩罚因子、权重缩放比例、权重值、偏置值、分组数据大小等参数。权重惩罚因子为控制不让训练得到的网络权重过大,引起过拟合,假设初始化的权重比例为Ws,则有:Ws = sqrt (6)/sqrt (v+h+1) (I)式(I)中,V表示可见层节点数,h表示隐含层节点数。则可得到:【权利要求】1.,其特征在于该方法包括如下步骤: 步骤(1).获取网络训练数据,具体是:选取多样性较好的人脸库作为大规模人脸库;另外,从多个人脸库中选取一部分图像组合成混合人脸库,其中对部分光照变化较强烈的图像进行光照归一化操作,减小光照的影响;采用Viola-Jones人脸检测器检测并剪切大规模人脸库与混合人脸库中图像内人脸部分;将大规模人脸库与混合人脸库中每张图像的像素值按行或列拉伸为一列,组合成行数为图像像素点数,列数为图像张数的矩阵,矩阵除以255,使得数据分布在0-1范围; 步骤(2).使用深度神经网络在步骤(1)获取的大规模人脸库中人脸部分图像的基础上以无监督方式训练深度神经网络,具体算法如下; 1)初始化每一层网络的权重惩罚因子、权重缩放比例、权重值、偏置值、分组数据大小;权重惩罚因子为控制不让训练得到的网络权重过大,引起过拟合,假设初始化的权重比例为1,则有: Ws = sqrt(6)/sqrt(v+h+l) (I)式(I)中,V表示可见层节点数,h表示隐含层节点数;则可得到: W = 2*ws* (rand (h, v) -0.5) (2) Ψ = 2*ws* (rand (v, h) -0.5) (3) 式(2) (3)中,W、W'分别为可见层、隐含层的初始化权重,rand(m,n)为可生成在(0,I)之间均匀分布随机数组成的mXn矩阵的函数; 2)确定网络的损失函数;Autoencoder的目标是是不断改进网络,增强网络对于原始数据的恢复能力,网络的损失函数为: 【文档编号】G06K9/00GK103778414SQ201410023333【公开日】2014年5月7日 申请日期:2014年1月17日 优先权日:2014年1月17日 【专利技术者】罗志增, 邢健飞, 席旭刚, 高云园 申请人:杭州电子科技大学本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:罗志增邢健飞席旭刚高云园
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有1条评论
  • 来自[北京市联通互联网数据中心] 2014年12月08日 17:11
    时人动漫作品鬼眼狂刀中的人物太四老之一村正的妹妹姬时和吹雪的女儿
    0
1