一种基于卷积神经网络的表观年龄估计方法及装置制造方法及图纸

技术编号:14583231 阅读:356 留言:0更新日期:2017-02-08 13:16
本发明专利技术公开一种基于卷积神经网络的表观年龄估计方法,其包括:步骤a,人脸检测,确定人脸图片大小;步骤b,图像预处理,在训练集上计算每个像素的RGB均值;步骤c,将每个像素的RGB均值输入到多卷积层;步骤d,池化层,进行池化操作;步骤e,进入全连接层,将相邻两层通过权值全连接;步骤f,使用softmax loss函数深度监督结构;步骤g,采用延时反向传导减少信息丢失;步骤h:使用hinge loss函数进行回归监督,减少信息丢失;步骤i:概率矩阵。这样,通过采用softmax loss函数进行深度监督结构;延时传导机制减少传导层来减少信息损失;hinge loss模块减少传导层,减少了信息丢失;采用SVR中的支持向量能够找到更好的分界面,使得分类平面更优,泛化能力更强。

【技术实现步骤摘要】

本专利技术属于图像识别
,具体涉及一种基于卷积神经网络的表观年龄估计方法及装置。
技术介绍
尽管自动年龄估计十分重要,但是与表情识别、人脸识别等面相研究工作相比,自动年龄估计技术起步较晚。最初的研究文献可以追溯到1994年Kwon和Lobo发表的论文,真正意义上的研究可以追溯到2002年Lanities的工作。迄今为止,无论在国内还是国外,关注年龄估计的研究还是相对较少的。年龄估计是回归问题,传统线性回归和SVR都是线性模型,只能处理线性可分的情况。即使加上核函数的SVR可以处理线性不可分的情况,但是核函数是手工设定的固定的,不能够从大量数据中学习,泛化能力较差。鉴于上述缺陷,本专利技术创作者经过长时间的研究和实践终于获得了本专利技术。
技术实现思路
为解决上述技术缺陷,本专利技术采用的技术方案在于,提供一种基于卷积神经网络的表观年龄估计方法,其包括:步骤a,人脸检测,确定人脸图片大小;步骤b,图像预处理,在训练集上计算每个像素的RGB均值;步骤c,将每个像素的RGB均值输入到多卷积层;步骤d,进入池化层,进行池化操作;步骤e,进入全连接层,将相邻两层通过权值全连接;步骤f,使用softmaxloss函数深度监督结构;步骤g,采用延时反向传导减少信息丢失;步骤h:使用hingeloss函数进行回归监督,减少信息丢失;步骤i:概率矩阵。较佳的,所述步骤f中,softmax函数的表达式为:αi=∑khkWki上式中h表示倒数第二层节点的激励函数,W表示连接倒数第二层和softmax层的权值。较佳的,所述步骤g中采用减少传导的层数减少信息丢失。较佳的,所述步骤h中hingeloss回归函数为:在特征空间F中,W是F中的一个向量,将输入x映射为F中的一个向量,为了处理异常值引入了松弛变量ξi,最优化下式求解W和b:minω,bP=12WTW+CΣi=1l(ξi+ξi*)]]>5、一种基于卷积神经网络的表观年龄估计装置,其包括:人脸检测模块采用人脸检测器检测原图像和离散旋转后的图像,正确标定人脸,人脸图片大小归一化为256×256个像素,作为后续跟踪识别的输入图像;图像预处理模块,在训练集上计算每个像素的RGB均值;池化层模块4,通过池化来降低卷积层输出的特征向量,同时改善结果,不易出现过拟合:全连接层模块5,将相邻两层通过权值全连接;softmaxloss模块,采用softmax函数进行深度监督结构;延时传导模块,采用延时传导,减少传导的层数,减少信心损失;hingeloss模块,采用回归损失函数hingeloss,反向传导到前一层,减少信息丢失;概率矩阵模块,全连接层的输出使得softmax层得到此样本属于每类的概率矩阵,通过概率矩阵中的最大概率值达到该测试图像的类别。较佳的,所述softmaxloss模块采用softmax函数的表达式为:αi=ΣkhkWki上式中h表示倒数第二层节点的激励函数,W表示连接倒数第二层和softmax层的权值。较佳的,所述延时反向传导模块采用减少传导的层数减少信息丢失。较佳的,所述hingeloss模块采用hingeloss回归函数为:在特征空间F中,W是F中的一个向量,将输入x映射为F中的一个向量,为了处理异常值引入了松弛变量ξi,最优化下式求解W和b:minω,bP=12WTW+CΣi=1l(ξi+ξi*)]]>与现有技术比较本专利技术的有益效果在于:通过采用softmaxloss函数进行深度监督结构;延时传导机制减少传导层来减少信息损失;hingeloss模块减少传导层,减少了信息丢失;采用SVR中的支持向量能够找到更好的分界面,使得分类平面更优,泛化能力更强。附图说明为了更清楚地说明本专利技术各实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。图1为本专利技术实施例一的一种基于卷积神经网络的表观年龄估计方法的流程图;图2为本专利技术实施例6的一种基于基于卷积神经网络的表观年龄估计装置的功能示意图。具体实施方式以下结合附图,对本专利技术上述的和另外的技术特征和优点作更详细的说明。实施例一图1为本专利技术一种基于卷积神经网络的表观年龄估计方法的流程图,其中,所述基于卷积神经网络的表观年龄估计方法包括:步骤a:人脸检测,确定人脸图片大小;步骤b:图像预处理,在训练集上计算每个像素的RGB均值;步骤c:将每个像素的RGB均值输入到多卷积层;步骤d:池化层,进入池化层,进行池化操作;步骤e,进入全连接层,将相邻两层通过权值全连接;步骤f:使用softmaxloss函数深度监督结构;步骤g:采用延时反向传导减少信息丢失;步骤h:使用hingeloss函数进行回归监督,减少信息丢失;步骤i:概率矩阵。基于卷积神经网络的表观年龄估计方法的有益效果在于:在SVR和线性回归的结构前端加上CNN深度网络结构,从大量数据中学习到规律。由于SVR中的支持向量能够找到更好的分界面,使得分类平面更优,泛化能力更强。实施例二如上所述的基于卷积神经网络的表观年龄估计方法,本实施例与其不同之处在于,在步骤a中,人脸检测是整个人脸系统最基础的一部分。针对所有的训练和测试图片,采用人脸检测器来获得人脸的确切位置。为了更正确标定人脸,在原图像和旋转后的图像都采取人脸检测器获得更好的效果。由于计算机资源的限定性,使用离散旋转的图像,在多角度旋转图像得到的检测结果中,选择得分最高的人脸图像,并且将其旋转至面部正上方向。如果在人脸图像中找不到人脸目标,就采取整幅图像进行训练和测试。检测出人脸后,在上下左右四个方向扩展人脸尺寸,增加信息以便获得更好的效果。假如人脸已经包含足够的信息,直接在边界处进行0填充,以此确保检测到的人脸图片大小与原图片相同。最后的人脸图片大小归一化为为256×256个像素,作为后续跟踪识别的输入图像。实施例三如上所述的基于卷积神经网络的表观年龄估计方法,本实施例与其不同之处在于,步骤f中在全连阶层后采用softmaxloss函数进行深度监督结构,softmaxloss函数如下式,式中h表示倒数第二层节点的激励函数,W表示连接倒数第二层和softmax层的权值,α表示softmax函数:αi=ΣkhkWki然后,pi=exp(αi)Σjlexp(αi)]]>预测的类别为:i=argmaxipi=argmaxiαi为了改进预测识别率,计算softmax概率的期望值,E(O)=Σi=0nyioi]]>其中,O=0,1,…,n表示n+1个输出层的年龄维度,oi表示softmax的输出概率,yi表示第i个类别的离散年龄值,E表示此样本预测离散年龄值。实施例四如上所述的基于卷积神经网络的表观年龄估计方法,本实施例与其不同之处在于,步骤g中延时反向传导机制原理为:尽管更深的网络有更高水平的表达能力,但越深的神经网络未必能得到更好的表现效果,甚至有所降低,仅通过增加网络深度可能会损害最终的预测性能;根据信息传导理论,信息传导过程会导致信息损失,反向传导的层数越多,会造成更多的信息损失。为了减少信息丢失,引进延时传导减少传导的层数,限制反向传导中的误差只传播一定数量的层数;延时传导通过引入额外的本文档来自技高网...

【技术保护点】
一种基于卷积神经网络的表观年龄估计方法,其特征在于,包括:步骤a,人脸检测,确定人脸图片大小;步骤b,图像预处理,在训练集上计算每个像素的RGB均值;步骤c,将每个像素的RGB均值输入到多卷积层;步骤d,进入池化层,进行池化操作;步骤e,进入全连接层,将相邻两层通过权值全连接;步骤f,使用softmax loss函数深度监督结构;步骤g,采用延时反向传导减少信息丢失;步骤h:使用hinge loss函数进行回归监督,减少信息丢失;步骤i:概率矩阵。

【技术特征摘要】
1.一种基于卷积神经网络的表观年龄估计方法,其特征在于,包括:步骤a,人脸检测,确定人脸图片大小;步骤b,图像预处理,在训练集上计算每个像素的RGB均值;步骤c,将每个像素的RGB均值输入到多卷积层;步骤d,进入池化层,进行池化操作;步骤e,进入全连接层,将相邻两层通过权值全连接;步骤f,使用softmaxloss函数深度监督结构;步骤g,采用延时反向传导减少信息丢失;步骤h:使用hingeloss函数进行回归监督,减少信息丢失;步骤i:概率矩阵。2.根据权利要求1所述的基于卷积神经网络的表观年龄估计方法,其特征在于,所述步骤f中,softmax函数的表达式为:αi=∑khkWki上式中h表示倒数第二层节点的激励函数,W表示连接倒数第二层和softmax层的权值。3.根据权利要求2所述的基于卷积神经网络的表观年龄估计方法,其特征在于,所述步骤g中采用减少传导的层数减少信息丢失。4.根据权利要求3所述的基于支持向量机的人脸特征识别方法,其特征在于,所述步骤h中hingeloss回归函数为:在特征空间F中,W是F中的一个向量,将输入x映射为F中的一个向量,为了处理异常值引入了松弛变量ξi,最优化下式求解W和b:minω,bP=12WTW+CΣi=1l(ξi+ξi*)]]>5.一种与权利要求1-4中任一所述的基于卷积神经网络的表观年龄估计方法对应的装置,其特征在于,所述基于支持向量机的人脸特征识别装置包括:人脸检测模块采用人脸检测器检测原图像和离散旋转后的图像,正确标定人脸,人脸图片大小归...

【专利技术属性】
技术研发人员:李青海简宋全侯大勇邹立斌窦钰景
申请(专利权)人:广州精点计算机科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1