本发明专利技术涉及一种基于弱监督的人脸年龄自动估计方法,包含以下步骤:预处理、根据图片本身的均值和方差对图片做归一化;卷积神经网络;提取特征向量和类别;计算每个类别的特征向量的中心点;计算每个图片与每个类别中心点的距离;根据图片与每个类别中心点的距离估算年龄。本发明专利技术依靠年龄段弱标签可以自动训练强分类具体年龄模型,该模型对一张未标注的图片自动估计具体年龄,减少了对人工精确标记的依赖。并且该算法从弱分类年龄段到强分类具体年龄的计算非常简单。
An automatic face age estimation method based on weak supervision
【技术实现步骤摘要】
基于弱监督的人脸年龄自动估计方法
本专利技术涉及人脸年龄自动估计方法,尤其是基于弱监督的人脸年龄自动估计方法。
技术介绍
人脸年龄自动估计指提供一张图片,自动识别出图中人物的年龄。这项技术有很多应用,如视频监控、产品推荐、人机交互、市场分析、用户画像、年龄变化预测等。近些年来随着深度学习特别是卷积神经网络领域的发展,人脸年龄估计算法的性能也得到了快速的提高。但是使用算法进行年龄估计仍是一个比较困难的任务,人脸年龄与头骨形状、五官位置、皱纹等都有一定关系,而且会受到光照、姿态、表情等的影响,即使是人类对年龄的观察估计也会有很大偏差,因此人工标记年龄也不精确。当前的大部分基于机器学习的年龄估计方法需要依赖人工标记精确年龄,然后让算法去自动学习图片和标记的年龄之间的对应关系。因为标记不精确,学习到的模型也有误差。并且人工标记是一个很费时的工作,很多时候获取不到具有精确标记的人脸年龄数据。
技术实现思路
本专利技术目的在于提供一种基于弱监督的人脸年龄估计方法,此处弱监督(或称弱标签)是指人工对一张图片进行年龄标记的时候,不需要标记精确的年龄,只标记儿童,少年,青年,壮年,老年等几个年龄阶段。这样一是可以减少人工估计年龄的时间,二是降低算法对人工标注的精确性的依赖。本专利技术的具体技术方案是:一种基于弱监督的人脸年龄自动估计方法,包含以下步骤:步骤一、预处理:对人脸图像,统一缩放和裁剪为设定尺寸,根据图片本身的均值和方差对图片做归一化;步骤二、卷积神经网络:卷积神经网络使用任一种卷积神经网络模型,以经典的残差网络为例,它包含若干卷积层和最后的全连接分类层,各层之间使用直接映射来连接;步骤三、提取特征向量和类别:神经网络的最终输出为图片所对应的类别得分,最后的全连接分类层的输入特征为图片对应的特征向量;步骤四、计算每个类别的特征向量的中心点:取训练集中的所有图片,按类别分组,计算每组对应特征向量集合的中心点;步骤五、计算每个图片与每个类别中心点的距离:对一个待测试的图片,提取特征向量后,计算该特征向量与每个类别中心点的距离,计算公式如下:dj_i=(fj-Ci)×(fj-Ci)其中,fj表示第j个测试的图片,Ci表示第i个类别的中心点;dj_i表示待测试的图片与Ci的距离;步骤六、根据图片与每个类别中心点的距离估算年龄:对一张待测试图片p,首先估算每个类中心点之间的距离,计算公式如下:Cij=(Ci-Cj)×(Ci-Cj)其中,Ci与Cj表示第i与第j个类别的中心点,Cij表示两个类别中心点之间的距离;年龄估算公式如下:yp=Yc_i+dp_i×(Ci_i+1>dp_i)×(Gi×0.5)其中,Gi表示第i类别年龄段的跨度,Yc_i表示第i类年龄段的中心年龄,所述中心年龄是预设跨度的平均值;例如儿童年龄段预设跨度为0-12岁,中心年龄为6岁;dp_i表示预测图片p与对应预测的类别i之间距离;Ci_i+1表示类别i与邻近类别之间的距离;yp是最终得出的年龄。进一步的,上述步骤一中统一缩放和裁剪为设定尺寸是缩放到124x124,然后随机裁剪为112x112。进一步的,上述卷积神经网络模型为残差网络,它包含若干卷积层和最后的全连接分类层,各层之间使用直接映射来连接。目前常用的年龄估计算法普遍存在两个问题:一是非常依赖人工精确标注,而这非常花费时间和精力;二是模型计算度复杂,难以满足实际需求。本专利技术所提出的基于非精确标记的年龄估计算法,即基于弱监督的人脸年龄自动估计方法,依靠弱标签(年龄段)可以自动训练强分类(具体年龄)模型,该模型对一张未标注的图片自动估计具体年龄,减少了对人工精确标记的依赖。并且该算法从弱分类(年龄段)到强分类(具体年龄)的计算非常简单,相对于神经网络,额外增加的计算量可以忽略不计。在以平均绝对误差MAE为标准的评估中,在同样的网络比如res18,以IMDB-WIKI数据集为例,误差为3.45。该结果与需要精确标记的方法相比是可比较的。以无需精确标记能达到同样的准确度说明了方法的有效性。附图说明图1是本专利技术一种基于弱监督的人脸年龄估计方法的流程图。图2是步骤三提取特征向量和类别的示意图。具体实施方式下面结合附图和具体实施方式对本专利技术作进一步详细的说明。一种基于弱监督的人脸年龄估计方法,如图1所示,其步骤如下:步骤一、数据预处理:利用MTCNN或任一种现有的人脸检测和对齐方法,裁剪出人脸框,进行人脸关键点对齐。然后在训练模型前对图像数据预处理,首先大小统一调整为144x144;然后随机裁剪为122x122,随机旋转(比如旋转角度±20°),随机像素亮度调整;最后对图片做归一化,计算图片本身的均值和方差,然后对图片所有像素,均减去均值,除以方差。步骤二、卷积神经网络:卷积神经网络不是固定的某种结构才能实现所提算法,为了更详细的描述实施方式,以残差网络resnet18为例,它的网络结构如图2所示。它包含17个卷积层,和一个全连接层。除了第一层,所有卷积层卷积核大小都为3x3。为了使梯度正常传播,多个卷积层之间以直接映射加间接映射的方式连接。最后的全连接层输出类别得分。步骤三、提取特征向量和类别:如图2所示,取全连接层fc1000之前的特征作为特征向量,预测类别的最大值作为对应类别。在本实施例中,特征向量的维度为256。步骤四、计算每个类别的特征向量的中心点:取所有训练集图片,按类别分组,对每个类别,计算该类别下所有图片提取到的特征向量的均值,作为该类的中心点。步骤五、计算要预测图片与类中心点距离:对于待预测图片,预处理后输入网络,提取特征向量和对应预测类别。计算特征向量与每个类中心点的距离,计算公式如下:dj_i=(fj-Ci)×(fj-Ci)其中,fj表示第j个测试的图片,Ci表示第i个类别的中心点;dj_i表示待测试的图片与Ci的距离。步骤六、根据图片与每个类别中心点的距离估算年龄:对于待预测图片,提取出特征向量和对应预测类别后,以对应类别的年龄段的中心点Yc_i为基础,计算特征向量与对应类别中心点的距离dp_i,dp_i越大,说明年龄偏移越大;dp_i越小,说明年龄偏移越小。偏移的方向由dp_i和预测对应类别与临近类别的中心距离Ci_i+1决定。如果dp_i大于Ci_i+1,说明方向应为负,否则方向应为正。对一张待测试图片p,首先估算每个类中心点之间的距离,计算公式如下:Cij=(Ci-Cj)×(Ci-Cj)其中,Ci与Cj表示第i与第j个类别的中心点,Cij表示两个类别中心点之间的距离;最终的年龄估算公式如下:yp=Yc_i+dp_i×(Ci_i+1>dp_i)×(Gi×0.5)其中,Gi表示第i类别年龄段的跨度,Yc_i表示第i类年龄段的中心年龄,所述中心年龄是预设跨度的平均值;例如儿童年龄段预设跨度为0-12本文档来自技高网...
【技术保护点】
1.基于弱监督的人脸年龄自动估计方法,包含以下步骤:/n步骤一、预处理:对人脸图像,统一缩放和裁剪为设定尺寸,根据图片本身的均值和方差对图片做归一化;/n步骤二、卷积神经网络:卷积神经网络使用任一种卷积神经网络模型,以经典的残差网络为例,它包含若干卷积层和最后的全连接分类层,各层之间使用直接映射来连接;/n步骤三、提取特征向量和类别:神经网络的最终输出为图片所对应的类别得分,最后的全连接分类层的输入特征为图片对应的特征向量;/n步骤四、计算每个类别的特征向量的中心点:取训练集中的所有图片,按类别分组,计算每组对应特征向量集合的中心点;/n步骤五、计算每个图片与每个类别中心点的距离:对一个待测试的图片,提取特征向量后,计算该特征向量与每个类别中心点的距离,计算公式如下:/nd
【技术特征摘要】
1.基于弱监督的人脸年龄自动估计方法,包含以下步骤:
步骤一、预处理:对人脸图像,统一缩放和裁剪为设定尺寸,根据图片本身的均值和方差对图片做归一化;
步骤二、卷积神经网络:卷积神经网络使用任一种卷积神经网络模型,以经典的残差网络为例,它包含若干卷积层和最后的全连接分类层,各层之间使用直接映射来连接;
步骤三、提取特征向量和类别:神经网络的最终输出为图片所对应的类别得分,最后的全连接分类层的输入特征为图片对应的特征向量;
步骤四、计算每个类别的特征向量的中心点:取训练集中的所有图片,按类别分组,计算每组对应特征向量集合的中心点;
步骤五、计算每个图片与每个类别中心点的距离:对一个待测试的图片,提取特征向量后,计算该特征向量与每个类别中心点的距离,计算公式如下:
dj_i=(fj-Ci)×(fj-Ci)
其中,fj表示第j个测试的图片,Ci表示第i个类别的中心点;dj_i表示待测试的图片与Ci的距离;
步骤六、根据图片与每个类别中心点的距离估算年龄:对一...
【专利技术属性】
技术研发人员:胡玉帅,沈修平,
申请(专利权)人:上海悠络客电子科技股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。