用于人脸对准的形状预测制造技术

技术编号：21519515 阅读：23 留言：0更新日期：2019-07-03 10:44

一种人脸跟踪系统，生成用于基于决策树的多级级联在人脸图像的一部分内提取人脸上的一组面部锚定点的模型。该人脸跟踪系统识别调整为人脸的图像的网格形状。对于每个决策树，人脸跟踪系统识别出网格形状相对于人脸的图像的调整向量。对于每个级联级，人脸跟踪系统将针对每个决策树的已识别调整进行组合以确定针对该级联级的组合调整向量。人脸跟踪系统基于组合调整向量修改网格形状至图像中的人脸的调整。人脸跟踪系统使用习得词典将模型缩减成词典和原子权重。模型可以更为容易地发送至设备并且存储在设备上。

Shape Prediction for Face Alignment

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于人脸对准的形状预测
技术介绍
本公开总体上涉及识别图像中的面部定位和对准，并且更具体，涉及定位人脸上的面部锚定点的位置。面部对准定位了图像中人脸上的面部锚定点。面部锚定点是在面部特征(例如，眼睛、鼻子、嘴以及下颌线)周围的轮廓点。从被定位的面部锚定点提取的特征(例如，形状和纹理)为许多人脸处理应用(例如人脸跟踪、人脸建模、人脸识别、面部表情分析以及人脸合成)提供了基础的信息。针对人脸对准存在许多不同的方法。这些方法的实例包括梯度提升决策树(GBDT)的级联、高斯过程回归树的级联、或者其他级联学习框架。然而，这些方法中的许多目前受制于缺点。一个缺点是这些方法抬高了成本和功耗。例如，一些方法需要针对每个面部锚定点计算在图像中定义的当前坐标与在默认形状中定义的坐标之间的变换矩阵。这种计算是计算密集的。在另一实例中，通过这些方法生成的预测模型可能太大而无法存储在移动设备上或者无法快速地下载，这可能妨碍了任何需要的更新。另一个缺点是这些方法不能提供精确的预测模型。例如，这些方法全局地训练预测模型而未考虑面部姿态、面部采光、面部表情以及遮蔽的大的变化。在另一实例中，当在学习速率和预测之间存在差异时出现过度拟合。在不考虑级联的不同级的变化的情况下，这些方法对级联的所有级应用全局学习因子(也被称为收缩因子)以减少过度拟合。这可能导致不精确的形状预测。
技术实现思路
一种使用一组回归树的模型确定对描述人脸的面部锚定点的面部形状的调整，以匹配图像中的人脸。该模型包括一组有序序列的级联级，每个级联级包括一组决策树。在级联的决策树中的每一层，层内的树评估相对于图像的当前拟合形状(例如，...

【技术保护点】
1.一种方法，包括：识别调整为人脸的图像的网格形状，所述网格形状具有一组元素，每个元素具有一组顶点；对于具有多个决策树的级联级中的每个决策树，遍历所述决策树直到从多个叶节点到达一叶节点：识别与遍历决策相关联的一个或多个位置；每个位置以相对于所述网格形状的元素的坐标来描述；对于一个或多个已识别位置中的每一个，基于所述图像上的所述元素的所述一组顶点的坐标和定位识别所述图像上的像素；基于针对所述一个或多个已识别位置而识别的所述像素的像素值，确定针对所述遍历决策的后续节点；对于所述多个决策树中到达的每个叶节点，识别出所述网格形状相对于所述人脸的所述图像的调整向量；组合针对所述叶节点的已识别调整向量，以确定针对所述级联级的组合调整向量；以及基于所述组合调整向量修改所述网格形状到所述图像中的所述人脸的调整。

【技术特征摘要】
【国外来华专利技术】1.一种方法，包括：识别调整为人脸的图像的网格形状，所述网格形状具有一组元素，每个元素具有一组顶点；对于具有多个决策树的级联级中的每个决策树，遍历所述决策树直到从多个叶节点到达一叶节点：识别与遍历决策相关联的一个或多个位置；每个位置以相对于所述网格形状的元素的坐标来描述；对于一个或多个已识别位置中的每一个，基于所述图像上的所述元素的所述一组顶点的坐标和定位识别所述图像上的像素；基于针对所述一个或多个已识别位置而识别的所述像素的像素值，确定针对所述遍历决策的后续节点；对于所述多个决策树中到达的每个叶节点，识别出所述网格形状相对于所述人脸的所述图像的调整向量；组合针对所述叶节点的已识别调整向量，以确定针对所述级联级的组合调整向量；以及基于所述组合调整向量修改所述网格形状到所述图像中的所述人脸的调整。2.根据权利要求1所述的方法，其中，所述位置在相对于所述元素的所述一组顶点的重心坐标系中指定。3.根据权利要求1或2所述的方法，进一步包括将对所述网格形状的已修改的调整提供给另一级联级。4.根据权利要求1或2所述的方法，其中，所述级联级是修改所述网格形状的级联级的有序序列中的一个，并且在所述有序序列中的每个级联级使用在所述有序序列中的先前级联级的已修改网格形状。5.根据权利要求4所述的方法，其中，所述级联级的有序序列在一组图像上得到训练，并且其中，针对所述序列中的先前级联级的学习因子低于所述序列中的稍后级联级。6.根据权利要求4或5所述的方法，其中，训练所述级联级的有序序列以确定与所述级联级中的树的遍历决策相关联的阈值，所述训练优化Huber代价函数。7.根据权利要求4至6中任一项所述的方法，进一步包括指定与所述级联级的所述决策树中的所述遍历决策相关联的所述位置，其中，分隔所述位置的距离被约束成高于针对所述序列中的稍后级联级的最大距离的针对所述级联级的序列中的先前级联级的最大距离。8.根据权利要求4至7中任一项所述的方法，其中，所述级联级的有序序列在一组图像上得到训练，并且其中，针对所述序列中的先前级联级的学习因子低于所述序列中的稍后级联级。9.根据权利要求1至8中任一项所述的方法，其中，所述网格形状是从多个随机化形状取平均的均值形状，所述多个随机形状对应于具有已知面部锚定点的已标记图像。10.根据权利要求1至9中任一项所述的方法，其中，所述决策树在一组图像上得到训练，每个图像具有要由所述决策树训练习得的相关联的一组形状，以得到相关联的形状。11.根据权利要求10所述的方法，进一步包括：针对所述一组图像确定图像的属性的值的直方图，通过以下方式针对图像生成所述相关联的一组形状：相对于所述直方图确定针对所述图像的所述属性的值的相对频率；基于所述值的所述相对频率生成针对所述图像的一定数量的形状，所生成的形状的所述数量与所述值的所述相对频率成反比。12.一种非暂时性计算机可读介质，包括能够由处理器执行的指令，所述指令使所述处理器执行以下步骤：识别调整为人脸的图像的网格形状，所述网格形状具有一组元素，每个元素具有一组顶点；对于具有多个决策树的级联级中的每个决策树，遍历所述决策树直到从多个叶节点到达一叶节点：识别与遍历决策相关联的一个或多个位置；每个位置以相对于所述网格形状的元素的坐标来描述；对于一个或多个已识别位置中的每一个，基于所述图像上的所述元素的所述一组顶点的坐标和定位识别所述图像上的像素；基于针对所述一个或多个已识别位置而识别的所述像素的像素值，确定针对所述遍历决策的后续节点；对于所述多个决策树中到达的每个叶节点，识别出所述网格形状相对于所述人脸的所述图像的调整向量；组合针对所述叶节点的已识别调整向量，以确定针对所述级联级的组合调整向量；以及基于所述组合调整向量修改所述网格形状到所述图像中的所述人脸的调整。13.根据权利要求12所述的非暂时性计算机可读介质，其中，所述位置在相对于所述元素的所述一组顶点的重心坐标系中指定。14.根据权利要求12或13所述的非暂时性计算机可读介质，其中，所述步骤进一步包括将对所述网格形状的已修改的调整提供给另一级联级。15.根据权利要求12或13所述的非暂时性计算机可读介质，其中，所述级联级是修改所述网格形状的级联级的有序序列中的一个，并且在所述有序序列中的每个级联级使用在所述有序序列中的先前级联级的已修改网格形状。16.根据权利要求15所述的非暂时性计算机可读介质，其中，所述级联级的有序序列在一组图像上得到训练，并且其中，针对所述序列中的先前级联级的学习因子低于所述序列中的稍后级联级。17.根据权利要求15或16所述的非暂时性计算机可读介质，其中，训练所述级联级的有序序列以确定与所述级联级中的树的遍历决策相关联的阈值，所述训练优化Huber代价函数。18.根据权利要求15至17中任一项所述的非暂时性计算机可读介质，所述步骤进一步包括指定与所述级联级的所述决策树中的所述遍历决策相关联的所述位置，其中，分隔所述位置的距离被约束成高于针对所述序列中的稍后级联级的最大距离的针对所述级联级的序列中的先前级联级的最大距离。19.根据权利要求15至18中任一项所述的非暂时性计算机可读介质，其中，所述级联级的有序序列在一组图像上得到训练，并且其中，针对所述序列中的先前级联级的学习因子低于所述序列中的稍后级联级。20.根据权利要求12至19中任一项所述的非暂时性计算机可读介质，其中，所述网格形状是从多个随机化形状取平均的均值形状，所述多个随机化形状对应于具有已知面部锚定点的已标记图像。21.根据权利要求12至20中任一项所述的非暂时性计算机可读介质，其中，所述决策树在一组图像上得到训练，每个图像具有要由所述决策树训练习得的相关联的一组形状，以得到相关联的形状。22.根据权利要求21所述的非暂时性计算机可读介质，所述步骤进一步包括：针对所述一组图像确定图像的属性的值的直方图，通过以下方式针对图像生成所述相关联的一组形状：关于所述直方图确定针对所述图像的所述属性的值的相对频率；基于所述值的所述相对频率生成针对所述图像的一定数量的形状，所生成的形状的所述数量与所述值的所述相对频率成反比。23.一种方法，包括：识别用于调整网格形状以使面部锚定点匹配至人脸的图像的模型，所述模型具有一组决策树，每个决策树指定能够由逻辑访问以用于遍历所述决策树的多...

【专利技术属性】
技术研发人员：叶夫根尼·扎捷普亚金，
申请(专利权)人：脸谱公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人