【技术实现步骤摘要】
【国外来华专利技术】用于人脸对准的形状预测
技术介绍
本公开总体上涉及识别图像中的面部定位和对准,并且更具体,涉及定位人脸上的面部锚定点的位置。面部对准定位了图像中人脸上的面部锚定点。面部锚定点是在面部特征(例如,眼睛、鼻子、嘴以及下颌线)周围的轮廓点。从被定位的面部锚定点提取的特征(例如,形状和纹理)为许多人脸处理应用(例如人脸跟踪、人脸建模、人脸识别、面部表情分析以及人脸合成)提供了基础的信息。针对人脸对准存在许多不同的方法。这些方法的实例包括梯度提升决策树(GBDT)的级联、高斯过程回归树的级联、或者其他级联学习框架。然而,这些方法中的许多目前受制于缺点。一个缺点是这些方法抬高了成本和功耗。例如,一些方法需要针对每个面部锚定点计算在图像中定义的当前坐标与在默认形状中定义的坐标之间的变换矩阵。这种计算是计算密集的。在另一实例中,通过这些方法生成的预测模型可能太大而无法存储在移动设备上或者无法快速地下载,这可能妨碍了任何需要的更新。另一个缺点是这些方法不能提供精确的预测模型。例如,这些方法全局地训练预测模型而未考虑面部姿态、面部采光、面部表情以及遮蔽的大的变化。在另一实例中,当在学习速率和预测之间存在差异时出现过度拟合。在不考虑级联的不同级的变化的情况下,这些方法对级联的所有级应用全局学习因子(也被称为收缩因子)以减少过度拟合。这可能导致不精确的形状预测。
技术实现思路
一种使用一组回归树的模型确定对描述人脸的面部锚定点的面部形状的调整,以匹配图像中的人脸。该模型包括一组有序序列的级联级,每个级联级包括一组决策树。在级联的决策树中的每一层,层内的树评估相对于图像的当前拟合形状(例如, ...
【技术保护点】
1.一种方法,包括:识别调整为人脸的图像的网格形状,所述网格形状具有一组元素,每个元素具有一组顶点;对于具有多个决策树的级联级中的每个决策树,遍历所述决策树直到从多个叶节点到达一叶节点:识别与遍历决策相关联的一个或多个位置;每个位置以相对于所述网格形状的元素的坐标来描述;对于一个或多个已识别位置中的每一个,基于所述图像上的所述元素的所述一组顶点的坐标和定位识别所述图像上的像素;基于针对所述一个或多个已识别位置而识别的所述像素的像素值,确定针对所述遍历决策的后续节点;对于所述多个决策树中到达的每个叶节点,识别出所述网格形状相对于所述人脸的所述图像的调整向量;组合针对所述叶节点的已识别调整向量,以确定针对所述级联级的组合调整向量;以及基于所述组合调整向量修改所述网格形状到所述图像中的所述人脸的调整。
【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:识别调整为人脸的图像的网格形状,所述网格形状具有一组元素,每个元素具有一组顶点;对于具有多个决策树的级联级中的每个决策树,遍历所述决策树直到从多个叶节点到达一叶节点:识别与遍历决策相关联的一个或多个位置;每个位置以相对于所述网格形状的元素的坐标来描述;对于一个或多个已识别位置中的每一个,基于所述图像上的所述元素的所述一组顶点的坐标和定位识别所述图像上的像素;基于针对所述一个或多个已识别位置而识别的所述像素的像素值,确定针对所述遍历决策的后续节点;对于所述多个决策树中到达的每个叶节点,识别出所述网格形状相对于所述人脸的所述图像的调整向量;组合针对所述叶节点的已识别调整向量,以确定针对所述级联级的组合调整向量;以及基于所述组合调整向量修改所述网格形状到所述图像中的所述人脸的调整。2.根据权利要求1所述的方法,其中,所述位置在相对于所述元素的所述一组顶点的重心坐标系中指定。3.根据权利要求1或2所述的方法,进一步包括将对所述网格形状的已修改的调整提供给另一级联级。4.根据权利要求1或2所述的方法,其中,所述级联级是修改所述网格形状的级联级的有序序列中的一个,并且在所述有序序列中的每个级联级使用在所述有序序列中的先前级联级的已修改网格形状。5.根据权利要求4所述的方法,其中,所述级联级的有序序列在一组图像上得到训练,并且其中,针对所述序列中的先前级联级的学习因子低于所述序列中的稍后级联级。6.根据权利要求4或5所述的方法,其中,训练所述级联级的有序序列以确定与所述级联级中的树的遍历决策相关联的阈值,所述训练优化Huber代价函数。7.根据权利要求4至6中任一项所述的方法,进一步包括指定与所述级联级的所述决策树中的所述遍历决策相关联的所述位置,其中,分隔所述位置的距离被约束成高于针对所述序列中的稍后级联级的最大距离的针对所述级联级的序列中的先前级联级的最大距离。8.根据权利要求4至7中任一项所述的方法,其中,所述级联级的有序序列在一组图像上得到训练,并且其中,针对所述序列中的先前级联级的学习因子低于所述序列中的稍后级联级。9.根据权利要求1至8中任一项所述的方法,其中,所述网格形状是从多个随机化形状取平均的均值形状,所述多个随机形状对应于具有已知面部锚定点的已标记图像。10.根据权利要求1至9中任一项所述的方法,其中,所述决策树在一组图像上得到训练,每个图像具有要由所述决策树训练习得的相关联的一组形状,以得到相关联的形状。11.根据权利要求10所述的方法,进一步包括:针对所述一组图像确定图像的属性的值的直方图,通过以下方式针对图像生成所述相关联的一组形状:相对于所述直方图确定针对所述图像的所述属性的值的相对频率;基于所述值的所述相对频率生成针对所述图像的一定数量的形状,所生成的形状的所述数量与所述值的所述相对频率成反比。12.一种非暂时性计算机可读介质,包括能够由处理器执行的指令,所述指令使所述处理器执行以下步骤:识别调整为人脸的图像的网格形状,所述网格形状具有一组元素,每个元素具有一组顶点;对于具有多个决策树的级联级中的每个决策树,遍历所述决策树直到从多个叶节点到达一叶节点:识别与遍历决策相关联的一个或多个位置;每个位置以相对于所述网格形状的元素的坐标来描述;对于一个或多个已识别位置中的每一个,基于所述图像上的所述元素的所述一组顶点的坐标和定位识别所述图像上的像素;基于针对所述一个或多个已识别位置而识别的所述像素的像素值,确定针对所述遍历决策的后续节点;对于所述多个决策树中到达的每个叶节点,识别出所述网格形状相对于所述人脸的所述图像的调整向量;组合针对所述叶节点的已识别调整向量,以确定针对所述级联级的组合调整向量;以及基于所述组合调整向量修改所述网格形状到所述图像中的所述人脸的调整。13.根据权利要求12所述的非暂时性计算机可读介质,其中,所述位置在相对于所述元素的所述一组顶点的重心坐标系中指定。14.根据权利要求12或13所述的非暂时性计算机可读介质,其中,所述步骤进一步包括将对所述网格形状的已修改的调整提供给另一级联级。15.根据权利要求12或13所述的非暂时性计算机可读介质,其中,所述级联级是修改所述网格形状的级联级的有序序列中的一个,并且在所述有序序列中的每个级联级使用在所述有序序列中的先前级联级的已修改网格形状。16.根据权利要求15所述的非暂时性计算机可读介质,其中,所述级联级的有序序列在一组图像上得到训练,并且其中,针对所述序列中的先前级联级的学习因子低于所述序列中的稍后级联级。17.根据权利要求15或16所述的非暂时性计算机可读介质,其中,训练所述级联级的有序序列以确定与所述级联级中的树的遍历决策相关联的阈值,所述训练优化Huber代价函数。18.根据权利要求15至17中任一项所述的非暂时性计算机可读介质,所述步骤进一步包括指定与所述级联级的所述决策树中的所述遍历决策相关联的所述位置,其中,分隔所述位置的距离被约束成高于针对所述序列中的稍后级联级的最大距离的针对所述级联级的序列中的先前级联级的最大距离。19.根据权利要求15至18中任一项所述的非暂时性计算机可读介质,其中,所述级联级的有序序列在一组图像上得到训练,并且其中,针对所述序列中的先前级联级的学习因子低于所述序列中的稍后级联级。20.根据权利要求12至19中任一项所述的非暂时性计算机可读介质,其中,所述网格形状是从多个随机化形状取平均的均值形状,所述多个随机化形状对应于具有已知面部锚定点的已标记图像。21.根据权利要求12至20中任一项所述的非暂时性计算机可读介质,其中,所述决策树在一组图像上得到训练,每个图像具有要由所述决策树训练习得的相关联的一组形状,以得到相关联的形状。22.根据权利要求21所述的非暂时性计算机可读介质,所述步骤进一步包括:针对所述一组图像确定图像的属性的值的直方图,通过以下方式针对图像生成所述相关联的一组形状:关于所述直方图确定针对所述图像的所述属性的值的相对频率;基于所述值的所述相对频率生成针对所述图像的一定数量的形状,所生成的形状的所述数量与所述值的所述相对频率成反比。23.一种方法,包括:识别用于调整网格形状以使面部锚定点匹配至人脸的图像的模型,所述模型具有一组决策树,每个决策树指定能够由逻辑访问以用于遍历所述决策树的多...
【专利技术属性】
技术研发人员:叶夫根尼·扎捷普亚金,
申请(专利权)人:脸谱公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。