基于深度强化学习的人脸关键点检测方法及装置制造方法及图纸

技术编号：18764387 阅读：633 留言：0更新日期：2018-08-25 10:46

本发明专利技术公开了一种基于深度强化学习的人脸关键点检测方法及装置，其中，方法包括以下步骤：通过马尔科夫决策过程对人脸关键点检测问题进行数学建模；通过形状推测网络得到一个初始形状，将其通过k近邻，获取该形状候选子集；通过形状决策网络对形状候选子集中每个候选形状进行评价，并获取分数最高的形状；将形状推断网络和形状决策网络通过策略梯度同时优化，获取最终推断决策网络结构，以得到人脸关键点。该方法通过推断决策的框架，能够在形状连续空间中，找到一条最优的形状搜索路径，以最大化形状评价分数，从而有效提高人脸关键点检测的准确性和可靠性。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度强化学习的人脸关键点检测方法及装置
本专利技术涉及计算机视觉
，特别涉及一种基于深度强化学习的人脸关键点检测方法及装置。
技术介绍
人脸关键点检测旨在对于给定的人脸图像，定位多个特征关键点(如眉毛、眼睛、鼻子、嘴巴、面廓等)的位置。该技术在多个人脸分析人物中起着重要的作用，如人脸识别、头部姿态估计、人脸属性分析等。尽管近年来有一系列方法致力于人脸关键点检测的研究中，但是人脸关键点检测问题依旧具有很大的挑战性。这主要由于在自然开放场景下获得的人脸图像由于大姿态和大表情，具有很大的变化性，使得人脸关键点检测的算法很容易陷入局部最优，很难处理一些极端情况，导致最终关键点检测效果很差。相关技术的主要的研究方法可以分为两类：基于模型的方法，基于级联回归的方法。基于模型的方法主要是通过对于小批量人脸训练数据进行PCA(Principalcomponentsanalysis，主成分分析)主成分分析，获得人脸的形状模型，对于测试图像，通过调整人脸形状模型的点的位置和参数，使得表观能量最大化，得到调整后的模型结果即为检测结果。基于级联回归的方法主要是通过从一个平均人脸形状出发，提取每个关键点的局部特征，通过回归器学习人脸形状的变化量，以级联的方式逐步更新形状。目前基于级联回归的方法取得了最先进的结果也是最流行的人脸关键点检测方法。代表方法有：ESR(ExplicitShapeRegression，显式形状回归)，SDM(SpatialDubinModel，监督下降模型)，CFSS(CoarsetoFineShapeSearching，由粗到精的形状搜索)。尽管...

【技术保护点】
1.一种基于深度强化学习的人脸关键点检测方法，其特征在于，包括以下步骤：通过马尔科夫决策过程对人脸关键点检测问题进行数学建模；通过形状推测网络得到一个初始形状，将其通过k近邻，获取该形状候选子集；通过形状决策网络对所述形状候选子集中每个候选形状进行评价，并获取分数最高的形状；以及将所述形状推断网络和所述形状决策网络通过策略梯度同时优化，获取最终推断决策网络结构，以得到人脸关键点。

【技术特征摘要】
1.一种基于深度强化学习的人脸关键点检测方法，其特征在于，包括以下步骤：通过马尔科夫决策过程对人脸关键点检测问题进行数学建模；通过形状推测网络得到一个初始形状，将其通过k近邻，获取该形状候选子集；通过形状决策网络对所述形状候选子集中每个候选形状进行评价，并获取分数最高的形状；以及将所述形状推断网络和所述形状决策网络通过策略梯度同时优化，获取最终推断决策网络结构，以得到人脸关键点。2.根据权利要求1所述的基于深度强化学习的人脸关键点检测方法，其特征在于，所述马尔科夫决策过程包括动作、状态和奖励，其中，所述动作为提供所有关键点的更新位移量得到的形状偏差，所述状态为通过剪裁人脸图像中关键点附近的图像块得到的人脸局部表观特征，所述奖励为通过归一化的点对点距离得到。3.根据权利要求1所述的基于深度强化学习的人脸关键点检测方法，其特征在于，在所述形状推测网络中，第一优化目标为：形状推断网络输出的动作为：相对应到状态空间为：其中，ρπ(x)为状态空间概率分布，X为提取的人脸局部表观特征，为可微策略函数，为期望，为推断网络函数，I为图像，p为人脸关键点形状，d为局部图像块大小。4.根据权利要求1或2所述的基于深度强化学习的人脸关键点检测方法，其特征在于，在所述形状决策网络中，第二优化目标为：其中，Qπ()为决策网络函数，r()为奖励函数。5.根据权利要求1-4任一项所述的基于深度强化学习的人脸关键点检测方法，其特征在于，所述策略梯度的梯度公式为：其中，为决策网络函数。6.一种基于深度强化学习...

【专利技术属性】
技术研发人员：鲁继文，周杰，刘昊，郭明皓，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人