基于神经非刚性注册的人脸光流估计方法及装置制造方法及图纸

技术编号：33708909 阅读：13 留言：0更新日期：2022-06-06 08:37

本发明专利技术公开了一种基于神经非刚性注册的人脸光流估计方法及装置，能够快速、准确、高质量的估计输入前后两帧人脸RGB图片之间的人脸光流。借助于可微的非刚性注册，设计损失函数，通过优化损失函数反向优化光流估计网络和光流置信度估计网络的参数。非刚性注册过程提供的深度和人脸结构先验促进光流估计网络生成更加准确的光流。为了稳定网络训练过程，使用通过3D人脸重建和关键点检测得到的初始对应关系对非刚性注册过程进行引导。进一步引入人脸解析先验，通过给网络提供人脸语义信息，提升光流估计精度。升光流估计精度。升光流估计精度。

全部详细技术资料下载

【技术实现步骤摘要】
基于神经非刚性注册的人脸光流估计方法及装置

[0001]本专利技术属于人脸图像处理
，尤其涉及一种基于神经非刚性注册的人脸光流估计方法及装置。

技术介绍

[0002]随着近年来图像处理领域技术的发展，单目人脸视频帧间光流估计在例如3D人脸重建、人脸表情识别和帧间插值等应用中需求十分广泛。如何计算精确且鲁棒的光流成为了一个广受关注的问题。
[0003]在过去，光流估计主要有三种方法：基于优化的传统方法(以Lucas
‑
Kanade算法为代表)，基于亮度不变和邻域光流相似假设，构建相应的能量函数，通过采用合适的优化算法，迭代求解得到光流。为了解决快速运动中光流估计问题，有方法提出采用金字塔结构进行逐层求解光流。这类传统方法在一些简单场景下(亮度不变等)仍然被广泛地使用。但基于优化的传统方法对于一些复杂场景下(亮度变化、运动过快)拍摄的图片不鲁棒以及求解速度较慢。基于监督学习的光流估计法通过大量标注或者合成数据，借助监督训练得到一个从前后两帧图片映射到光流的网络。该方法相比于基于优化的传统方法，不需要对每次输入的图片求解复杂的优化问题，且不需要单独对最终的结果做后处理，较为节省人力和时间。然而由于该方法需要对众多成对的帧对
‑
光流数据进行“黑箱式”训练，其最终效果和稳定性依然难以保证。并且该方法依赖大规模标注数据，但光流数据的标注是极其昂贵的，而基于合成数据训练的网络无法有效地泛化到真实数据，缺乏实用性。基于无监督学习的光流估计方法是将监督学习方法中的监督损失函数改成无监督...

【技术保护点】

【技术特征摘要】
1.一种基于神经非刚性注册的人脸光流估计方法，其特征在于，包括：构建训练数据集：采集人脸RGB
‑
D视频序列，选取若干帧对，对每帧图片进行人脸解析、3D人脸重建、人脸关键点检测，对每个帧对的第一帧构建用于非刚性注册的变形图，形成训练数据集；构建光流估计网络以及光流置信度估计网络，将两个网络的输出共同用于可微的3D点云非刚性注册，设计损失函数，在训练数据集上通过优化损失函数，反向优化两个网络的网络参数；将源帧人脸RGB图片和目标帧人脸RGB图片输入训练好的光流估计网络，得到从源帧到目标帧的光流，即每个像素的运动。2.根据权利要求1所述的一种基于神经非刚性注册的人脸光流估计方法，其特征在于，所述人脸解析具体为：使用基于神经网络的人脸解析技术得到符合相应语义的分割图像，分割要素为：背景区域、面部皮肤、左眉、右眉、左眼、右眼、鼻子、上嘴唇、下嘴唇、嘴巴、左耳、右耳。3.根据权利要求1所述的一种基于神经非刚性注册的人脸光流估计方法，其特征在于，所述光流估计网络的输入为前后两帧人脸RGB图片，输出为从源帧到目标帧的光流以及光流特征；所述光流置信度估计网络的输入为前后两帧人脸RGB图片、所述光流估计网络输出的从源帧到目标帧的光流以及光流特征，输出为光流的置信度。4.根据权利要求1所述的一种基于神经非刚性注册的人脸光流估计方法，其特征在于，所述光流估计网络采用基于金字塔结构的光流学习网络PWC
‑
Net或基于循环网络结构的光流学习网络RAFT。5.根据权利要求1所述的一种基于神经非刚性注册的人脸光流估计方法，其特征在于，所述光流置信度估计网络为卷积神经网络模型，包括输入层、卷积层、非线性层和输出层。6.根据权利要求1所述的一种基于神经非刚性注册的人脸光流估计方法，其特征在于，对非刚性注册的输入进行优化，具体为：对3D人脸重建结果的顶点进行采样，将采样结果和人脸关键点检测结果提供的源帧和目标帧相关像素的初始对应关系，替代所述光流估计网络输出结果中相应像素的光流，同时提高所述光流置信度估计网络输出结果中相应像...

【专利技术属性】
技术研发人员：彭妆，江博艺，
申请(专利权)人：杭州像衍科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人