当前位置: 首页 > 专利查询>清华大学专利>正文

头部姿态跟踪方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36953631 阅读:27 留言:0更新日期:2023-03-22 19:14
本申请涉及计算机视觉技术领域,特别涉及一种头部姿态跟踪方法、装置、电子设备及存储介质,其中,方法包括:将待跟踪目标的视频转换为图像序列,并输入预先训练完成的遮挡物识别网络,输出每帧图像中遮挡物的掩码图像;利用掩码图像将图像序列划分为参考帧图像和候选帧图像序列,并利用候选帧图像序列中每帧图像的掩码图像掩盖遮挡区域,生成待补全帧图像序列;将待补全帧图像序列、参考帧图像和掩码图像输入预先训练完成的变形补全网络,输出补全后的图像序列,基于补全图像序列实现待跟踪目标的头部姿态跟踪。由此,解决了相关技术中基于视频实现部姿态的跟踪,容易受到遮挡的影响,鲁棒性较差,从而导致头部姿态的误检和抖动等问题。动等问题。动等问题。

【技术实现步骤摘要】
头部姿态跟踪方法、装置、电子设备及存储介质


[0001]本申请涉及计算机视觉
,特别涉及一种头部姿态跟踪方法、装置、电子设备及存储介质。

技术介绍

[0002]随着计算机技术的发展,元宇宙的概念被提出,旨在打造具备社会体系的数字生活空间。头部姿态作为该应用场景下的重要信息,对于相关应用的开发具有重大意义,因彩色相机的高普及度,彩色视频是头部姿态跟踪的常用输入之一。
[0003]头部姿态在人脸重建、人脸动画等领域有诸多应用。例如,一个准确的头部姿态可以为人脸重建算法提供良好的初始值,避免人脸重建过程中用人脸形状信息来补偿头部姿态的偏差,导致错误结果的产生。同时,准确的头部姿态跟踪可以让人脸动画显得更加真实与生动,增强用户的沉浸感与用户体验。另外,头部姿态的准确度还对一些下游任务至关重要。例如,在视线估计任务中,人的视线方向由头部姿态和眼球旋转共同决定,头部姿态的准确度对于最终视线估计的结果具有很大影响。
[0004]相关技术通常是基于神经网络的端到端方法,或者是结合人脸特征点和三维人脸模型的优化法,实现头部姿态的跟踪,但是容易受到遮挡的影响,鲁棒性较差,会造成头部姿态的误检和抖动。

技术实现思路

[0005]本申请提供一种头部姿态跟踪方法、装置、电子设备及存储介质,以解决相关技术中基于视频实现部姿态的跟踪,容易受到遮挡的影响,鲁棒性较差,导致头部姿态的误检和抖动等问题。
[0006]本申请第一方面实施例提供一种头部姿态跟踪方法,包括以下步骤:获取待跟踪目标的视频;将所述视频转换为图像序列,将所述图像序列输入预先训练完成的遮挡物识别网络,输出所述图像序列中每帧图像中遮挡物的掩码图像;利用所述掩码图像将所述图像序列划分为参考帧图像和候选帧图像序列,并利用所述候选帧图像序列中每帧图像的掩码图像掩盖遮挡区域,生成待补全帧图像序列;将所述待补全帧图像序列、所述参考帧图像和所述每帧图像的掩码图像输入预先训练完成的变形补全网络,输出所述待补全帧图像序列的补全图像序列,基于所述补全图像序列实现所述待跟踪目标的头部姿态跟踪。
[0007]可选地,在本申请的一个实施例中,所述利用所述掩码图像将所述图像序列划分为参考帧图像和候选帧图像序列,包括:根据所述掩码图像识别所述图像序列中是否存在无遮挡图像;若存在所述无遮挡图像,则选择任意一帧无遮挡图像作为参考帧图像,否则选取所述图像序列中遮挡最少的图像作为参考帧图像,并将所述图像序列中所述参考帧图像以外的剩余帧图像作为候选帧图像序列。
[0008]可选地,在本申请的一个实施例中,所述遮挡物识别网络的训练过程包括:获取未训练遮挡物识别网络的训练数据,其中,所述训练数据包括遮挡物图像和所述遮挡物图像
对应的真实掩码图像;将所述遮挡物图像输入所述未训练遮挡物识别网络,输出所述遮挡物图像的训练掩码图像,根据所述真实掩码图像和所述训练掩码图像计算训练损失值,若所述训练损失值大于预设值,则基于所述训练继续迭代训练,否则停止迭代训练,得到训练完成的遮挡物识别网络。
[0009]可选地,在本申请的一个实施例中,所述变形补全网络的训练过程包括:获取无遮挡图像的图像序列;将所述图像序列中任意一帧图像作为参考帧图像,剩余帧为候选帧图像;随机生成不同形状的掩码图像,利用所述掩码图像掩盖所述候选帧图像的随机图像区域,得到待补全帧图像;将所述待补全帧图像、所述参考帧图像和所述掩码图像输入未训练的变形补全网络,利用图像重建损失约束所述变形补全网络输出的补全图像与掩盖前的候选帧图像之间的损失处于预设范围内,利用总变差损失约束参考帧图像与待补全帧图像之间的变形场满足预设刚性变形条件,得到训练完成的变形补全网络。
[0010]本申请第二方面实施例提供一种头部姿态跟踪装置,包括:获取模块,用于获取待跟踪目标的视频;转换模块,用于将所述视频转换为图像序列,将所述图像序列输入预先训练完成的遮挡物识别网络,输出所述图像序列中每帧图像中遮挡物的掩码图像;划分模块,用于利用所述掩码图像将所述图像序列划分为参考帧图像和候选帧图像序列,并利用所述候选帧图像序列中每帧图像的掩码图像掩盖遮挡区域,生成待补全帧图像序列;跟踪模块,用于将所述待补全帧图像序列、所述参考帧图像和所述每帧图像的掩码图像输入预先训练完成的变形补全网络,输出所述待补全帧图像序列的补全图像序列,基于所述补全图像序列实现所述待跟踪目标的头部姿态跟踪。
[0011]可选地,在本申请的一个实施例中,所述划分模块,进一步用于根据所述掩码图像识别所述图像序列中是否存在无遮挡图像;若存在所述无遮挡图像,则选择任意一帧无遮挡图像作为参考帧图像,否则选取所述图像序列中遮挡最少的图像作为参考帧图像,并将所述图像序列中所述参考帧图像以外的剩余帧图像作为候选帧图像序列。
[0012]可选地,在本申请的一个实施例中,还包括:第一训练模块,用于获取未训练遮挡物识别网络的训练数据,其中,所述训练数据包括遮挡物图像和所述遮挡物图像对应的真实掩码图像;将所述遮挡物图像输入所述未训练遮挡物识别网络,输出所述遮挡物图像的训练掩码图像,根据所述真实掩码图像和所述训练掩码图像计算训练损失值,若所述训练损失值大于预设值,则基于所述训练继续迭代训练,否则停止迭代训练,得到训练完成的遮挡物识别网络。
[0013]可选地,在本申请的一个实施例中,还包括:第二训练模块,用于获取无遮挡图像的图像序列;所述图像序列中任意一帧图像作为参考帧图像,剩余帧为候选帧图像;随机生成不同形状的掩码图像,利用所述掩码图像掩盖所述候选帧图像的随机图像区域,得到待补全帧图像;将所述待补全帧图像、所述参考帧图像和所述掩码图像输入未训练的变形补全网络,利用图像重建损失约束所述变形补全网络输出的补全图像与掩盖前的候选帧图像之间的损失处于预设范围内,利用总变差损失约束参考帧图像与待补全帧图像之间的变形场满足预设刚性变形条件,得到训练完成的变形补全网络。
[0014]本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的头部姿态跟踪方法。
[0015]本申请第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如上述实施例所述的头部姿态跟踪方法。
[0016]由此,本申请至少具有如下有益效果:
[0017]通过将待跟踪目标的视频转换为图像序列,利用视频的帧间信息,使用训练后的网络估计参考帧与待补全帧之间的变形场,将参考帧的对应区域自动填补到待补全帧的遮挡区域上,从而兼容遮挡情况下的头部姿态估计,能够极大缓解因遮挡造成的头部姿态误检和抖动等问题。由此,解决了相关技术中直接基于视频实现部姿态的跟踪,容易受到遮挡的影响,鲁棒性较差,会出现头部姿态的误检和抖动等问题。
[0018]本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种头部姿态跟踪方法,其特征在于,包括以下步骤:获取待跟踪目标的视频;将所述视频转换为图像序列,将所述图像序列输入预先训练完成的遮挡物识别网络,输出所述图像序列中每帧图像中遮挡物的掩码图像;利用所述掩码图像将所述图像序列划分为参考帧图像和候选帧图像序列,并利用所述候选帧图像序列中每帧图像的掩码图像掩盖遮挡区域,生成待补全帧图像序列;将所述待补全帧图像序列、所述参考帧图像和所述每帧图像的掩码图像输入预先训练完成的变形补全网络,输出所述待补全帧图像序列的补全图像序列,基于所述补全图像序列实现所述待跟踪目标的头部姿态跟踪。2.根据权利要求1所述的方法,其特征在于,所述利用所述掩码图像将所述图像序列划分为参考帧图像和候选帧图像序列,包括:根据所述掩码图像识别所述图像序列中是否存在无遮挡图像;若存在所述无遮挡图像,则选择任意一帧无遮挡图像作为参考帧图像,否则选取所述图像序列中遮挡最少的图像作为参考帧图像,并将所述图像序列中所述参考帧图像以外的剩余帧图像作为候选帧图像序列。3.根据权利要求1所述的方法,其特征在于,所述遮挡物识别网络的训练过程包括:获取未训练遮挡物识别网络的训练数据,其中,所述训练数据包括遮挡物图像和所述遮挡物图像对应的真实掩码图像;将所述遮挡物图像输入所述未训练遮挡物识别网络,输出所述遮挡物图像的训练掩码图像,根据所述真实掩码图像和所述训练掩码图像计算训练损失值,若所述训练损失值大于预设值,则基于所述训练继续迭代训练,否则停止迭代训练,得到训练完成的遮挡物识别网络。4.根据权利要求1所述的方法,其特征在于,所述变形补全网络的训练过程包括:获取无遮挡图像的图像序列;将所述图像序列中任意一帧图像作为参考帧图像,剩余帧为候选帧图像;随机生成不同形状的掩码图像,利用所述掩码图像掩盖所述候选帧图像的随机图像区域,得到待补全帧图像;将所述待补全帧图像、所述参考帧图像和所述掩码图像输入未训练的变形补全网络,利用图像重建损失约束所述变形补全网络输出的补全图像与掩盖前的候选帧图像之间的损失处于预设范围内,利用总变差损失约束参考帧图像与待补全帧图像之间的变形场满足预设刚性变形条件,得到训练完成的变形补全网络。5.一种头部姿态跟踪装置,其特征在于,包括:获取模块,用于获取待跟踪目标的视频;转换模块,用于将所述视频转换为图像序列,将所述图像序列输入预先训练完成的遮挡物识别网络,输出所述图像序列中每帧图像...

【专利技术属性】
技术研发人员:徐枫吕军锋
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1