一种基于一致性蒸馏的人像动画生成方法及系统技术方案

技术编号:44720712 阅读:17 留言:0更新日期:2025-03-21 17:48
本申请属于计算机视觉与视频生成领域,具体公开了一种基于一致性蒸馏的人像动画生成方法及系统。方法包括:收集参考图像样本和人体姿态序列样本作为训练集,基于所述训练集构建预训练的教师模型,所述教师模型用于生成目标视频;初始化一致性蒸馏模型得到学生模型,通过轨迹分段一致性蒸馏法将所述教师模型的知识传递给学生模型;通过辅助损失优化、动态区域加权优化以及面部细节注入对所述学生模型进行优化,得到优化模型;将待推理的参考图像和人体姿态序列输入至所述优化模型中,得到人像动画视频。通过本申请能够有效提升生成视频的时序一致性、连贯性和细节保真度。

【技术实现步骤摘要】

本申请属于计算机视觉与视频生成领域,更具体地,涉及一种基于一致性蒸馏的人像动画生成方法及系统


技术介绍

1、近年来,随着深度学习技术的发展,生成模型在人像动画生成领域取得了显著的进展。特别是基于扩散模型的生成方法,因其可以在复杂场景下生成高质量图像和视频的能力而备受关注。扩散模型通过逐步去噪重建高分辨率内容,在视频生成领域展现了极大的潜力。然而,尽管扩散模型生成的视频质量较高,但是其生成过程通常需要数百甚至上千步推理,导致推理效率较低,难以满足实时性要求。

2、现有研究为了提升扩散模型的推理效率,提出了一些改进方案。例如,通过降采样优化或设计简化的网络结构来减少推理步骤;或者通过知识蒸馏的方式,利用教师模型优化轻量化学生模型以实现加速。然而,这些方法往往会牺牲生成视频的时序一致性和细节质量,使生成结果在运动区域和面部特征上表现出模糊或失真。特别是在运动区域中,生成模型容易出现视频内容的不连贯性;而在人像动画生成中,面部细节往往是最关键的部分,但现有方法在高效推理的同时难以兼顾细节保真度。

3、因此,如何提高人像动画生成视频的时序一本文档来自技高网...

【技术保护点】

1.一种基于一致性蒸馏的人像动画生成方法,其特征在于,包括:

2.根据权利要求1所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述通过轨迹分段一致性蒸馏法将所述教师模型的知识传递给学生模型,包括:

3.根据权利要求2所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述目标函数为:

4.根据权利要求1所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述辅助损失优化的具体过程包括:

5.根据权利要求4所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述动态区域加权优化的具体过程包括:

6.根据权利要求5所述的基于一...

【技术特征摘要】

1.一种基于一致性蒸馏的人像动画生成方法,其特征在于,包括:

2.根据权利要求1所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述通过轨迹分段一致性蒸馏法将所述教师模型的知识传递给学生模型,包括:

3.根据权利要求2所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述目标函数为:

4.根据权利要求1所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述辅助损失优化的具体过程包括:

5.根据权利要求4所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述动态区域加权优化的具体过程包括:...

【专利技术属性】
技术研发人员:桑农王翔张士伟尹文体高常鑫王岳环
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1