【技术实现步骤摘要】
本申请属于计算机视觉与视频生成领域,更具体地,涉及一种基于一致性蒸馏的人像动画生成方法及系统。
技术介绍
1、近年来,随着深度学习技术的发展,生成模型在人像动画生成领域取得了显著的进展。特别是基于扩散模型的生成方法,因其可以在复杂场景下生成高质量图像和视频的能力而备受关注。扩散模型通过逐步去噪重建高分辨率内容,在视频生成领域展现了极大的潜力。然而,尽管扩散模型生成的视频质量较高,但是其生成过程通常需要数百甚至上千步推理,导致推理效率较低,难以满足实时性要求。
2、现有研究为了提升扩散模型的推理效率,提出了一些改进方案。例如,通过降采样优化或设计简化的网络结构来减少推理步骤;或者通过知识蒸馏的方式,利用教师模型优化轻量化学生模型以实现加速。然而,这些方法往往会牺牲生成视频的时序一致性和细节质量,使生成结果在运动区域和面部特征上表现出模糊或失真。特别是在运动区域中,生成模型容易出现视频内容的不连贯性;而在人像动画生成中,面部细节往往是最关键的部分,但现有方法在高效推理的同时难以兼顾细节保真度。
3、因此,如何提高人像
...【技术保护点】
1.一种基于一致性蒸馏的人像动画生成方法,其特征在于,包括:
2.根据权利要求1所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述通过轨迹分段一致性蒸馏法将所述教师模型的知识传递给学生模型,包括:
3.根据权利要求2所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述目标函数为:
4.根据权利要求1所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述辅助损失优化的具体过程包括:
5.根据权利要求4所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述动态区域加权优化的具体过程包括:
6.根据权
...【技术特征摘要】
1.一种基于一致性蒸馏的人像动画生成方法,其特征在于,包括:
2.根据权利要求1所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述通过轨迹分段一致性蒸馏法将所述教师模型的知识传递给学生模型,包括:
3.根据权利要求2所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述目标函数为:
4.根据权利要求1所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述辅助损失优化的具体过程包括:
5.根据权利要求4所述的基于一致性蒸馏的人像动画生成方法,其特征在于,所述动态区域加权优化的具体过程包括:...
【专利技术属性】
技术研发人员:桑农,王翔,张士伟,尹文体,高常鑫,王岳环,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。