数字人视频生成方法、生成系统和可读存储介质技术方案

技术编号:46281837 阅读:6 留言:0更新日期:2025-09-02 21:12
本发明专利技术公开了一种数字人视频生成方法、生成系统和计算机可读存储介质。其中,数字人视频生成方法包括:获取输入的语音文件,从数据库提取静态图片;将静态图片和语音文件提供给音频驱动拟真模型,基于音频驱动拟真模型生成带有面部表情和嘴型变化的面部视频;将静态图片和面部视频提供给灵动人像模型,基于灵动人像视频生成数字人全身视频。本申请的技术方案能够有效的对图片进行处理,生成全身视频。

【技术实现步骤摘要】

本专利技术涉及内容生成,具体涉及一种数字人视频生成方法、生成系统和计算机可读存储介质。


技术介绍

1、在数字内容创作领域,数字人视频的需求日益增长。传统的数字人视频制作过程复杂,需要专业的3d建模、动画制作软件以及大量的人力和时间成本。随着aigc(aigenerated content,人工智能生成内容)技术的发展,出现了一些能够简化数字人视频制作的工具和技术。但是,现有的这些技术仅能作用于头部,难以通过图片生成全身视频。


技术实现思路

1、针对现有技术中的缺陷,本专利技术提供一种数字人视频生成方法能够有效的对图片进行处理,生成全身视频。

2、本申请提供的一种数字人视频生成方法,所述数字人视频生成方法包括:

3、获取输入的语音文件,从数据库提取静态图片;

4、将所述静态图片和所述语音文件提供给音频驱动拟真模型,基于所述音频驱动拟真模型生成带有面部表情和嘴型变化的面部视频;

5、将所述静态图片和所述面部视频提供给灵动人像模型,基于所述灵动人像视频生成数字人全身视本文档来自技高网...

【技术保护点】

1.一种数字人视频生成方法,其特征在于,所述数字人视频生成方法包括:

2.根据权利要求1所述的数字人视频生成方法,其特征在于,所述音频驱动拟真模型和所述灵动人像模型均为开源模型。

3.根据权利要求2所述的数字人视频生成方法,其特征在于,所述音频驱动拟真模型为EchoMimic,所述灵动人像模型为LivePortrait。

4.根据权利要求3所述的数字人视频生成方法,其特征在于,EchoMimic设置有WebUI界面或GradioUI界面;

5.一种数字人视频生成系统,其特征在于,所述数字人视频生成系统包括:

6.一种计算机可读存...

【技术特征摘要】

1.一种数字人视频生成方法,其特征在于,所述数字人视频生成方法包括:

2.根据权利要求1所述的数字人视频生成方法,其特征在于,所述音频驱动拟真模型和所述灵动人像模型均为开源模型。

3.根据权利要求2所述的数字人视频生成方法,其特征在于,所述音频驱动拟真模型为echomimic,所述灵动人像模型为liveportrait。

4.根...

【专利技术属性】
技术研发人员:刘鑫强陈从容
申请(专利权)人:契胜科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1