基于多数字人交互的视频生成方法及系统技术方案

技术编号：46096485 阅读：4 留言：0更新日期：2025-08-12 18:15

本发明专利技术公开了一种基于多数字人交互的视频生成方法及系统，方法包括：生成多个用于直播的单数字人图像；其中，每个单数字人图像具有相似的背景；对所述多个单数字人图像进行图像拼接以及扩展，得到背景一致的多数字人图像；根据预设的文案，生成对应的多段单数字人视频以及多数字人视频；将所述多段单数字人视频以及多数字人视频根据顺序进行拼接，得到具有多数字人互动的互动视频。本发明专利技术可以实现多人形式的数字人互动口播，能够极大程度丰富数字人口播的表达形式以及应用场景，从而给用户提供更好的观看体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数字人领域，特别公开了一种基于多数字人交互的视频生成方法及系统。

技术介绍

1、采用数字人生成视频已经越来越多的应用于新媒体的运营过程中。目前基于数字人的口播视频通常是利用文生图生成一个数字人形象，再根据预设的文案以及图生视频的技术来生成对应的单数字人口播视频，这种口播视频生成方法在内容表达形式上比较单调，难以引起观看者的兴趣。

技术实现思路

1、有鉴于此，本专利技术的目的在于提供一种基于多数字人交互的视频生成方法及系统，能至少部分的改善上述问题。

2、为实现上述目的，本专利技术采用以下技术方案：

3、一种基于多数字人交互的视频生成方法，其包括：

4、生成多个用于直播的单数字人图像；其中，每个单数字人图像具有相似的背景；

5、对所述多个单数字人图像进行图像拼接以及扩展，得到背景一致的多数字人图像；

6、根据预设的文案，生成对应的多段单数字人视频以及多数字人视频；

7、将所述多段单数字人视频以及多数字人视频...

【技术保护点】

1.一种基于多数字人交互的视频生成方法，其特征在于，包括：

2.根据权利要求1所述的基于多数字人交互的视频生成方法，其特征在于，生成多个用于直播的单数字人图像具体包括：

3.根据权利要求1所述的基于多数字人交互的视频生成方法，其特征在于，对所述多个单数字人图像进行图像拼接以及扩展，得到背景一致的多数字人图像，具体包括：

4.根据权利要求1所述的基于多数字人交互的视频生成方法，其特征在于，在图生视频过程中，微调一个控制人物生成姿势的图生视频lora模型，控制人物生成的姿势以及动作细节，从而增强生成内容的真实感与表现力。

5.根据权利要求1所述...

【技术特征摘要】

1.一种基于多数字人交互的视频生成方法，其特征在于，包括：

2.根据权利要求1所述的基于多数字人交互的视频生成方法，其特征在于，生成多个用于直播的单数字人图像具体包括：

4.根据权利要求1所述的基于多数字人交互的视频生成方法，其特征在于，在图生视频过程中，微调一个控制人物生成姿势的图生视频lora模型，控制人物生成的姿势以及动作细节，从而增强生成内容的真实...

【专利技术属性】
技术研发人员：谢诗季，李卓真，杨洪进，
申请(专利权)人：厦门蝉镜科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人