【技术实现步骤摘要】
本专利技术涉及数字人领域,特别公开了一种基于多数字人交互的视频生成方法及系统。
技术介绍
1、采用数字人生成视频已经越来越多的应用于新媒体的运营过程中。目前基于数字人的口播视频通常是利用文生图生成一个数字人形象,再根据预设的文案以及图生视频的技术来生成对应的单数字人口播视频,这种口播视频生成方法在内容表达形式上比较单调,难以引起观看者的兴趣。
技术实现思路
1、有鉴于此,本专利技术的目的在于提供一种基于多数字人交互的视频生成方法及系统,能至少部分的改善上述问题。
2、为实现上述目的,本专利技术采用以下技术方案:
3、一种基于多数字人交互的视频生成方法,其包括:
4、生成多个用于直播的单数字人图像;其中,每个单数字人图像具有相似的背景;
5、对所述多个单数字人图像进行图像拼接以及扩展,得到背景一致的多数字人图像;
6、根据预设的文案,生成对应的多段单数字人视频以及多数字人视频;
7、将所述多段单数字人视频以及多数字人视频
...【技术保护点】
1.一种基于多数字人交互的视频生成方法,其特征在于,包括:
2.根据权利要求1所述的基于多数字人交互的视频生成方法,其特征在于,生成多个用于直播的单数字人图像具体包括:
3.根据权利要求1所述的基于多数字人交互的视频生成方法,其特征在于,对所述多个单数字人图像进行图像拼接以及扩展,得到背景一致的多数字人图像,具体包括:
4.根据权利要求1所述的基于多数字人交互的视频生成方法,其特征在于,在图生视频过程中,微调一个控制人物生成姿势的图生视频lora模型,控制人物生成的姿势以及动作细节,从而增强生成内容的真实感与表现力。
5
...【技术特征摘要】
1.一种基于多数字人交互的视频生成方法,其特征在于,包括:
2.根据权利要求1所述的基于多数字人交互的视频生成方法,其特征在于,生成多个用于直播的单数字人图像具体包括:
3.根据权利要求1所述的基于多数字人交互的视频生成方法,其特征在于,对所述多个单数字人图像进行图像拼接以及扩展,得到背景一致的多数字人图像,具体包括:
4.根据权利要求1所述的基于多数字人交互的视频生成方法,其特征在于,在图生视频过程中,微调一个控制人物生成姿势的图生视频lora模型,控制人物生成的姿势以及动作细节,从而增强生成内容的真实...
【专利技术属性】
技术研发人员:谢诗季,李卓真,杨洪进,
申请(专利权)人:厦门蝉镜科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。