视频生成方法、装置及电子设备制造方法及图纸

技术编号：44834101 阅读：23 留言：0更新日期：2025-04-01 19:34

本申请涉及一种视频生成方法、装置及电子设备。该方法包括：获取待处理的视频片段，视频片段包括多帧参考图像；将待处理的视频片段输入预训练的适配模块，获得适配模块的各层第一隐藏层对应的微调向量；第一隐藏层与扩散模型的第二隐藏层具有相同的层结构；将条件信息输入扩散模型，获得对应的目标视频；条件信息至少包括待处理的视频片段，每层第二隐藏层的输出向量用于与映射的第一隐藏层输出的微调向量叠加，以作为下一层第二隐藏层的输入向量；将各帧目标图像依时序排列形成目标视频。本申请提供的方案，能够结合训练好的适配模块，低成本地通过预训练的、通用的扩散模型，基于参考图像的视觉内容生成目标视频，实现视觉内容的还原或重构。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能处理，尤其涉及一种视频生成方法、装置及电子设备。

技术介绍

1、随着人工智能技术的飞速发展，aigc(artificial intelligent generativecontent，人工智能生成内容)在各个领域得到了广泛应用。其中，基于图像生成视频的应用在蓬勃发展。

2、目前的图生视频的常见场景是基于给定的一帧或若干帧高清图像，由图生视频模型生成内容单一的简短视频。然而，目前的模型无法基于一些低质量的图像(如不清晰的图像、线稿图、黑白线条图等)形成高质量内容的视频，或者无法将低质量的视频进行视频内容的还原或重构。

技术实现思路

1、为解决或部分解决相关技术中存在的问题，本申请提供一种视频生成方法、装置及电子设备，能够结合训练好的适配模块，低成本地通过预训练的、通用的扩散模型，基于参考图像的视觉内容生成目标视频，实现视觉内容的还原或重构。

2、本申请第一方面提供一种视频生成方法，其包括：

3、获取待处理的视频片段，所述视频片段包括多帧参考图像；

...

【技术保护点】

1.一种视频生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，多帧所述参考图像为边缘检测图或线稿图。

3.根据权利要求1所述的方法，其特征在于，所述获取待处理的视频片段，包括：

4.根据权利要求1所述的方法，其特征在于：所述条件信息还包括提示文本；

5.根据权利要求1所述的方法，其特征在于，所述第一隐藏层与扩散模型中的第二隐藏层具有相同的层结构，包括：

6.根据权利要求1所述的方法，其特征在于，结合预训练的所述扩散模型，根据下述方法训练获得所述适配模块：

7.根据权利要求6所述的方法，其特征在于...

【技术特征摘要】

1.一种视频生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，多帧所述参考图像为边缘检测图或线稿图。

3.根据权利要求1所述的方法，其特征在于，所述获取待处理的视频片段，包括：

4.根据权利要求1所述的方法，其特征在于：所述条件信息还包括提示文本；

5.根据权利要求1所述的方法，其特征在于，所述第一隐藏层与扩散模型中的第二隐藏层具有相同的层结构，包括：

6....

【专利技术属性】
技术研发人员：请求不公布姓名，请求不公布姓名，
申请(专利权)人：北京生数科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人