一种图生视频方法和装置制造方法及图纸

技术编号：44218439 阅读：13 留言：0更新日期：2025-02-11 13:26

本发明专利技术实施例公开了一种图生视频方法和装置。本发明专利技术实施例将包含目标对象的源图像输入第一视频生成模型得到素材视频，根据素材视频确定帧间变换矩阵序列，然后从源图像中得到目标对象对应的对象掩码图像，将帧间变换矩阵序列应用于对象掩码图像可得到多张掩码图像从而组成掩码图像序列，将帧间变换矩阵序列应用于源图像可得到多张目标对象图像从而组成目标对象图像序列，根据源图像、掩码图像序列和目标对象图像序列确定目标输入数据，将目标输入数据输入支持局部重绘的第二视频生成模型，得到对应的目标视频。通过两次模型生成视频，实现了智能化端到端的图生视频，无需引入预设运动参数即可在保持目标对象不扩散的同时，实现运动轨迹多样性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能领域，具体而言，涉及一种图生视频方法和装置。

技术介绍

1、随着人工智能的迅速发展，视频生成技术受到了广泛的关注和研究。目前常用的基于扩散模型的图生视频模型在根据图像生成对应视频时，可能会出现视频中的物品形变失真的问题，导致视频无法准确反映物品的真实形态和细节。此外，图生视频模型通常需要用户预设运动轨迹，用户操作繁杂。

技术实现思路

1、有鉴于此，本专利技术实施例提供一种图生视频方法和装置，以实现智能化端到端的图生视频，无需引入预设运动参数，即可在保持目标对象区域不扩散的同时，实现运动轨迹的多样性。

2、第一方面，本专利技术实施例提供了一种图生视频方法，所述方法包括：

3、获取源图像，所述源图像为包含目标对象的图像；

4、将所述源图像输入第一视频生成模型，得到对应的素材视频，所述第一视频生成模型为预训练的图生视频模型；

5、确定所述素材视频对应的帧间变换矩阵序列；

6、确定所述源图像中所述目标对象对应的对象掩码图像；

...

【技术保护点】

1.一种图生视频方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述素材视频包含多个素材视频帧；

3.根据权利要求1所述的方法，其特征在于，所述根据所述帧间变换矩阵序列和所述源图像，确定目标对象图像序列，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述帧间变换矩阵序列和所述源图像，确定目标对象图像序列，包括：

5.根据权利要求1所述的方法，其特征在于，所述根据所述帧间变换矩阵序列和所述对象掩码图像，确定掩码图像序列，包括：

6.根据权利要求1所述的方法，其特征在于，所述根据所述帧间变换矩...

【技术特征摘要】

1.一种图生视频方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述素材视频包含多个素材视频帧；

3.根据权利要求1所述的方法，其特征在于，所述根据所述帧间变换矩阵序列和所述源图像，确定目标对象图像序列，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述帧间变换矩阵序列和所述源图像，确定目标对象图像序列，包括：

5.根据权利要求1所述的方法，其特征在于，所述根据所述帧间变换矩阵序列和所述对象掩码图像，确定掩码图像序列，包括：

6.根据权利要求1所述的方法，其特征在于，所述根据所述帧间变换矩阵序列和所述对象掩码图像，确定掩码图像序列，包括：

7.根据权利要求1所述的方法，其特征在于，所述第二视频生成模型为具有局部重绘功能的图生视频模型；

8.根据权利要求1所述的方法，其特征在于，所述第二视频生成模型为具有局部重绘功能的视频生视频模型；

9.根据权利要求8所述的方法，其特征在于，所述根据所述源图像和...

【专利技术属性】
技术研发人员：蒋雅萍，陈祖龙，庾金科，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人