下载经由多模态条件的视频合成的技术资料

文档序号:42868032

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

一种多模态视频生成框架(MMVID),其受益于联合地或单独地作为输入提供的文本和图像。视频的量化表示与具有多个模态的双向转换器一起用作预测离散视频表示的输入。使用利用自学习训练的新视频令牌和用于对视频令牌进行采样的改进的掩模预测算法来改进视...
该专利属于斯纳普公司所有,仅供学习研究参考,未经过斯纳普公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。