【技术实现步骤摘要】
本申请涉及图像处理,具体涉及基于文本信息借助三维渲染生成视频的方法及系统。
技术介绍
1、随着人工智能技术的快速发展,文本到视频生成已经成为一个热门研究领域。通过利用ai大模型,可以实现从自然语言文本自动生成与之对应的视频内容。传统文生视频技术原理,即大规模深度神经网络组成的大模型来实现自然语言文本向目标结果的转换,期间采取噪音数据扩散出模仿训练样本体系文与视频关联关系的成果。
2、现有技术中,基于transformer架构的扩散模型所合成画面帧视频会存在生成内容分辨率低、一致性差,生成内容不可控等缺陷问题,例如,基于transformer架构的扩散模型所合成画面帧视频可能存在异形缺陷,画面帧视频会呈现反人类常识的行为或动作。采用大模型生成自然语言格式剧本文本,再通过三维引擎解析格式剧本渲染获得文生视频,能够有效降低大模型合成视频的不可控性,避免文生视频中出现一致性错误。
3、在模型生成格式文本再到三维渲染生成视频的过程中,现有技术需要耗费大量的时间对剧本场景中的三维模型进行渲染,提高图像视频的真实感,存在输出内
...【技术保护点】
1.基于文本信息借助三维渲染生成视频的方法,其特征在于,该方法包括以下步骤:
2.如权利要求1所述的基于文本信息借助三维渲染生成视频的方法,其特征在于,所述未渲染视频的获取方法为:
3.如权利要求1所述的基于文本信息借助三维渲染生成视频的方法,其特征在于,所述获取各3D模型在格式剧本中对应的名词,包括:
4.如权利要求1所述的基于文本信息借助三维渲染生成视频的方法,其特征在于,所述确定各3D模型对应的名词,包括:
5.如权利要求2所述的基于文本信息借助三维渲染生成视频的方法,其特征在于,所述确定每帧图像中各3D模型的所有
...【技术特征摘要】
1.基于文本信息借助三维渲染生成视频的方法,其特征在于,该方法包括以下步骤:
2.如权利要求1所述的基于文本信息借助三维渲染生成视频的方法,其特征在于,所述未渲染视频的获取方法为:
3.如权利要求1所述的基于文本信息借助三维渲染生成视频的方法,其特征在于,所述获取各3d模型在格式剧本中对应的名词,包括:
4.如权利要求1所述的基于文本信息借助三维渲染生成视频的方法,其特征在于,所述确定各3d模型对应的名词,包括:
5.如权利要求2所述的基于文本信息借助三维渲染生成视频的方法,其特征在于,所述确定每帧图像中各3d模型的所有映射数据对,包括:
6.如权利要求5所述的基于文本信息借助三维渲染生成视频的方法,其特征在于,所述确定各3d模型对应的每个名词的相对文本位置,包括:
7.如权利要求5所述的基于文本信息借助三维渲染生成视频的方法,其特征在于,所述确定各3d模型对应的每个名词与各极大值点的映射判...
【专利技术属性】
技术研发人员:周琛,孟亮,王铁,毛汀,谢向辉,武凯旋,申文秋,
申请(专利权)人:湖南三岳数维科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。