【技术实现步骤摘要】
本专利技术涉及图像生成技术,具体涉及一种基于扩散模型的工笔人物画生成方法、系统及存储介质。
技术介绍
1、随着生成对抗网络(gan)和扩散模型(diffusionmodels)等技术的不断演进,图像生成任务已取得飞跃式的进展,推动了创意设计、虚拟现实等多个领域的发展。这些模型生成的图像可以达到高度逼真的效果,但在应对用户复杂、精细化的需求时,生成结果常常难以完全按照人类的预期进行精准控制与目标存在偏差,尤其是在特定风格或情境的呈现上。
2、随着跨模态技术的兴起,基于文本的图像生成技术应运而生,旨在通过自然语言指导视觉内容的生成。这一技术的核心在于利用深度学习中的先进方法,特别是跨模态对比学习模型,如clip,将文本和图像嵌入至统一的语义空间,从而实现文本与图像的精准匹配。相比以往的生成技术,跨模态方法为人类赋予了更大的控制权,使得图像生成从一个自动化的过程转变为一个高度定制化的创作工具,从而显著增强了人物生成图像的表达力与符合度。
3、尽管基于文本的图像生成技术在理论和实践层面上都取得了显著的进展,然而在实际应用
...【技术保护点】
1.基于扩散模型的工笔人物画生成方法,其特征在于,包括步骤:
2.根据权利要求1所述的基于扩散模型的工笔人物画生成方法,其特征在于,解码得到工笔人物画的表达式为:
3.根据权利要求2所述的基于扩散模型的工笔人物画生成方法,其特征在于,所述工笔人物画训练集包括若干工笔人物画和对每幅工笔人物画进行描述的文本信息;工笔花鸟画数据集包括若干工笔花鸟画和对每幅工笔花鸟画进行描述的文本信息。
4.根据权利要求2所述的基于扩散模型的工笔人物画生成方法,其特征在于,工笔人物扩散模型和工笔花鸟扩散模型的主体的模型输出的表达式相同,具体为:
【技术特征摘要】
1.基于扩散模型的工笔人物画生成方法,其特征在于,包括步骤:
2.根据权利要求1所述的基于扩散模型的工笔人物画生成方法,其特征在于,解码得到工笔人物画的表达式为:
3.根据权利要求2所述的基于扩散模型的工笔人物画生成方法,其特征在于,所述工笔人物画训练集包括若干工笔人物画和对每幅工笔人物画进行描述的文本信息;工笔花鸟画数据集包括若干工笔花鸟画和对每幅工笔花鸟画进行描述的文本信息。
4.根据权利要求2所述的基于扩散模型的工笔人物画生成方法,其特征在于,工笔人物扩散模型和工笔花鸟扩散模型的主体的模型输出的表达式相同,具体为:
5.根据权利要求1-4任...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。