【技术实现步骤摘要】
本专利技术属于ai图片生成,具体涉及一种基于多轮问答的ai图片生成方法。
技术介绍
1、随着深度学习技术的发展,基于生成对抗网络(gan)、扩散模型(diffusionmodel)等图像生成技术已广泛应用于艺术创作、设计辅助等领域。
2、然而,传统图像生成方法通常依赖用户输入的静态文本描述(如“日落海滩”),但用户往往难以一次性提供完整的场景、对象、颜色、风格等关键特征描述,导致生成图像与实际需求存在偏差。大语言模型(llm)虽能理解自然语言,但其输出的特征描述缺乏结构化约束,易遗漏关键细节(如对象位置、色彩搭配),无法直接驱动图像生成模型。
3、而且,现有生成模型(如gan或扩散模型)在生成图像后,用户若需修改,需重新输入完整需求描述,系统无法基于初始描述与修改反馈进行增量式调整。
4、图像生成模型对复杂语义需求的建模能力有限,尤其在多轮交互中,用户需求的动态调整可能导致生成结果的不一致(如颜色冲突、对象位置错位),已使生成结果与用户期望产生偏差。
5、综上来说,现有图像生成技术存在用户
...【技术保护点】
1.一种基于多轮问答的AI图片生成方法,其特征在于,包括:
2.根据权利要求1所述的基于多轮问答的AI图片生成方法,其特征在于,得到需求描述,具体为:
3.根据权利要求2所述的基于多轮问答的AI图片生成方法,其特征在于,得到需求描述,还包括:
4.根据权利要求3所述的基于多轮问答的AI图片生成方法,其特征在于,生成初始图片,具体为:
5.根据权利要求3所述的基于多轮问答的AI图片生成方法,其特征在于,生成初始图片,具体为:
6.根据权利要求1所述的基于多轮问答的AI图片生成方法,其特征在于,根据所述需求描述及
...【技术特征摘要】
1.一种基于多轮问答的ai图片生成方法,其特征在于,包括:
2.根据权利要求1所述的基于多轮问答的ai图片生成方法,其特征在于,得到需求描述,具体为:
3.根据权利要求2所述的基于多轮问答的ai图片生成方法,其特征在于,得到需求描述,还包括:
4.根据权利要求3所述的基于多轮问答的ai图片生成方法,其特征在于,生成初始图片,具体为:
5.根据权利要求3所述的基于多轮问答的ai图片生成方法,其特征在于,生成初始图片,具体为:
6.根据权利要求1所述的基于多轮问答的ai图片生成方法,其特征在于,根据所述需...
【专利技术属性】
技术研发人员:殷鑫,魏继鑫,辛廷凯,肖真真,王帅帅,
申请(专利权)人:山东浪潮数字服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。