一种基于大语言模型的智能内容生成方法、设备及介质技术

技术编号:45927340 阅读:22 留言:0更新日期:2025-07-25 17:54
本说明书实施例公开了一种基于大语言模型的智能内容生成方法、设备及介质,涉及大语言模型技术领域,方法包括:获取用户输入的文本描述信息,通过大语言模型对文本描述信息进行跨模态语义解析,生成多维度语义嵌入向量,多维度语义嵌入向量包括生物特征语义嵌入向量、环境要素语义嵌入向量和物理参数语义嵌入向量;基于多维度语义嵌入向量,对缺失的交互参数进行动态推理补全,生成优化后的结构化描述数据;根据结构化描述数据和预设的多模态控制网络,生成初始图像内容,以对初始图像内容进行验证,确定目标图像内容。自动补全和推理出多主体交互的潜在信息,确保生成图像与文本描述保持高度一致,显著降低由于语义误差带来的生成失真问题。

【技术实现步骤摘要】

本说明书涉及大语言模型,尤其涉及一种基于大语言模型的智能内容生成方法、设备及介质


技术介绍

1、在生成式人工智能技术快速发展的背景下,文生图(text-to-image)与图生图(image-to-image)技术已在单主体图像生成任务中取得显著进展。目前文生图技术主要依赖于扩散模型、生成对抗网络等,通过深度学习模型从文本描述生成对应的图像,通过自然语言输入生成高质量的图像。

2、传统扩散模型通过注意力机制建立文本-图像映射,但面对多个交互主体时,模型难以解析隐含的空间逻辑关系与动作协同性。在直接生成复杂场景时,如生成具有复杂生物特征与特殊材料配饰的真实场景图像,难以保证图像内容与文本描述的一致性,可能存在语义偏差的问题。特别是涉及多个主体、复杂环境等情况时,生成的图像可能无法准确匹配文本描述,生成的图像不完全符合用户的预期。例如,输入“一只可爱的橘色小猫在豪华的白色城堡中玩耍着毛球”时,模型可能会生成小猫颜色错误、“城堡”环境错误、缺少元素“毛球”等问题。此外,由于自然语言的模糊性,提示词的微小变化可能导致生成结果的巨大差异。例如,输入“一本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的智能内容生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于大语言模型的智能内容生成方法,其特征在于,通过大语言模型对所述文本描述信息进行跨模态语义解析,生成多维度语义嵌入向量,具体包括:

3.根据权利要求1所述的一种基于大语言模型的智能内容生成方法,其特征在于,基于所述多维度语义嵌入向量,对缺失的交互参数进行动态推理补全,生成优化后的结构化描述数据,具体包括:

4.根据权利要求3所述的一种基于大语言模型的智能内容生成方法,其特征在于,对所述多维度语义嵌入向量进行模糊信息识别和要素解构处理,确定对应的目标补全实...

【技术特征摘要】

1.一种基于大语言模型的智能内容生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于大语言模型的智能内容生成方法,其特征在于,通过大语言模型对所述文本描述信息进行跨模态语义解析,生成多维度语义嵌入向量,具体包括:

3.根据权利要求1所述的一种基于大语言模型的智能内容生成方法,其特征在于,基于所述多维度语义嵌入向量,对缺失的交互参数进行动态推理补全,生成优化后的结构化描述数据,具体包括:

4.根据权利要求3所述的一种基于大语言模型的智能内容生成方法,其特征在于,对所述多维度语义嵌入向量进行模糊信息识别和要素解构处理,确定对应的目标补全实体,具体包括:

5.根据权利要求3所述的一种基于大语言模型的智能内容生成方法,其特征在于,通过知识推理引擎,对所述目标补全实体进行交互参数补全,确定未明确指定的生物...

【专利技术属性】
技术研发人员:刘育宏魏磊马伟
申请(专利权)人:浪潮智能终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1