一种基于协同关系感知的扩散模型食物生成方法及系统技术方案

技术编号：43773233 阅读：47 留言：0更新日期：2024-12-24 16:12

本发明专利技术公开了一种基于协同关系感知的扩散模型食物生成方法及系统，涉及文本生成图像技术领域，包括：接收食物图像数据，将食物图像数据输入至预先建立的标注模型BLIP内进行文本标注，得到标注后的食物图像数据；将标注后的食物图像数据输入至预先建立的问答模型GPT4内对菜谱和图像进行关系提取，提取出每个食材和对应的烹饪动作，作为二元组；将二元组输入至预训练大模型CLIP的文本编码器内进行编码，将编码后的关系通过关系注入器输入至预先建立的主干扩散模型的交叉注意力层内，输出得到生成的食物图像；将生成的食物图像输入至预先建立的图像打分反馈模型内，得出图像打分分数，根据图像打分分数对生成的食物图像进行优化。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及文本生成图像，具体的是一种基于协同关系感知的扩散模型食物生成方法及系统。

技术介绍

1、从菜谱生成食物图像旨在从输入的菜谱或食物名称合成诱人的食物图像，这是文本到图像生成技术的一个典型应用。食品图像的生成在许多实际应用中发挥着重要的作用，并带来了经济价值，如餐厅广告宣传、营养管理、菜品创新，食品包装设计等。

2、食物图像、配料和烹饪动作构成了复杂的协作关系，直接影响菜肴的外观。在一些现有的工作中，食物图像生成研究主要基于生成对抗网络，依次模拟烹饪过程并直接生成食物图像。然而，食谱和食物之间的特征交互作用不足，限制了生成对抗网络的表示能力，导致生成的食物图像模糊和扭曲。虽然最新的文本到图像的扩散模型可以通过连续去噪步骤合成更高质量的食品图像，但是由于编码菜谱语义的能力限制，这些模型只能基于简单文本生成图像，如食品名称或食品类别。

技术实现思路

1、为解决上述
技术介绍
中提到的不足，本专利技术的目的在于提供一种基于协同关系感知的扩散模型食物生成方法及系统，能够解决模型对...

【技术保护点】

1.一种基于协同关系感知的扩散模型食物生成方法，其特征在于，方法包括以下步骤：

2.根据权利要求1所述的一种基于协同关系感知的扩散模型食物生成方法，其特征在于，所述食物图像数据的获取过程如下：

3.根据权利要求2所述的一种基于协同关系感知的扩散模型食物生成方法，其特征在于，所述筛选出符合美学的图像的过程如下：

4.根据权利要求1所述的一种基于协同关系感知的扩散模型食物生成方法，其特征在于，所述将食物图像数据输入至预先建立的标注模型BLIP内进行文本标注的过程包括：

5.根据权利要求1所述的一种基于协同关系感知的扩散模型食物生成方法，其特征在...

【技术特征摘要】

1.一种基于协同关系感知的扩散模型食物生成方法，其特征在于，方法包括以下步骤：

2.根据权利要求1所述的一种基于协同关系感知的扩散模型食物生成方法，其特征在于，所述食物图像数据的获取过程如下：

3.根据权利要求2所述的一种基于协同关系感知的扩散模型食物生成方法，其特征在于，所述筛选出符合美学的图像的过程如下：

4.根据权利要求1所述的一种基于协同关系感知的扩散模型食物生成方法，其特征在于，所述将食物图像数据输入至预先建立的标注模型blip内进行文本标注的过程包括：

5.根据权利要求1所述的一种基于协同关系感知的扩散模型食物生成方法，其特征在于，所述将二元组输入至预训练大模型clip的文本编码器内进行编码，将编码后的关系通过关系注入器输入至预先建立的主干扩散模型的交叉注意力层内的过...

【专利技术属性】
技术研发人员：鲍秉坤，徐梦玲，陶明，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人