【技术实现步骤摘要】
本专利技术涉及文本生成图像,具体的是一种基于协同关系感知的扩散模型食物生成方法及系统。
技术介绍
1、从菜谱生成食物图像旨在从输入的菜谱或食物名称合成诱人的食物图像,这是文本到图像生成技术的一个典型应用。食品图像的生成在许多实际应用中发挥着重要的作用,并带来了经济价值,如餐厅广告宣传、营养管理、菜品创新,食品包装设计等。
2、食物图像、配料和烹饪动作构成了复杂的协作关系,直接影响菜肴的外观。在一些现有的工作中,食物图像生成研究主要基于生成对抗网络,依次模拟烹饪过程并直接生成食物图像。然而,食谱和食物之间的特征交互作用不足,限制了生成对抗网络的表示能力,导致生成的食物图像模糊和扭曲。虽然最新的文本到图像的扩散模型可以通过连续去噪步骤合成更高质量的食品图像,但是由于编码菜谱语义的能力限制,这些模型只能基于简单文本生成图像,如食品名称或食品类别。
技术实现思路
1、为解决上述
技术介绍
中提到的不足,本专利技术的目的在于提供一种基于协同关系感知的扩散模型食物生成方法及系统,能够解决模型对 ...
【技术保护点】
1.一种基于协同关系感知的扩散模型食物生成方法,其特征在于,方法包括以下步骤:
2.根据权利要求1所述的一种基于协同关系感知的扩散模型食物生成方法,其特征在于,所述食物图像数据的获取过程如下:
3.根据权利要求2所述的一种基于协同关系感知的扩散模型食物生成方法,其特征在于,所述筛选出符合美学的图像的过程如下:
4.根据权利要求1所述的一种基于协同关系感知的扩散模型食物生成方法,其特征在于,所述将食物图像数据输入至预先建立的标注模型BLIP内进行文本标注的过程包括:
5.根据权利要求1所述的一种基于协同关系感知的扩散模型食
...【技术特征摘要】
1.一种基于协同关系感知的扩散模型食物生成方法,其特征在于,方法包括以下步骤:
2.根据权利要求1所述的一种基于协同关系感知的扩散模型食物生成方法,其特征在于,所述食物图像数据的获取过程如下:
3.根据权利要求2所述的一种基于协同关系感知的扩散模型食物生成方法,其特征在于,所述筛选出符合美学的图像的过程如下:
4.根据权利要求1所述的一种基于协同关系感知的扩散模型食物生成方法,其特征在于,所述将食物图像数据输入至预先建立的标注模型blip内进行文本标注的过程包括:
5.根据权利要求1所述的一种基于协同关系感知的扩散模型食物生成方法,其特征在于,所述将二元组输入至预训练大模型clip的文本编码器内进行编码,将编码后的关系通过关系注入器输入至预先建立的主干扩散模型的交叉注意力层内的过...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。