图像生成方法、电子设备及存储介质技术

技术编号：38321470 阅读：17 留言：0更新日期：2023-07-29 09:03

本申请实施例提供了一种图像生成方法、电子设备及存储介质，该方法包括：生成与提示文本对应的至少一张图像；生成每张图像的初始文字说明；提取提示文本中的实体词，并确定每个实体词所表征的物体在每张图像中的目标检测结果；根据每张图像的目标检测结果和初始文字说明，生成每张图像的目标文字说明；针对每张图像，将提示文本与图像的目标文字说明进行匹配，得到匹配结果；在不存在满足目标条件的匹配结果时，根据目标文字说明对提示文本进行更新，并基于更新后的提示文本，迭代执行上述各步骤，直至存在满足所述目标条件的匹配结果；从匹配结果满足所述目标条件的至少一张图像中确定目标图像。本申请实施例可以提高图像的生成效率。生成效率。生成效率。

全部详细技术资料下载

【技术实现步骤摘要】
图像生成方法、电子设备及存储介质

[0001]本申请实施例涉及人工智能
，特别是涉及一种图像生成方法、电子设备及存储介质。

技术介绍

[0002]随着人工智能技术的快速发展，出现了基于文本输入的图像生成技术。基于文本输入的图像生成技术，是基于输入的文本生成与文本对应的图像，该技术在艺术创作等领域有重要的应用价值。
[0003]当前主流的图像生成模型，如Stable Diffusion(稳定扩散)，生成的图像结果经常会出现不符合原始文本输入的情况，可能需要用户反复多次尝试，并对输入的提示词进行更新后才能得到符合预期的图像，导致用户操作繁琐，图像生成效率较低。

技术实现思路

[0004]鉴于上述问题，提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种图像生成方法、电子设备及存储介质。
[0005]依据本申请实施例的第一方面，提供了一种图像生成方法，包括：
[0006]生成与提示文本对应的至少一张图像；
[0007]生成每张所述图像的初始文字说明；
[0008]提取所述提示文本中的实体词，并确定每个所述实体词所表征的物体在每张所述图像中的目标检测结果；
[0009]根据每张所述图像的目标检测结果和所述初始文字说明，生成每张所述图像的目标文字说明；
[0010]针对每张所述图像，将所述提示文本与所述图像的目标文字说明进行匹配，得到匹配结果；
[0011]在不存在满足目标条件的匹配结果时，根据所述目标文字说明对所述提示...

【技术保护点】

【技术特征摘要】
1.一种图像生成方法，其特征在于，包括：生成与提示文本对应的至少一张图像；生成每张所述图像的初始文字说明；提取所述提示文本中的实体词，并确定所述实体词所表征的物体在每张所述图像中的目标检测结果；根据每张所述图像的目标检测结果和所述初始文字说明，生成每张所述图像的目标文字说明；针对每张所述图像，将所述提示文本与所述图像的目标文字说明进行匹配，得到匹配结果；在不存在满足目标条件的匹配结果时，根据所述目标文字说明对所述提示文本进行更新，并基于更新后的提示文本，迭代执行上述各步骤，直至存在满足所述目标条件的匹配结果；从所述匹配结果满足所述目标条件的至少一张图像中确定目标图像。2.根据权利要求1所述的方法，其特征在于，所述根据每张所述图像的目标检测结果和所述初始文字说明，生成每张所述图像的目标文字说明，包括：针对每张所述图像，生成与所述目标检测结果对应的文本信息；将所述文本信息和所述图像的初始文字说明整合为所述图像的目标文字说明。3.根据权利要求2所述的方法，其特征在于，所述针对每张所述图像，生成与所述目标检测结果对应的文本信息，包括：针对每张所述图像，对所述目标检测结果中同一物体的数量进行统计，分别确定所述目标检测结果中与每个所述实体词对应的数量；将每个所述实体词和对应数量确定为所述文本信息。4.根据权利要求1
‑
3任一项所述的方法，其特征在于，所述将所述提示文本与所述图像的目标文字说明进行匹配，得到匹配结果，包括：获取包括样本提示文本和样本目标文字说明的匹配对模板集合，所述匹配对模板集合包括多个正匹配对模板和多个负匹配对模板；所述正匹配对模板是样本提示文本和样本目标文字说明相匹配的模板，所述负匹配对模板是样本提示文本和样本目标文字不匹配的模板；将所述匹配对模板集合、所述提示文本和所述目标文字说明输入聊天生成预训练转换器，通过所述聊天生成预训练转换器根据所述匹配对模板集...

【专利技术属性】
技术研发人员：刘伟舟，吴鑫，胡晨，周舒畅，
申请(专利权)人：北京迈格威科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人