图像生成方法、装置及电子设备制造方法及图纸

技术编号：37251523 阅读：14 留言：0更新日期：2023-04-20 23:29

本公开提供一种图像生成方法、装置及电子设备，所述方法的一具体实施方式包括：获取目标文本、线稿图像以及噪声图像；基于所述目标文本和所述线稿图像，得到融合向量；基于所述融合向量对所述噪声图像进行去噪处理，得到与所述目标文本和所述线稿图像匹配的目标图像。该实施方式提高了图像的生成效果，达到了能够按照用户意愿生成图像的目的。按照用户意愿生成图像的目的。按照用户意愿生成图像的目的。

全部详细技术资料下载

【技术实现步骤摘要】
图像生成方法、装置及电子设备

[0001]本公开涉及图像处理
，特别涉及一种图像生成方法、装置及电子设备。

技术介绍

[0002]随着人工智能技术在图像领域的应用和发展，图像生成技术应运而生。目前，有根据用户需要有目的的生成图像的需求。在相关技术中，随着多模态技术的不断发展，基于文本生成图像的技术日新月异，并达到了很好的效果。但是，基于语言文本对图像进行的描述具有一定的局限性，难以满足用户的需求。

技术实现思路

[0003]本公开提供一种图像生成方法、装置及电子设备。
[0004]根据第一方面，提供一种图像生成方法，所述方法包括：
[0005]获取目标文本、线稿图像以及噪声图像；
[0006]基于所述目标文本和所述线稿图像，得到融合向量；
[0007]基于所述融合向量对所述噪声图像进行去噪处理，得到与所述目标文本和所述线稿图像匹配的目标图像。
[0008]根据第二方面，提供一种图像生成装置，所述装置包括：
[0009]获取模块，用于获取目标文本、线稿图像以及噪声图像；
[0010]融合模块，用于基于所述目标文本和所述线稿图像，得到融合向量；
[0011]去噪模块，用于基于所述融合向量对所述噪声图像进行去噪处理，得到与所述目标文本和所述线稿图像匹配的目标图像。
[0012]根据第三方面，提供一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面中任一项所述的方法。
[0013...

【技术保护点】

【技术特征摘要】
1.一种图像生成方法，所述方法包括：获取目标文本、线稿图像以及噪声图像；基于所述目标文本和所述线稿图像，得到融合向量；基于所述融合向量对所述噪声图像进行去噪处理，得到与所述目标文本和所述线稿图像匹配的目标图像。2.根据权利要求1所述的方法，其中，所述基于所述目标文本和所述线稿图像，得到融合向量，包括：获取所述目标文本对应的第一特征向量以及所述线稿图像对应的第二特征向量；将所述第一特征向量和所述第二特征向量进行信息融合，得到所述融合向量。3.根据权利要求2所述的方法，其中，将所述第一特征向量和所述第二特征向量进行信息融合包括，利用注意力机制将所述第一特征向量和所述第二特征向量进行信息融合。4.根据权利要求1所述的方法，其中，所述基于所述融合向量对所述噪声图像进行去噪处理，得到与所述目标文本和所述线稿图像匹配的目标图像，包括：利用目标模型执行多步去噪操作，以对所述噪声图像进行去噪处理；其中，所述多步去噪操作中包括至少一步基于所述融合向量进行去噪处理的第一操作。5.根据权利要求4所述的方法，其中，所述第一操作包括：确定待去噪图像；若所述第一操作为所述多步去噪操作的首步操作，所述待去噪图像为所述噪声图像；若该第一操作为非首步操作，所述待去噪图像为上步去噪操作的处理结果；确定该第一操作对应的第一时序向量；利用所述目标模型，基于所述融合向量和所述第一时序向量对所述待去噪图像进行去噪。6.根据权利要求5所述的方法，其中，所述利用所述目标模型，基于所述融合向量和所述第一时序向量对所述待去噪图...

【专利技术属性】
技术研发人员：刘玮，孙世奇，
申请(专利权)人：北京字跳网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人