图像生成方法、装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号：40467550 阅读：14 留言：0更新日期：2024-02-22 23:22

本申请实施例公开了一种图像生成方法、装置、电子设备和计算机可读存储介质；本申请实施例在获取图像生成内容，并在图像生成内容中提取出隐空间的特征，得到所述图像生成内容的内容特征后，对内容特征添加至少一次噪声，得到噪声内容特征，对噪声内容特征进行分类，得到预测交互类别，根据预测交互类别，确定噪声内容特征的目标噪声，并基于目标噪声对噪声内容特征进行调整，得到目标噪声内容特征，对目标噪声内容特征进行去噪，以得到目标图像内容特征，并根据目标图像内容特征，生成图像生成内容对应的目标交互图像；该方案可以提升图像生成的准确性。本发明专利技术实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理，具体涉及一种图像生成方法、装置、电子设备和计算机可读存储介质。

技术介绍

1、近年来，随着互联网技术的飞速发展，通过各类扩散模型生成图像的方式也越来越便捷。为了提升生成图像的质量，当前的图像生成方法可以在使用扩散模型的基础上学习不同的分类信息，通过分类信息来引导条件生成图像。

2、在对当前技术的研究和实践过程中，本申请的专利技术人发现在学习分类信息过程中，对于中间过程的隐空间的特征，需要解码成图像并使用分类器进行分类，这个过程会十分耗时，而且，图像级别的梯度下降还会造成对抗攻击，因此，导致图像生成的准确性的较低。

技术实现思路

1、本申请实施例提供一种图像生成方法、装置、电子设备和计算机可读存储介质，可以提高图像生成的准确性。

2、一种图像生成方法，包括：

3、获取图像生成内容，并在所述图像生成内容中提取出隐空间的特征，得到所述图像生成内容的内容特征；

4、对所述内容特征添加至少一次噪声，得到所述图像生成内容对应的噪声内容特征；

5、对所述噪声内容特征进行分类，得到预测交互类别，所述预测交互类别指示基于所述噪声内容特征生成的图像在交互时的反馈程度；

6、根据所述预测交互类别，确定所述噪声内容特征的目标噪声，并基于所述目标噪声对所述噪声内容特征进行调整，得到目标噪声内容特征；

7、对所述目标噪声内容特征进行去噪，以得到目标图像内容特征，并根据所述目标图像内容特征，生成所述图像生成内容对应的目标交互图像。

8、相应的，本申请实施例提供一种图像生成装置，包括：

9、获取单元，用于获取图像生成内容，并在所述图像生成内容中提取出隐空间的特征，得到所述图像生成内容的内容特征；

10、添加单元，用于对所述内容特征添加至少一次噪声，得到所述图像生成内容对应的噪声内容特征；

11、分类单元，用于对所述噪声内容特征进行分类，得到预测交互类别，所述预测交互类别指示基于所述噪声内容特征生成的图像在交互时的反馈程度；

12、调整单元，用于根据所述预测交互类别，确定所述噪声内容特征的目标噪声，并基于所述目标噪声对所述噪声内容特征进行调整，得到目标噪声内容特征；

13、生成单元，用于对所述目标噪声内容特征进行去噪，以得到目标图像内容特征，并根据所述目标图像内容特征，生成所述图像生成内容对应的目标交互图像。

14、在一些实施例中，所述调整单元，具体可以用于在所述图像生成内容中提取出图像条件特征，所述图像条件特征表征基于所述图像生成内容生成图像的条件信息；基于所述图像条件特征，在所述噪声内容特征中识别出目标条件噪声；根据所述预测交互类别，对所述目标条件噪声进行调整，以得到所述噪声内容特征的目标噪声。

15、在一些实施例中，所述调整单元，具体可以用于在所述噪声内容特征中识别出原始噪声；根据所述图像条件特征，在所述噪声内容特征中识别出条件噪声；将所述原始噪声和条件噪声进行融合，得到目标条件噪声。

16、在一些实施例中，所述调整单元，具体可以用于获取所述噪声内容特征对应的引导权重；基于所述引导权重分别对所述原始噪声和条件噪声进行加权；计算加权后条件噪声与加权后原始噪声的差值，得到目标条件噪声。

17、在一些实施例中，所述调整单元，具体可以用于基于所述预测交互类别和条件噪声，确定所述噪声内容特征对应的分类噪声；将所述分类噪声和目标条件噪声进行融合，得到所述噪声内容特征的目标噪声。

18、在一些实施例中，所述调整单元，具体可以用于获取所述预测交互类别对应的概率分布信息，所述概率分布信息包括不同预设交互类别的概率信息，所述预设交互类别包括所述预测交互类别；基于所述概率分布信息和条件噪声，确定不同预设交互类别对应的当前分类噪声；将所述当前分类噪声进行融合，得到所述噪声内容特征对应的分类噪声。

19、在一些实施例中，所述调整单元，具体可以用于基于所述概率分布信息，计算所述预测交互类别对应的预测梯度，所述预测梯度包括以所述预测交互类别作为交互类别标签时对应的梯度；根据所述概率分布信息，计算所述候选交互类别对应的候选梯度，所述候选梯度包括以所述候选交互类别作为所述交互类别标签时对应的梯度；基于所述预测梯度和条件噪声，确定所述预测交互类别对应的预测当前分类噪声；根据所述候选梯度和条件噪声，确定所述候选交互类别对应的候选当前分类噪声，并将所述预测当前分类噪声和候选当前分类噪声作为当前分类噪声。

20、在一些实施例中，所述调整单元，具体可以用于将所述预测交互类别作为交互类别标签，并基于所述概率分布信息和所述交互类别标签，确定所述预测交互类别对应的目标预测损失；基于所述目标预测损失，计算所述预测交互类别对应的预测梯度。

21、在一些实施例中，所述调整单元，具体可以用于对所述预测梯度进行噪声转换，得到所述预测交互类别对应的初始分类噪声；计算所述初始分类噪声与所述条件噪声的差值，得到所述预测交互类别对应的预测当前分类噪声。

22、在一些实施例中，所述调整单元，具体可以用于计算所述预测当前分类噪声与候选当前分类噪声之间的差值，得到候选分类噪声；基于引导权重，对所述候选分类噪声进行加权，得到所述噪声内容特征对应的分类噪声。

23、在一些实施例中，所述调整单元，具体可以用于获取交互图像，并在所述交互图像中提取出隐空间的特征，得到图像特征；对所述图像特征添加至少一次噪声，得到所述交互图像对应的噪声图像特征；将所述噪声图像特征与所述噪声内容特征进行融合，得到融合后特征，并将所述融合后特征作为所述噪声内容特征。

24、在一些实施例中，所述调整单元，具体可以用于将所述目标噪声转换为所述噪声内容特征对应的目标梯度；基于所述目标梯度，确定所述噪声内容特征对应的分类噪声特征；将所述分类噪声特征和所述噪声内容特征进行融合，得到目标噪声内容特征。

25、在一些实施例中，所述生成单元，具体可以用于对所述目标噪声内容特征进行去噪，得到初始图像内容特征，并将所述初始图像内容特征作为所述噪声内容特征；返回执行所述对所述噪声内容特征进行分类的步骤，直至去噪次数达到预设去噪次数时为止，得到目标图像内容特征。

26、在一些实施例中，所述分类单元，具体可以用于采用分类模型在所述噪声内容特征中提取出交互反馈特征，所述交互反馈特征表征基于所述噪声内容特征生成的图像在交互时的反馈信息；基于所述交互反馈特征，预测所述噪声内容特征对应的交互类别，得到预测交互类别。

27、在一些实施例中，所述图像生成装置还可以包括训练单元，所述训练单元，具体可以用于获取交互图像样本，并在所述交互图像样本中提取出隐空间的特征，得到样本图像特征；对所述样本图像特征添加至少一次噪声，并基于添加噪声的噪声图像特征，采用预设分类模型预测所述交互图像样本的交互类别，得到样本交互类别；基于所述样本交互类别，确定所述交互图本文档来自技高网...

【技术保护点】

1.一种图像生成方法，其特征在于，包括：

2.根据权利要求1所述的图像生成方法，其特征在于，所述根据所述预测交互类别，确定所述噪声内容特征的目标噪声，包括：

3.根据权利要求2所述的图像生成方法，其特征在于，所述基于所述图像条件特征，在所述噪声内容特征中识别出目标条件噪声，包括：

4.根据权利要求3所述的图像生成方法，其特征在于，所述将所述原始噪声和条件噪声进行融合，得到目标条件噪声，包括：

5.根据权利要求3所述的图像生成方法，其特征在于，所述根据所述预测交互类别，对所述目标条件噪声进行调整，以得到所述噪声内容特征的目标噪声，包括：

6.根据权利要求5所述的图像生成方法，其特征在于，所述基于所述预测交互类别和条件噪声，确定所述噪声内容特征对应的分类噪声，包括：

7.根据权利要求6所述的图像生成方法，其特征在于，所述预设交互类别还包括候选交互类别，所述基于所述概率分布信息和条件噪声，确定不同预设交互类别对应的当前分类噪声，包括：

8.根据权利要求7所述的图像生成方法，其特征在于，所述基于所述概率分

9.根据权利要求7所述的图像生成方法，其特征在于，所述基于所述预测梯度和条件噪声，确定所述预测交互类别对应的预测当前分类噪声，包括：

10.根据权利要求7所述的图像生成方法，其特征在于，所述将所述当前分类噪声进行融合，得到所述噪声内容特征对应的分类噪声，包括：

11.根据权利要求2所述的图像生成方法，其特征在于，所述基于所述图像条件特征，在所述噪声内容特征中识别出目标条件噪声之前，还包括：

12.根据权利要求1至11任一项所述的图像生成方法，其特征在于，所述基于所述目标噪声对所述噪声内容特征进行调整，得到目标噪声内容特征，包括：

13.根据权利要求1至11任一项所述的图像生成方法，其特征在于，所述对所述目标噪声内容特征进行去噪，以得到目标图像内容特征，包括：

14.根据权利要求1至11任一项所述的图像生成方法，其特征在于，所述对所述噪声内容特征进行分类，得到预测交互类别，包括：

15.根据权利要求14所述的图像生成方法，其特征在于，所述采用分类模型在所述噪声内容特征中提取出交互反馈特征之前，还包括：

16.根据权利要求14所述的图像生成方法，其特征在于，所述根据所述目标图像内容特征，生成所述图像生成内容对应的目标交互图像之后，还包括：

17.一种图像生成装置，其特征在于，包括：

18.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有应用程序，所述处理器用于运行所述存储器内的应用程序，以执行权利要求1至16任一项所述的图像生成方法中的步骤。

19.一种计算机程序产品，包括计算机程序/指令，其特征在于，该计算机程序/指令被处理器执行时实现权利要求1至16任一项所述的图像生成方法中的步骤。

20.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至16任一项所述的图像生成方法中的步骤。

...

【技术特征摘要】

1.一种图像生成方法，其特征在于，包括：

2.根据权利要求1所述的图像生成方法，其特征在于，所述根据所述预测交互类别，确定所述噪声内容特征的目标噪声，包括：

3.根据权利要求2所述的图像生成方法，其特征在于，所述基于所述图像条件特征，在所述噪声内容特征中识别出目标条件噪声，包括：

4.根据权利要求3所述的图像生成方法，其特征在于，所述将所述原始噪声和条件噪声进行融合，得到目标条件噪声，包括：

6.根据权利要求5所述的图像生成方法，其特征在于，所述基于所述预测交互类别和条件噪声，确定所述噪声内容特征对应的分类噪声，包括：

8.根据权利要求7所述的图像生成方法，其特征在于，所述基于所述概率分布信息，计算所述预测交互类别对应的预测梯度，包括：

9.根据权利要求7所述的图像生成方法，其特征在于，所述基于所述预测梯度和条件噪声，确定所述预测交互类别对应的预测当前分类噪声，包括：

10.根据权利要求7所述的图像生成方法，其特征在于，所述将所述当前分类噪声进行融合，得到所述噪声内容特征对应的分类噪声，包括：

11.根据权利要求2所述的图像生成方法，其特...

【专利技术属性】
技术研发人员：刘文双，蔡晶，徐国强，罗鑫骥，尹存祥，何晏成，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人