基于扩散模型的风格化图像生成方法技术

技术编号：39752508 阅读：8 留言：0更新日期：2023-12-17 23:50

本发明专利技术提供了一种基于扩散模型的风格化图像生成方法

全部详细技术资料下载

【技术实现步骤摘要】
基于扩散模型的风格化图像生成方法、介质和设备

[0001]本专利技术涉及图像处理领域，尤其涉及一种基于扩散模型的风格化图像生成方法
、
存储介质
、
电子设备
。

技术介绍

[0002]图像
、
文本引导特定风格的图像生成是计算机视觉中重要的研究领域
。
指定风格的图像的引导生成技术可以在低成本前提下获取丰富的元素，但
2D
图像的指定风格生成技术难以被用于扩展现实
(XR)
中，因此发展三维模型的引导生成技术十分必要
。
实现这一目标通常有两个途径，其一是针对三维网格模型进行特定风格引导生成，另一种方法针对场景和物体的多视角图片进行风格化图像的引导生成，并且保证生成风格化图像之间的几何一致性
。
目前基本以第一种方法为主，可以简单地分为以下几种方案：
[0003]第一，纹理生成方法
。
纹理生成方法旨在生成多种纹理贴图，通过将不同的纹理贴图贴在原始的三维网格模型上从而得到具有不同外观的三维模型
。
但这一方法往往存在以下缺点：
(1)
由于纹理生成方法仅仅生成纹理贴图，而三维网格模型保持不变，通过将纹理贴图贴在模型表面所呈现出的效果通常不佳，与原始网格模型的外观区别较小，难以满足实际应用需求；
(2)
多数纹理生成方法仅在较为简单的网格模型
(
如斯坦福兔子模型
)
上所生成纹理

【技术保护点】

【技术特征摘要】
1.
一种基于扩散模型的风格化图像生成方法，其特征在于，所述方法包括以下步骤：获取源图像集合
、
各个源图像对应的深度图集合以及目标图像，将所述源图像集合中的多张所述源图像在颜色通道上进行拼接，得到第一矩阵，以及对所述深度图集合中的多张深度图进行拼接，得到第二矩阵，所述目标图像包括风格化特征；将所述第一矩阵
、
第二矩阵和所述目标图像输入至训练完成的神经网络扩散模型，根据所述风格化特征输出各个源图像对应的风格化图像；所述神经网络扩散模型在训练时，通过损失函数计算损失值，并根据所述损失值来调节所述风格化图像的图像参数
。2.
如权利要求1所述的基于扩散模型的风格化图像生成方法，其特征在于，所述损失函数包括风格损失函数和相似度损失函数，所述损失值包括风格损失和相似度损失，所述损失值的计算公式如下：
Loss
＝
λ1*Loss
style
+
λ2*Loss
sim
其中，
Loss
为所述损失值，
Loss
style
为风格损失，
Loss
sim
为相似度损失，
λ1和
λ2为设定好的权重参数
。3.
如权利要求2所述的基于扩散模型的风格化图像生成方法，其特征在于，所述图像参数包括风格化程度，所述风格损失函数包括第一风格损失函数和第二风格损失函数，所述第一风格损失函数用于计算所述源图像与所述风格化图像之间的第一损失值
Loss1，所述第二风格损失函数用于计算所述目标图像与所述风格化图像之间的第二损失值
Loss2；所述风格损失根据以下公式进行计算：
Loss
style
＝
α
*Loss1+
β
*Loss2其中，
α
和
β
为设定的参数值，
α
和
β
根据所述风格化程度确定
。4.
如权利要求3所述的基于扩散模型的风格化图像生成方法，其特征在于，所述源图像集合记为所述源图像对应的风格化图像集合记为从所述源图像集合中提取各个源图像的特征图，记为以及从所述风格化图像集合中提取各个风格化图像对应的特征图，记为所述第一损失值
Loss1的计算公式如下：其中，表示均方误差函数
。5.
如权利要求3所述的基于扩散模型的风格化图像生成方法，其特征在于，所述第二损失值
Loss2根据以下方式计算：
Loss2＝
a*Loss
NNFM
+b*Loss
color
其中，
Loss
NNFM
表示目标图像
I
t
的特征图
F
t
和每一个所述风格化图像的特征图之间的
NNFM
损失，
Loss
color
表示根据所述风格化图像和所述目标图像之间的线性损失，
a
和
b
为设定的参数值；所述
NNFM
损失的计算公式如下：
其中，
F
t
(i
′
，
j
′
)
表示目标图像
I
t
的特征图
F
t
的坐标为
(i
′
，
j
′
)
的像素点的像素值，

【专利技术属性】
技术研发人员：林志坚，王喜，廖德良，颜远培，苏松志，孙鸿儒，
申请(专利权)人：蚂蚁特工厦门科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人