图像生成方法、装置及计算机设备制造方法及图纸

技术编号：42046530 阅读：26 留言：0更新日期：2024-07-16 23:28

本申请实施例提供一种图像生成方法、装置及计算机设备，所述方法包括：响应用户操作，获取多张目标图片以及确定融合模型；确定每一目标图片对应的标识词以及基于所述标识词构建目标语句；将所述多张目标图片与所述标识词输入预设的扩散模型，确定初始参数；利用所述初始参数初始化所述融合模型；基于所述目标语句以及所述融合模型，生成效果图。本申请能够提高多种风格图片的融合效果。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于计算机视觉领域，涉及图像处理技术，尤其涉及一种图像生成方法、装置及计算机设备。

技术介绍

1、大型语言模型的低秩自适应模型(low-rank adaptation of large languagemodels，lora)可以理解为扩散(stable diffusion,sd)模型中的一种插件。在相关技术中，用户通过选择lora模型，设置lora模型的权重，在sd模型运行时，通过调用该lora模型对输入的图片进行风格优化，从而生成用户想要的风格效果图，但这类方法只能采用单一的lora模型生成单一的效果图，例如，水墨画风格的lora模型只能生成水墨画风格的图片，卡通风格的lora模型只能生成卡通风格的图片，而无法同时实现多种风格的叠加。

2、此外，在另一相关技术中，虽然可以叠加多个lora模型，从而将多种不同风格进行融合。然而，这类简单融合的方法无法把控生成图片的效果，例如，该图片在生成的过程中可能受到多个lora模型的相互制约，从而影响图片的生成效果。

技术实现思路

...

【技术保护点】

1.一种图像生成方法，其特征在于，包括：

2.根据权利要求1所述的图像生成方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的图像生成方法，其特征在于，所述将所述多张目标图片与所述标识词输入预设的扩散模型，确定初始参数，包括：

4.根据权利要求3所述的图像生成方法，其特征在于，所述将所述第一类标识词、所述第一类图片、所述多个第二类标识词以及所述多张第二类图片输入所述扩散模型，得到第一模型参数以及多个第二模型参数，包括：

5.根据权利要求2所述的图像生成方法，其特征在于，所述基于所述目标语句以及所述融合模型，生成效果图，包括：

...

【技术特征摘要】

1.一种图像生成方法，其特征在于，包括：

2.根据权利要求1所述的图像生成方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的图像生成方法，其特征在于，所述将所述多张目标图片与所述标识词输入预设的扩散模型，确定初始参数，包括：

5.根据权利要求2所述的图像生成方法，其特征在于，所述基于所述目标语句以及所述融合模型，生成效果图，包括：

6.根据权利要求5所述...

【专利技术属性】
技术研发人员：罗丹，
申请(专利权)人：广州商研网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人