图像生成方法、装置及计算机设备制造方法及图纸

技术编号:42046530 阅读:26 留言:0更新日期:2024-07-16 23:28
本申请实施例提供一种图像生成方法、装置及计算机设备,所述方法包括:响应用户操作,获取多张目标图片以及确定融合模型;确定每一目标图片对应的标识词以及基于所述标识词构建目标语句;将所述多张目标图片与所述标识词输入预设的扩散模型,确定初始参数;利用所述初始参数初始化所述融合模型;基于所述目标语句以及所述融合模型,生成效果图。本申请能够提高多种风格图片的融合效果。

【技术实现步骤摘要】

本申请属于计算机视觉领域,涉及图像处理技术,尤其涉及一种图像生成方法、装置及计算机设备


技术介绍

1、大型语言模型的低秩自适应模型(low-rank adaptation of large languagemodels,lora)可以理解为扩散(stable diffusion,sd)模型中的一种插件。在相关技术中,用户通过选择lora模型,设置lora模型的权重,在sd模型运行时,通过调用该lora模型对输入的图片进行风格优化,从而生成用户想要的风格效果图,但这类方法只能采用单一的lora模型生成单一的效果图,例如,水墨画风格的lora模型只能生成水墨画风格的图片,卡通风格的lora模型只能生成卡通风格的图片,而无法同时实现多种风格的叠加。

2、此外,在另一相关技术中,虽然可以叠加多个lora模型,从而将多种不同风格进行融合。然而,这类简单融合的方法无法把控生成图片的效果,例如,该图片在生成的过程中可能受到多个lora模型的相互制约,从而影响图片的生成效果。


技术实现思路

1、本申请实施例提供本文档来自技高网...

【技术保护点】

1.一种图像生成方法,其特征在于,包括:

2.根据权利要求1所述的图像生成方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的图像生成方法,其特征在于,所述将所述多张目标图片与所述标识词输入预设的扩散模型,确定初始参数,包括:

4.根据权利要求3所述的图像生成方法,其特征在于,所述将所述第一类标识词、所述第一类图片、所述多个第二类标识词以及所述多张第二类图片输入所述扩散模型,得到第一模型参数以及多个第二模型参数,包括:

5.根据权利要求2所述的图像生成方法,其特征在于,所述基于所述目标语句以及所述融合模型,生成效果图,包括:

...

【技术特征摘要】

1.一种图像生成方法,其特征在于,包括:

2.根据权利要求1所述的图像生成方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的图像生成方法,其特征在于,所述将所述多张目标图片与所述标识词输入预设的扩散模型,确定初始参数,包括:

4.根据权利要求3所述的图像生成方法,其特征在于,所述将所述第一类标识词、所述第一类图片、所述多个第二类标识词以及所述多张第二类图片输入所述扩散模型,得到第一模型参数以及多个第二模型参数,包括:

5.根据权利要求2所述的图像生成方法,其特征在于,所述基于所述目标语句以及所述融合模型,生成效果图,包括:

6.根据权利要求5所述...

【专利技术属性】
技术研发人员:罗丹
申请(专利权)人:广州商研网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1