本发明专利技术属于图像处理领域,公开了风格化图像生成方法装置、设备及存储介质,方法包括:S1,获取用于对基于监督学习的风格化图像生成模型进行训练的标签数据对集合;S2,基于标签数据对集合对基于监督学习的风格化图像生成模型进行训练,得到训练好的风格化图像生成模型;S3,获取风格化类型和原始图像;S4,将风格化类型和原始图像输入到训练好的风格化图像生成模型中,得到风格化图像。本发明专利技术的构建方法可以明确地建立风格化图像和内容图像之间的内容和风格的密集对应关系,从而提高图像风格转换的准确性和质量。
【技术实现步骤摘要】
本专利技术涉及图像处理领域,尤其涉及一种风格化图像生成方法、装置、设备及存储介质。
技术介绍
1、艺术图像在我们的日常生活中无处不在,包括艺术、社交媒体化身、电影、娱乐广告等形式的创意行业。随着深度学习技术的出现,现在可以通过自动肖像风格转换从真实的图像中渲染高质量的艺术图像。在当前的同类现有技术中,存在许多图像风格转换模型,这些模型通常采用无监督学习方法,通过最小化两个域之间的特征距离来实现风格转换。这些方法在一定程度上能够成功地进行图像风格转换,但仍然存在一些缺点或不足之处。
2、首先,由于这些方法主要依赖于无监督学习,它们无法提供明确的标签数据对来建立生成图像和标签图像之间的内容和风格的密集对应关系。这导致在进行风格转换时,可能无法准确捕捉到图像的内容和风格的细节。
3、其次,基于无监督学习的方法往往只能在特征层面上隐式地约束生成图像与内容图像的内容一致性和生成图像与风格图像的风格一致性。这种隐式的约束方式可能无法充分减少不同域之间的间隙,导致生成的图像风格转换结果不够理想。此外,这些现有技术可能面临域适应的问题。即使用于训练的数据集很大,但在进行风格转换时,如果输入图像与训练数据集中的图像在颜色、结构等方面存在较大差异,可能会导致生成的图像质量下降或风格转换不准确。
技术实现思路
1、本专利技术的目的在于一种公开风格化图像生成方法、装置、设备及存储介质,解决
技术介绍
中提出的问题。
2、为了达到上述目的,本专利技术采用如下技术方案:
3、第一方面,本专利技术提供了一种风格化图像生成方法,包括:
4、s1,获取用于对基于监督学习的风格化图像生成模型进行训练的标签数据对集合;
5、s2,基于标签数据对集合对基于监督学习的风格化图像生成模型进行训练,得到训练好的风格化图像生成模型;
6、s3,获取风格化类型和原始图像;
7、s4,将风格化类型和原始图像输入到训练好的风格化图像生成模型中,得到风格化图像。
8、可选的,s1包括:
9、s11,获取风格图像的集合;
10、s12,获取内容图像的集合;
11、s13,将风格图像和内容图像进行组合,输入到基于无监督学习的风格化图像生成模型中,得到输出图像;
12、s14,由输出图像以及输出图像对应的内容图像构成标签数据对;
13、s15,将所有获得的标签数据对存入标签数据对集合。
14、可选的,s11包括:
15、采用stable diffusion算法获取风格图像的集合。
16、可选的,s12包括:
17、采用stylegan算法获取内容图像的集合。
18、可选的,s13包括:
19、s131,获取风格图像的集合的元素和内容图像的集合中的元素的所有组合的集合a;
20、s132,基于集合a,分别将集合a中的每个元素对应的风格图像和内容图像输入到基于无监督学习的风格化图像生成模型中,得到输出图像。
21、可选的,获取风格图像的集合和内容图像的集合中的元素的所有组合的集合a,包括:
22、s1311,对风格图像的集合中的元素进行连续编号;
23、s1312,对内容图像的集合中的元素进行连续编号;
24、s1313,分别获取风格图像集合中的每个元素对应的组合:
25、对于风格图像的集合中的元素b,其对应的组合为(b,c1)、(b,c2)、...、(b,cn);
26、ci表示内容图像的集合中的元素i,i∈[1,n],n表示内容图像的集合中的元素的总数;
27、s1314,将风格图像集合中的所有元素对应的组合作为集合a中的元素。
28、可选的,基于无监督学习的风格化图像生成模型包括dualstylegan模型。
29、第二方面,本专利技术提供了一种风格化图像生成装置,包括第一获取模块、训练模块、第二获取模块和图像生成模块;
30、第一获取模块用于获取用于对基于监督学习的风格化图像生成模型进行训练的标签数据对集合;
31、训练模块用于基于标签数据对集合对基于监督学习的风格化图像生成模型进行训练,得到训练好的风格化图像生成模型;
32、第二获取模块用于获取风格化类型和原始图像;
33、图像生成模块用于将风格化类型和原始图像输入到训练好的风格化图像生成模型中,得到风格化图像。
34、第三方面,本专利技术提供了一种电子设备,包括存储器和处理器,其中,
35、所述存储器,用于存储程序;
36、所述处理器,与所述存储器耦合,用于执行所述存储器中存储的所述程序,以实现上述权任一项所述的风格化图像生成方法中的步骤。
37、第四方面,本专利技术提供了一种计算机可读存储介质,用于存储计算机可读取的程序或指令,所述程序或指令被处理器执行时,能够实现上述任一项所述的风格化图像生成方法中的步骤。
38、有益效果:
39、1.实现高质量的图像风格转换:本专利技术的标签数据对构建方法可以明确地建立风格化图像和内容图像之间的内容和风格的密集对应关系,从而提高图像风格转换的准确性和质量。通过提供标签数据对,可以更好地控制风格化图像的内容和风格,使得结果更符合用户的期望,创造出高质量的艺术图像。
40、2.提供更大的数据多样性:本专利技术的方法可以嵌入到风格转换模型中进行端到端的训练,在线生成数据,从而可以无限量生成训练标签数据对。这种方式可以大幅增加训练数据的多样性,提高模型的泛化能力,使得模型能够适应更广泛的风格转换需求。
41、3.填补技术空白:与现有的无监督学习方法相比,本专利技术的方法弥补了图像风格转换领域的技术空白。通过提供明确的标签数据对,本专利技术能够建立风格化图像和内容图像之间的内容和风格的明确对应关系,从而更好地实现图像的风格转换。
42、4.社会和经济效益:该技术可以广泛应用于艺术创作、社交媒体化身、电影、娱乐广告等创意行业。通过高质量的图像风格转换,可以为艺术家、设计师、品牌主等提供更多创作和展示的可能性,促进创意产业的发展。同时,该技术的商业应用也具有经济效益,可以推动相关产业的增长和创新。
本文档来自技高网...
【技术保护点】
1.一种风格化图像生成方法,其特征在于,包括:
2.根据权利要求1所述的一种风格化图像生成方法,其特征在于,S1包括:
3.根据权利要求2所述的一种风格化图像生成方法,其特征在于,S11包括:
4.根据权利要求2所述的一种风格化图像生成方法,其特征在于,S12包括:
5.根据权利要求2所述的一种风格化图像生成方法,其特征在于,S13包括:
6.根据权利要求5所述的一种风格化图像生成方法,其特征在于,获取风格图像的集合和内容图像的集合中的元素的所有组合的集合A,包括:
7.根据权利要求2所述的一种风格化图像生成方法,其特征在于,基于无监督学习的风格化图像生成模型包括DualStyleGAN模型。
8.一种风格化图像生成装置,其特征在于,包括第一获取模块、训练模块、第二获取模块和图像生成模块;
9.一种电子设备,其特征在于,包括存储器和处理器,其中,
10.一种计算机可读存储介质,其特征在于,用于存储计算机可读取的程序或指令,所述程序或指令被处理器执行时,能够实现上述权利要求1至7中任一项所述的风格化图像生成方法中的步骤。
...
【技术特征摘要】
1.一种风格化图像生成方法,其特征在于,包括:
2.根据权利要求1所述的一种风格化图像生成方法,其特征在于,s1包括:
3.根据权利要求2所述的一种风格化图像生成方法,其特征在于,s11包括:
4.根据权利要求2所述的一种风格化图像生成方法,其特征在于,s12包括:
5.根据权利要求2所述的一种风格化图像生成方法,其特征在于,s13包括:
6.根据权利要求5所述的一种风格化图像生成方法,其特征在于,获取风格图像的集合和内容图像的集合中的元素的所有组合的集合...
【专利技术属性】
技术研发人员:龚科,林坚满,
申请(专利权)人:拓元广州智慧科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。