【技术实现步骤摘要】
本专利技术涉及数字图像处理,具体为一种基于原始像素空间的图片生成方法。
技术介绍
1、随着人工智能技术的飞速发展,图像生成领域取得了显著的进步。特别是,以扩散模型和流模型为代表的深度生成模型,催生了如stable diffusion、flux、midjourney等一系列高性能的图像生成算法,能够根据文本描述或其他条件输入,生成高分辨率、富有创意且逼真度极高的图像。
2、当前,在高质量图像生成领域占据主导地位的技术范式是基于潜在空间的生成模型,特别是潜在扩散模型。这类方法的核心思想是利用一个预先训练好的变分自编码器将高维度的图像数据压缩到一个维度较低、但保留了主要感知信息的潜在空间中。图像的生成过程,如去噪或流变换,主要在这个计算成本更低的潜在空间内进行。当生成过程完成后,再利用vae的解码器将潜在空间中的表征恢复到原始的像素空间,从而得到最终的图像。这种策略的主要优势在于,通过在低维空间中进行核心的生成计算,极大地降低了模型训练和推理所需的计算资源和时间,使得在消费级硬件上生成高分辨率图像成为可能。
3、然而,
...【技术保护点】
1.一种基于原始像素空间的图片生成方法,其特征在于,包括:
2.根据权利要求1所述的一种基于原始像素空间的图片生成方法,其特征在于,所述步骤S102中,针对每个阶段,所述目标数据样本是通过对所述基准图像执行次下采样操作生成的,并且所述源数据样本是通过对所述同一基准图像执行次下采样操作、并随后对所得结果执行一次上采样操作生成的。
3.根据权利要求1所述的一种基于原始像素空间的图片生成方法,其特征在于,所述统一神经网络基于Transformer架构,并且被配置为通过以下方式操作:首先将输入到每个阶段的特征数据分割成一系列不重叠的图像块,然后将所述图
...【技术特征摘要】
1.一种基于原始像素空间的图片生成方法,其特征在于,包括:
2.根据权利要求1所述的一种基于原始像素空间的图片生成方法,其特征在于,所述步骤s102中,针对每个阶段,所述目标数据样本是通过对所述基准图像执行次下采样操作生成的,并且所述源数据样本是通过对所述同一基准图像执行次下采样操作、并随后对所得结果执行一次上采样操作生成的。
3.根据权利要求1所述的一种基于原始像素空间的图片生成方法,其特征在于,所述统一神经网络基于transformer架构,并且被配置为通过以下方式操作:首先将输入到每个阶段的特征数据分割成一系列不重叠的图像块,然后将所述图像块线性投影为一系列令牌,所述transformer架构在所述令牌序列上进行操作以捕捉全局依赖关系。
4.根据权利要求1所述的一种基于原始像素空间的图片生成方法,其特征在于,所述步骤s302中的上采样模块被配置为将空间分辨率在高度和宽度维度上提升为两倍以得到,并且所述上采样模块选自以下组中的一种实现方式:
5.根据权利要求4所述的一种基于原始像素空间的图片生成方法,其特征在于,当所述上采样模块为转置卷积层时,其卷积核尺寸被...
【专利技术属性】
技术研发人员:白立华,施其明,刘永坚,
申请(专利权)人:武汉理工数字传播工程有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。