【技术实现步骤摘要】
本专利技术属于计算机视觉领域。
技术介绍
1、扩散模型在图像合成方面取得了巨大的成功,显著提升了图片合成的质量。然而,扩散模型在合成高分辨率图片时仍面临较大挑战,一是低分辨率的噪声调度很难直接用于高分辨率,研究者们需要为高分辨的场景谨慎地调节噪声调度表,且仍难以获得良好的结果;二是高分辨的训练过程需要大量资源,计算成本较高。
2、一种流行的解决方案是stablediffusion[rombach,2022]提出的在潜在空间内训练,再映射回像素空间,但不可避免地会受到低级伪影的影响;另一种方案[ho,2022]是训练一系列不同分辨率的超分扩散模型构成级联,现有的级联方法是有效的,但它需要每个阶段的完整采样,且严重依赖于条件增强,高分辨率阶段的噪声调度表仍有待调整。
3、但是,现有的级联方法的缺点也很明显:(1)虽然确定了低分辨率部分,但仍然要训练和采样从纯噪声开始的完整扩散模型以进行超分辨率,这是耗时的。(2)真实情况和生成的低分辨率条件之间的分布不匹配会损害性能。此外,高分辨率阶段的噪声表仍未得到很好的研究。
...【技术保护点】
1.一种级联扩散方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述根据所述高分辨率高斯噪声构建块状噪声和高斯噪声的混合噪声,包括:
3.根据权利要求1所述的方法,其特征在于,所述将所述模糊高分辨率图像加上所述混合噪声得到加噪模糊图像,表示为:
4.根据权利要求1所述的方法,其特征在于,在将所述加噪模糊图像输入中继扩散模型之前,还包括:
5.根据权利要求1所述的方法,其特征在于,所述对所述加噪模糊图像通过所述随机微分方程采样器进行采样,包括:
6.一种级联扩散装置,其特征在于,包括
<...【技术特征摘要】
1.一种级联扩散方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述根据所述高分辨率高斯噪声构建块状噪声和高斯噪声的混合噪声,包括:
3.根据权利要求1所述的方法,其特征在于,所述将所述模糊高分辨率图像加上所述混合噪声得到加噪模糊图像,表示为:
4.根据权利要求1所述的方法,其特征在于,在将所述加噪模糊图像输入中继扩散模型之前,还包括:
5.根据权利要求1所述的方法,其特征在于,所述对所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。