一种多级扩散图像超分辨算法制造技术

技术编号:38710032 阅读:20 留言:0更新日期:2023-09-08 14:53
本发明专利技术是一种多级扩散图像超分辨算法,属于计算机视觉技术领域;包括以下步骤:首先进行数据预处理,从原始高分辨率图像创建训练数据集并生成低分辨率图像。接下来,选择U

【技术实现步骤摘要】
一种多级扩散图像超分辨算法


[0001]本专利技术属于计算机视觉
,尤其涉及一种多级扩散图像超分辨算法。

技术介绍

[0002]超分辨率(Super

Resolution,SR)是一种计算机视觉技术,旨在通过分析和处理低分辨率图像,提高其分辨率和细节,从而生成更高质量的高分辨率图像。超分辨率技术在多个领域具有广泛的应用价值,包括卫星图像处理、医学成像、视频处理和恢复等。随着深度学习和神经网络技术的快速发展,超分辨率领域取得了显著的进展。
[0003]随着深度学习的兴起,卷积神经网络(CNN)在图像超分辨率领域取得了显著的进展。SRCNN是第一个使用深度神经网络进行超分辨率的方法。自SRCNN以来,许多基于CNN的超分辨率方法相继被提出,如VDSR、ESPCN、EDSR和RCAN等。这些方法通过学习大量的低分辨率和高分辨率图像对,使得超分辨率性能得到了极大的提升。
[0004]近年来,生成对抗网络(GAN)在图像超分辨率领域也取得了重要的突破。GAN由生成器和判别器组成,生成器负责生成高分辨率图像,而判别器负责区分真实高分辨率图像和生成器生成的图像。这种对抗过程使得生成的高分辨率图像在感知质量方面取得了显著提升。SRGAN是第一个将生成对抗网络应用于图像超分辨率的方法,自SRGAN以来,许多基于GAN的超分辨率方法相继被提出,如ESRGAN、BigGAN等。
[0005]尽管深度学习在图像超分辨率领域取得了巨大成功,但仍然存在一些挑战。例如,如何处理实际应用中的多样化退化模式,如模糊、压缩、噪声等;如何在保持高性能的同时生成更为真实和自然的高分辨率图像;如何有效地处理大规模图像数据,减小计算复杂度和内存占用。
[0006]近年来,扩散模型在图像生成领域取得了显著的成果。相较于传统的深度学习方法,扩散模型表现出更高的性能、更强的泛化能力和鲁棒性。此外,扩散模型支持灵活的模型设计,可根据需求进行定制化优化,并能与其他图像处理方法(如生成对抗网络、卷积神经网络等)相结合,以进一步提升性能。总之,扩散模型为图像处理领域开辟了新的可能性,预示着在超分辨领域未来应用将具有更广阔的发展空间。

技术实现思路

[0007]本专利技术目的在于提供一种多级扩散图像超分辨算法,以解决上述
技术介绍
中提到的技术问题。
[0008]为实现上述目的,本专利技术的一种多级扩散图像超分辨算法的具体技术方案如下:
[0009]扩散模型是一种基于随机过程的生成方法,通过在噪声图像上逐步去噪来生成目标图像。它的核心思想是对原始数据添加噪声,然后通过学习一个去噪模型来逆向恢复原始信号。扩散模型具有稳定的训练过程、较好的噪声鲁棒性和可控的生成过程。在各种图像生成任务中,扩散模型已经展示了令人瞩目的性能,包括图像超分辨率、去模糊和图像生成等。
[0010]扩散模型有着稳定的训练过程,通过条件扩散过程进行训练,这使得训练过程相对稳定,不易受到梯度消失或梯度爆炸的影响;并且在处理噪声时具有较好的鲁棒性,能够在图像重建过程中去除不同程度的噪声;以及可控的生成过程,通过逐步去噪的方式生成高分辨率图像,允许对生成过程进行更细粒度的控制。
[0011]扩散模型和生成对抗网络在图像超分辨率领域都取得了显著的成果,但它们各自具有一定的优缺点。实际应用中,可以根据具体需求和场景,选择合适的方法或将二者结合以实现最佳性能。
[0012]一种多级扩散图像超分辨率算法,包括以下步骤,且以下步骤顺次进行:
[0013]步骤S1、数据预处理阶段
[0014]首先从原始高分辨率图像创建训练数据集,为生成具有不同退化模式的低分辨率图像,应用高阶退化模块,下采样高分辨率图像以生成低分辨率图像;
[0015]实际应用中的低分辨率图像,这些图像通常受到噪声、模糊、压缩等多种退化现象的影响。在训练过程中,为了模拟真实世界中的图像退化,本专利技术使用一种模拟退化过程来生成训练数据,具体如图2所示,将待处理图像传入高阶退化模块后,分别经历第一次退化,第二次退化以及噪声条件增加三个部分。其中,第一次退化包括模糊,下采样,压缩三个步骤;第二次退化包括模糊,下采样,图像压缩与sinc滤波以及第二次下采样四个步骤;噪声条件增加包括上采样与添加噪声两个步骤。
[0016]应用模糊核:将不同类型和参数的模糊核应用于高分辨率图像,模拟图像的模糊效果;
[0017]下采样:通过下采样高分辨率图像,进行双三次插值,生成低分辨率图像;
[0018]添加噪声:向下采样后的图像中添加不同类型的噪声,以模拟实际场景中的噪声干扰;
[0019]图像压缩:对低分辨率图像进行有损压缩,模拟实际应用中的图像压缩效果;
[0020]通过这种模拟退化过程,在训练时考虑真实世界的退化模式,从而在处理实际低分辨率图像时表现出更好的性能。
[0021]步骤S2、选择U

Net作为扩散模型主要网络结构,适用于每个模型。定义编码器和解码器,以及跳跃连接;定义级联扩散模型;构建多个扩散模型,分别负责处理不同分辨率的图像;
[0022]U

Net是一种常用于图像分割和超分辨率等任务的卷积神经网络结构,因为其具有强大的特征捕捉能力和跳跃连接结构,能有效地进行去噪任务并保留图像的细节信息,所以选作扩散模型的训练网络。在本算法中,U

Net作为基础网络结构,负责从低分辨率图像中提取特征并生成高分辨率图像。
[0023]图3为本专利技术的网络结构,图中噪声等级编码为:给定时间步T的固定预算,从分段均匀分布中采样连续噪声等级具体来说,定义T的区间(l
i
‑1,l
i
),其中l为区间端点,当i>0时,和然后,为了采样连续的噪声等级随机选取一个区间(l
k
‑1,l
k
),采样
[0024]将初始估计图像x
t
和原始低分辨率图像y传入U

Net网络,U

Net网络包括下采样
阶段与上采样阶段以及它们之间的跳跃连接。其中,上下采样部分包括卷积层与残差模块。在上下采样阶段,包括多次的卷积处理与残差处理;将尺寸相对应的特征图连接起来即为跳跃连接,这些跳跃连接将下采样阶段中捕获的低级特征直接传递到上采样阶段,有助于保留更多的细节信息;将均匀采样得到的噪声等级编码分别按尺度传入残差模块,最终以估计出当前图像的噪声ε。
[0025]网络中使用残差模块如图4所示,首先对输入进行激活函数处理,然后进行上/下采样和卷积操作,并将其与经过激活函数处理和全连接层处理的嵌入噪声相连接。接着,再次进行激活函数处理、随机失活层处理和卷积操作。最后,将这个输出与初始输入相加,得到最终的输出。
[0026]通过使用这些具有残差连接的构建模块,使模型能够有效地训练,并生成具有高保真度的自然图像。这些残差块有助于在捕捉图像的多样性和细节方面取得更本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多级扩散图像超分辨算法,其特征在于,包括以下步骤,且以下步骤顺次进行:步骤S1、数据预处理阶段首先从原始高分辨率图像创建训练数据集,为生成具有不同退化模式的低分辨率图像,应用高阶退化模块,下采样高分辨率图像以生成低分辨率图像;步骤S2、构建扩散模型选择U

Net作为扩散模型主要网络结构,定义编码器和解码器,以及跳跃连接;定义级联扩散模型;构建多个扩散模型,分别负责处理不同分辨率的图像;步骤S3、训练在训练过程中,首先对最低分辨率的图像应用第一个扩散模型,然后通过超分辨率扩散模型级联,逐步上采样图像并添加更高分辨率细节,计算生成的高分辨率图像与真实图像的损失,反向传播以更新网络权重,每个迭代步骤中,网络优化高分辨率图像重建,生成新的高分辨率图像并在下一迭代中继续优化,根据固定迭代次数或动态停止条件结束训练;步骤S4、验证与测试使用验证集在训练过程中评估网络性能;训练结束后,使用测试集评估最终模型;采用评估指标衡量超分辨率性能。2.根据权利要求1所述的多级扩散图像超分辨算法,其特征在于,所述步骤S1中的退化模块具体包括以下步骤:将待处理图像传入高阶退化模块后,分别经历第一次退化,第二次退化以及噪声条件增加三个部分;第一次退化包括模糊,下采样,压缩三个步骤;第二次退化包括模糊,下采样,图像压缩与sinc滤波以及第二次下采样四个步骤;噪声条件增加包括上采样与添加噪声两个步骤;应用模糊核:将不同类型和参数的模糊核应用于高分辨率图像,模拟图像的模糊效果;下采样:通过下采样高分辨率图像,进行双三次插值,生成低分辨率图像;添加噪声:向下采样后的图像中添加不同类型的噪声,以模拟实际场景中的噪声干扰;图像压缩:对低分辨率图像进行有损压缩,模拟实际应用中的图像压缩效果。3.根据权利要求1所述的多级扩散图像超分辨算法,其特征在于,所述步骤S2中的网络结构具体包括以下步骤:将初始估计图像x
t
和原始低分辨率图像y传入U

Net网络,U

Net网络包括下采样阶段与上采样阶段以及它们之间的跳跃连接;上下采样部分包括卷积层与残差模块,在上下采样阶段,包括多次的卷积处理与残差处理;将尺寸相对应的特征图连接起来即为跳跃连接,这些跳跃连接将下采样阶段中捕获的低级特征直接传递到上采样阶段;将均匀采样得到的噪声等级编码分别按尺度传入残差模块,最终以估计出当前图像的噪声ε。4.根据权利要求3所述的多级扩散图像超分辨算法,其特征在于,所述噪声等级编码为:给定时间步T的固定预算,从分段均匀分布中采样连续噪声等级定义T的区间(l
i
‑1,l
i
),其中l为区间端点,当i>0时,和然后,为了采样连续的噪声等级随机选取一个区间(l
k
‑1,l
k
),采样5.根据权利要求3所述的多级扩散图像超分辨算法,其特征在于,所述残差模块包括以
下步骤:首先对输入进行激活函数处理,然后进行上/下采样和卷积操作,并将其与经过激活函数处理和全连接层处理的嵌入噪声相连接;接着,再次进行激活函数处理、随机失活层处理和卷积操作;最后,将这个输出与初始输入相加,得到最终的输出。6.根据权利要求1所述的多级扩散图像超分辨算法,其特征在于,所述步骤S3中的扩散模型分为...

【专利技术属性】
技术研发人员:付强姚汉群才华王伟刚马智勇刘广文
申请(专利权)人:长春理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1