一种基于潜在扩散模型的图像阴影去除系统及方法技术方案

技术编号:38332347 阅读:22 留言:0更新日期:2023-07-29 09:15
本申请公开了一种基于潜在扩散模型的图像阴影去除系统及方法,其中系统包括:图像处理模块、潜在空间模块和解码模块;所述图像处理模块用于收集待去除阴影图像,对所述待去除阴影图像进行初步处理,得到低维图像;所述潜在空间模块用于将所述低维图像进行扩散,得到噪声图像,对所述噪声图像进行去噪,得到去噪后低维图像;所述解码模块用于将所述去噪后低维图像解码并进行图像重构,得到去除阴影后图像。本申请的研究和应用可以推动深度学习、计算机视觉等领域的发展,阴影去除技术可以为更高级别的图像分析和识别提供更清晰、自然和准确的图像数据,从而推动相关技术的发展。从而推动相关技术的发展。从而推动相关技术的发展。

【技术实现步骤摘要】
一种基于潜在扩散模型的图像阴影去除系统及方法


[0001]本申请属于计算机视觉
,具体涉及一种基于潜在扩散模型的图像阴影去除系统及方法。

技术介绍

[0002]阴影去除是计算机视觉和图像处理领域的一项重要技术,其背景可以追溯到早期的数字图像处理技术。随着数字摄影和图像处理技术的不断发展,阴影去除技术也得到了不断的改进和提高。阴影去除技术的应用非常广泛,包括自动驾驶、机器人导航、视频监控、数字广告、医学图像处理等领域。阴影去除是计算机视觉领域中既基本又重要的任务之一,其处理结果的好坏决定着后续任务的性能,是计算机视觉领域重要预处理阶段。近些年,深度学习理论也被用于解决阴影去除问题,这其中绝大多数都是采用GAN(Generative Adversarial Networks生成对抗网络)来完成图像阴影去除任务,GAN是一种强大的深度学习模型,已经在图像生成、图像修复、图像变换等许多领域得到了广泛的应用。使用GAN进行图像阴影去除也可以获得良好的结果,但是它也存在一些缺点:首先GAN通常需要大量的数据来进行训练,以获得良好的效果。对于阴影去除问题,需要大量的包含阴影和无阴影的图像数据集来进行训练,而这些数据集的准备和标注都是非常耗时和费力的。其次,GAN的训练过程非常复杂,需要同时训练两个神经网络。由于训练过程中的不稳定性,GAN很容易陷入训练不收敛、模式崩溃等问题,这可能导致生成的阴影去除结果出现不自然的纹理和失真等问题。潜在扩散模型(LDM,Latent Diffusion Models)最近在图像生成任务中表现出了显著的性能,并在图像合成等任务上取得了非常好的效果,LDM还能够产生更多样化的图像,而且它还拥有保留数据语义结构的能力,所以不会受到模式崩溃的影响。

技术实现思路

[0003]本申请旨在解决现有技术的不足,提出一种基于潜在扩散模型的图像阴影去除系统及方法,将原始图像转换为潜在空间的低维图像,并在潜在空间中通过对低维图像的迭代扩散操作来逐步生成去除阴影后图像。
[0004]为实现上述目的,本申请提供了如下方案:
[0005]一种基于潜在扩散模型的图像阴影去除系统,包括:图像处理模块、潜在空间模块和解码模块;
[0006]所述图像处理模块用于收集待去除阴影图像,对所述待去除阴影图像进行初步处理,得到低维图像;
[0007]所述潜在空间模块用于将所述低维图像进行扩散,得到噪声图像,对所述噪声图像进行去噪,得到去噪后低维图像;
[0008]所述解码模块用于将所述去噪后低维图像解码并进行图像重构,得到去除阴影后图像。
[0009]优选的,所述图像处理模块包括:阴影检测子模块、阴影去除子模块和低维图像生
成子模块;
[0010]所述阴影检测子模块用于检测所述待去除阴影图像的阴影区域,生成阴影区域掩膜;
[0011]所述阴影去除子模块用于挖除所述待去除阴影图像中的阴影区域,得到第一图像;
[0012]所述低维图像生成子模块用于对所述第一图像进行降维,得到所述低维图像。
[0013]优选的,所述潜在空间模块包括:扩散子模块和去噪子模块;
[0014]所述扩散子模块用于在所述低维图像中添加高斯噪声,直至所述低维图像成为纯噪声图,得到所述噪声图像;
[0015]所述去噪子模块基于U

Net网络预测所述噪声图像的噪声分布,并基于所述噪声分布对所述噪声图像进行反向去噪过程,得到所述去噪后低维图像。
[0016]优选的,所述解码模块包括:解码器子模块和重构子模块;
[0017]所述解码器子模块用于将所述去噪后低维图像进行解码,得到输出图像,并对所述阴影区域掩膜做反相处理,得到反相后掩膜;
[0018]所述重构子模块用于将所述输出图像与所述反相后掩膜进行拼接得到第二图像,并将所述第二图像与第一图像进行拼接得到所述去除阴影后图像。
[0019]本申请还提供了一种基于潜在扩散模型的图像阴影去除方法,包括以下步骤:
[0020]收集待去除阴影图像,对所述待去除阴影图像进行初步处理,得到低维图像;
[0021]将所述低维图像进行扩散,得到噪声图像,对所述噪声图像进行去噪,得到去噪后低维图像;
[0022]将所述去噪后低维图像解码并进行图像重构,得到去除阴影后图像。
[0023]优选的,所述初步处理的方法包括:
[0024]检测所述待去除阴影图像的阴影区域,生成阴影区域掩膜;
[0025]基于所述阴影区域掩膜挖除所述待去除阴影图像中的阴影区域,得到第一图像;
[0026]对所述第一图像进行降维,得到所述低维图像。
[0027]优选的,所述扩散的方法包括:在所述低维图像中添加高斯噪声,直至所述低维图像成为纯噪声图,得到所述噪声图像;
[0028]所述去噪的方法包括:基于U

Net网络预测所述噪声图像的噪声分布,并基于所述噪声分布对所述噪声图像进行反向去噪过程,得到所述去噪后低维图像。
[0029]优选的,所述重构的方法包括:
[0030]将所述去噪后低维图像进行解码,得到输出图像,并对所述阴影区域掩膜做反相处理,得到反相后掩膜;
[0031]将所述输出图像与所述反相后掩膜进行拼接得到第二图像,并将所述第二图像与第一图像进行拼接得到所述去除阴影后图像。
[0032]与现有技术相比,本申请的有益效果为:
[0033](1)本申请可以提高图像质量,使图像更加清晰、自然和易于识别,例如,交通监控、安防监控等领域可以通过阴影去除提高图像识别的准确性,减少安全隐患;
[0034](2)本申请是一种基于深度学习的计算机视觉技术,其研究和应用可以推动深度学习、计算机视觉等领域的发展,例如,在图像处理、图像分析、图像识别等领域,阴影去除
技术可以为更高级别的图像分析和识别提供更清晰、自然和准确的图像数据,从而推动相关技术的发展。
附图说明
[0035]为了更清楚地说明本申请的技术方案,下面对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0036]图1为本申请实施例的系统结构示意图;
[0037]图2为本申请实施例的U

Net网络的整体架构图;
[0038]图3为本申请实施例的方法流程示意图;
[0039]图4为本申请实施例的详细流程图。
具体实施方式
[0040]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0041]为使本申请的上述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于潜在扩散模型的图像阴影去除系统,其特征在于,包括:图像处理模块、潜在空间模块和解码模块;所述图像处理模块用于收集待去除阴影图像,对所述待去除阴影图像进行初步处理,得到低维图像;所述潜在空间模块用于将所述低维图像进行扩散,得到噪声图像,对所述噪声图像进行去噪,得到去噪后低维图像;所述解码模块用于将所述去噪后低维图像解码并进行图像重构,得到去除阴影后图像。2.根据权利要求1所述一种基于潜在扩散模型的图像阴影去除系统,其特征在于,所述图像处理模块包括:阴影检测子模块、阴影去除子模块和低维图像生成子模块;所述阴影检测子模块用于检测所述待去除阴影图像的阴影区域,生成阴影区域掩膜;所述阴影去除子模块用于挖除所述待去除阴影图像中的阴影区域,得到第一图像;所述低维图像生成子模块用于对所述第一图像进行降维,得到所述低维图像。3.根据权利要求1所述一种基于潜在扩散模型的图像阴影去除系统,其特征在于,所述潜在空间模块包括:扩散子模块和去噪子模块;所述扩散子模块用于在所述低维图像中添加高斯噪声,直至所述低维图像成为纯噪声图,得到所述噪声图像;所述去噪子模块基于U

Net网络预测所述噪声图像的噪声分布,并基于所述噪声分布对所述噪声图像进行反向去噪过程,得到所述去噪后低维图像。4.根据权利要求2所述一种基于潜在扩散模型的图像阴影去除系统,其特征在于,所述解码模块包括:解码器子模块和重构子模块;所述解码器子模块用于将所述去噪后低维图像进行解码,得到输出图像,并对所述阴影区域掩膜做反相处理,得到反相后掩膜...

【专利技术属性】
技术研发人员:王金华王东辉
申请(专利权)人:北京联合大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1