一种基于潜在扩散模型的图像阴影去除系统及方法技术方案

技术编号：38332347 阅读：22 留言：0更新日期：2023-07-29 09:15

本申请公开了一种基于潜在扩散模型的图像阴影去除系统及方法，其中系统包括：图像处理模块、潜在空间模块和解码模块；所述图像处理模块用于收集待去除阴影图像，对所述待去除阴影图像进行初步处理，得到低维图像；所述潜在空间模块用于将所述低维图像进行扩散，得到噪声图像，对所述噪声图像进行去噪，得到去噪后低维图像；所述解码模块用于将所述去噪后低维图像解码并进行图像重构，得到去除阴影后图像。本申请的研究和应用可以推动深度学习、计算机视觉等领域的发展，阴影去除技术可以为更高级别的图像分析和识别提供更清晰、自然和准确的图像数据，从而推动相关技术的发展。从而推动相关技术的发展。从而推动相关技术的发展。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于潜在扩散模型的图像阴影去除系统及方法

[0001]本申请属于计算机视觉
，具体涉及一种基于潜在扩散模型的图像阴影去除系统及方法。

技术介绍

[0002]阴影去除是计算机视觉和图像处理领域的一项重要技术，其背景可以追溯到早期的数字图像处理技术。随着数字摄影和图像处理技术的不断发展，阴影去除技术也得到了不断的改进和提高。阴影去除技术的应用非常广泛，包括自动驾驶、机器人导航、视频监控、数字广告、医学图像处理等领域。阴影去除是计算机视觉领域中既基本又重要的任务之一，其处理结果的好坏决定着后续任务的性能，是计算机视觉领域重要预处理阶段。近些年，深度学习理论也被用于解决阴影去除问题，这其中绝大多数都是采用GAN(Generative Adversarial Networks生成对抗网络)来完成图像阴影去除任务,GAN是一种强大的深度学习模型，已经在图像生成、图像修复、图像变换等许多领域得到了广泛的应用。使用GAN进行图像阴影去除也可以获得良好的结果，但是它也存在一些缺点：首先GAN通常需要大量的数据来进行训练，以获得良好的效果。对于阴影去除问题，需要大量的包含阴影和无阴影的图像数据集来进行训练，而这些数据集的准备和标注都是非常耗时和费力的。其次，GAN的训练过程非常复杂，需要同时训练两个神经网络。由于训练过程中的不稳定性，GAN很容易陷入训练不收敛、模式崩溃等问题，这可能导致生成的阴影去除结果出现不自然的纹理和失真等问题。潜在扩散模型(LDM，Latent Diffusion Models)最近在图像生成任务中表现...

【技术保护点】

【技术特征摘要】
1.一种基于潜在扩散模型的图像阴影去除系统，其特征在于，包括：图像处理模块、潜在空间模块和解码模块；所述图像处理模块用于收集待去除阴影图像，对所述待去除阴影图像进行初步处理，得到低维图像；所述潜在空间模块用于将所述低维图像进行扩散，得到噪声图像，对所述噪声图像进行去噪，得到去噪后低维图像；所述解码模块用于将所述去噪后低维图像解码并进行图像重构，得到去除阴影后图像。2.根据权利要求1所述一种基于潜在扩散模型的图像阴影去除系统，其特征在于，所述图像处理模块包括：阴影检测子模块、阴影去除子模块和低维图像生成子模块；所述阴影检测子模块用于检测所述待去除阴影图像的阴影区域，生成阴影区域掩膜；所述阴影去除子模块用于挖除所述待去除阴影图像中的阴影区域，得到第一图像；所述低维图像生成子模块用于对所述第一图像进行降维，得到所述低维图像。3.根据权利要求1所述一种基于潜在扩散模型的图像阴影去除系统，其特征在于，所述潜在空间模块包括：扩散子模块和去噪子模块；所述扩散子模块用于在所述低维图像中添加高斯噪声，直至所述低维图像成为纯噪声图，得到所述噪声图像；所述去噪子模块基于U
‑
Net网络预测所述噪声图像的噪声分布，并基于所述噪声分布对所述噪声图像进行反向去噪过程，得到所述去噪后低维图像。4.根据权利要求2所述一种基于潜在扩散模型的图像阴影去除系统，其特征在于，所述解码模块包括：解码器子模块和重构子模块；所述解码器子模块用于将所述去噪后低维图像进行解码，得到输出图像，并对所述阴影区域掩膜做反相处理，得到反相后掩膜...

【专利技术属性】
技术研发人员：王金华，王东辉，
申请(专利权)人：北京联合大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人