一种基于多维度图像信息融合的垃圾图像去噪方法技术

技术编号：38409120 阅读：10 留言：0更新日期：2023-08-07 11:16

本发明专利技术提供了一种基于多维度图像信息融合的垃圾图像去噪方法，分别使用两个子网络对二维图像和三维图像进行互补信息提取，获取更多图像细节特征，引入动态自注意力模块削减二维图像噪声，其中动态卷积自适应地学习不同输入垃圾图像的动态噪声特征，并利用自注意力机制定位动态噪声特征中的显著性前景信息，抑制不重要背景信息；引入基于自适应稀疏机制的Transformer，对三维垃圾图像信息的远距离依赖关系进行建模，构建自适应稀疏机制。本发明专利技术克服卷积神经网络感受野局限性，降低Transformer自注意力运算量，通过二维与三维图像特征融合，能很好改善对垃圾图像去噪效果，提升后续垃圾分类、检测等任务的精确度。检测等任务的精确度。检测等任务的精确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多维度图像信息融合的垃圾图像去噪方法

[0001]本专利技术涉及图像处理与计算机视觉领域，尤其涉及一种基于融合卷积神经网络的图像去噪方法。

技术介绍

[0002]图像去噪技术用于去除图像中存在的噪声信息，还原干净图像，促进图像处理应用的推广。经典的图像去噪方法利用图像中的冗余信息或图像域变换等方式遏制噪声，还原图像。例如，非局部像相似性方法利用了整幅图像来去噪，以图像块为单位在图像中寻找相似区域，再对这些区域求平均，能够比较好的去掉图像中存在的高斯噪声。其中干净图像中像素的估计值由图像中与它具有相似邻域结构的像素加权平均得到。而基于变换域的处理方法主要依赖于噪声信号与图像信号在频域内的差异性，对两种信号进行分离。以频域为例，图像的轮廓、边缘和噪声等分量在频域内对应高频部分，大面积背景区域则对应频域低频部分。根据对应频率特性进行协同滤波能进行有效去噪。然而，这些传统方法面临去噪速率不高且需要手动调参以适应不同噪声等挑战。
[0003]基于深度学习的方式能较好地解决这些问题。深度学习具有自动图像特征提取和学习的特性，可以较好地对噪声进行拟合，而且能降低去噪时间。基于深度学习的图像去噪方法采用多种神经网络架构提升特征表达能力，如残差网络、生成对抗网络和图神经网络等。其中，基于残差网络的去噪方法通过跳跃连接，解决深度网络的梯度消失问题，并且将浅层噪声信息与深层语义特征相连，每层网络学习只需要学习较少内容，降低优化难度。基于残差网络的去噪方法能够明显增大模型深度，提高表达能力，但多次使用跳跃连接容易导致模型出现...

【技术保护点】

【技术特征摘要】
1.一种基于多维度图像信息融合的垃圾图像去噪方法，其特征在于包括下述步骤：步骤1：将二维训练数据集进行维度转换，转换为三维训练数据集；步骤2：将二维训练数据集输入动态自注意力模块，并通过动态自注意力模块，提取二维垃圾噪声特征；步骤3：将步骤1获得的三维训练数据集输入基于自适应稀疏机制的Transformer网络，通过基于自适应稀疏机制的Transformer网络，提取三维训练数据集的三维垃圾噪声特征；步骤4：将步骤3获得的三维垃圾噪声特征进行维度转换，转换为二维数据，二维数据与步骤2获得的二维垃圾噪声特征进行融合；步骤5：将步骤4融合后的噪声输入融合网络，通过残差计算，获得干净垃圾图像；残差计算为将二维噪声图像与融合网络三个卷积处理层的输出进行相减操作；步骤6：通过损失函数计算步骤5获取的输出图像与干净标签垃圾图像的损失，不断优化模型参数，直至所得误差达到任务要求精度范围内即可，得到优化后的去噪模型；步骤7：将待去噪垃圾图像输入步骤6优化后的去噪模型，即可得到去噪后的干净图像。2.一种根据权利要求1所述基于多维度图像信息融合的垃圾图像去噪方法的Transformer网络，其特征在于：所述基于自适应稀疏机制的Transformer网络，接收到三维训练数据集后，将3D图像块输入线性映射层，线性映射层将三维垃圾图像块映射为特征向量，特征向量进入位置嵌入层，位置嵌入层为垃圾图像远距离依赖关系提供输入序列的线索，输出携带位置信息的特征向量序列，带有位置信息的特征向量依次通过6个基于自适应稀疏Transformer子模块，即可提取得到三维训练数据集的三维垃圾噪声特征。3.根据权利要求2所述的Transformer网络，其特征在于：所述Transformer子模块包括2个层归一化、1个多头自注意力层、...

【专利技术属性】
技术研发人员：田春伟，肖景钰，高浩洋，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人