一种基于CNN和ViT的红外图像彩色化方法技术

技术编号：38318235 阅读：28 留言：0更新日期：2023-07-29 09:00

本发明专利技术属于图像处理技术领域，尤其为一种基于CNN和ViT的红外图像彩色化方法，该方法包括如下步骤：S1，构建网络模型：整个生成对抗网络包括生成器和鉴别器；S2，准备数据集：对整个生成对抗网络先用红外图像数据集一进行训练；S3，训练网络模型：训练红外图像彩色化模型，将S2中准备好的数据集进行预处理，调整数据集中每个图像的尺寸，固定输入图像的大小，将处理好的数据集输入到S1中构建好的网络模型中进行训练。本发明专利技术采用的网络结构是基于CNN和ViT的生成对抗网络结构，结合了CNN获取局部特征和ViT捕获长程依赖关系的优点，获得更大的感受野，降低了计算复杂度，充分利用了全局信息和局部信息，提高了彩色化能力，能够生成高质量的彩色化图像。量的彩色化图像。量的彩色化图像。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于CNN和ViT的红外图像彩色化方法

[0001]本专利技术涉及图像处理
，具体为一种基于CNN和ViT的红外图像彩色化方法。

技术介绍

[0002]将红外图像转换为可见光图像是一项非常有挑战性的任务。在灰度图像彩色化中，只需要将亮度值转换为色度值；而在红外图像彩色化中，需要在给定热特征的情况下同时估计亮度和色度。这导致红外图像彩色化的结果看起来不够真实，存在严重的细节模糊和纹理扭曲等问题。常见的彩色化方法一般采用卷积神经网络(Convolutional Neural Network，CNN)和生成对抗网络(Generative Adversarial Network，GAN)实现彩色化功能。一方面CNN通过共享卷积核提取特征，减少网络参数数量，提高模型效率，另一方面CNN具有平移不变性，即无论特征被移动到图像的哪个位置，网络都能检测到这些特征。尽管CNN存在很多优势，但是其感受野通常很小，不利于捕获全局特征，会产生较为模糊的边缘以及细节信息，导致彩色化质量较差。而Vision Transformer(ViT)通过自注意力模块可以获取长程依赖关系，扩大图像感受野，能够捕捉到更多的上下文信息。但是ViT中自注意力模块的计算和开销与输入分辨率呈二次关系，不可避免地会带来GPU内存不足和计算效率低下的问题。
[0003]中国专利公开号为“CN115170430A”，名称为“基于两阶段条件生成对抗网络的近红外图像着色方法”，首先获取近红外灰度图像；其次构建近红外图像的灰度预处理模块；然后利用近红外图像的灰...

【技术保护点】

【技术特征摘要】
1.一种基于CNN和ViT的红外图像彩色化方法，其特征在于：该方法具体包括如下步骤：S1，构建网络模型：整个生成对抗网络包括生成器和鉴别器；S2，准备数据集：对整个生成对抗网络先用红外图像数据集一进行训练；S3，训练网络模型：训练红外图像彩色化模型，将S2中准备好的数据集进行预处理，调整数据集中每个图像的尺寸，固定输入图像的大小，将处理好的数据集输入到S1中构建好的网络模型中进行训练；S4，选择最小化损失函数和最优评估指标：通过最小化网络输出图像与标签的损失函数，直到训练次数达到设定阈值或损失函数的值到达设定范围内即可认为模型参数已预训练完成，保存模型参数；同时选择最优评估指标来衡量算法的精度，评估系统的性能；S5，微调模型：用红外图像数据集二对模型进行训练和微调，得到稳定可用的模型参数，进一步提高模型的红外图像彩色化能力；最终使得模型对红外图像彩色化的效果更好；S6，保存模型：保存模型：将网络训练完成后，需要将网络中所有参数保存，之后用将要彩色化的红外图像输入到网络中就可以得到彩色化好的图像；该网络对输入图像大小没有要求，任意尺寸均可。2.根据权利要求1所述的一种基于CNN和ViT的红外图像彩色化方法，其特征在于：所述生成器包括浅层特征提取模块、卷积耦合模块、Transformer模块、卷积层、上采样模块和图像重建模块；所述浅层特征提取模块，用于利用卷积块对图像进行浅层特征提取；所述卷积耦合模块，用于减小特征图的大小，更好地提取局部信息；所述Transformer模块，主要由深度多头自注意力模块和局部特征前馈网络；用于对特征图进行特征转换，生成多尺度特征，更容易地捕获长程依赖关系和局部特征；所述卷积层，用于丰富通道信息；所述上采样模块，用于对特征图进行跨通道的融合，逐步恢复特征图大小；所述图像重建模块，用于恢复通道数量，重建高质量的红外彩色化图像。3.根据权利要求1所述的一种基于CNN和ViT的红外图像彩色化方法，其特征...

【专利技术属性】
技术研发人员：詹伟达，陈宇，葛薇，唐雁峰，李国宁，
申请(专利权)人：长春理工大学重庆研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人