基于多颜色空间的图像上色方法技术

技术编号：41403784 阅读：5 留言：0更新日期：2024-05-20 19:29

本发明专利技术公开了一种基于多颜色空间的图像上色方法；该方法包括：利用编码器对灰度图像进行特征提取，获取不同尺度的图像特征；颜色空间建模，初始化颜色查询向量并将其与多尺度图像特征输入基于Tramsformer的解码器中，对颜色查询向量进行细化调整；将细化后的颜色查询向量与最大尺度图像特征输入颜色映射模块中，获取到单颜色空间下灰度图像对应的颜色通道；重复多次颜色空间的建模操作，获取到多颜色空间下灰度图像对应的颜色通道；将灰度图像以及多颜色空间对应的颜色通道输入颜色空间互补网络中，最后得到RGB彩色图像。本发明专利技术通过更全面地考虑图像中的颜色信息，并通过更精细的颜色建模提高了上色效果的质量。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像修复过程中的图像上色领域，尤其涉及一种基于多颜色空间的图像上色方法。

技术介绍

1、图像上色技术，是指对黑白或灰度图像进行上色的过程，通过对图像中的不同区域进行识别和填充，赋予图像更为丰富的色彩。图像上色技术的关键在于准确地理解图像中的内容。通过深度学习和神经网络等技术，算法能够学习大量图像数据中的颜色分布和关联规律，从而更加智能地为图像上色。这种方法不仅可以应用于静态图像，还可扩展到视频和动画等多媒体领域，为视觉体验提供更为丰富的层次感和表现力。

2、现有的图像上色方法采用了单颜色空间(例如hsv,lab,yuv等)来生成彩色图像。基于单颜色空间的图像上色方法利用神经网络来预测颜色空间对应的颜色通道，例如在hsv颜色空间中预测hs通道；在lab颜色空间中预测ab通道；在yuv颜色空间中预测uv通道。最后将预测的颜色通道与灰度图像对应的亮度通道通过颜色空间的互相转换公式，得到rgb图像，即常见的彩色图像。

3、基于单颜色空间的图像上色方法可能无法准确捕捉图像中的复杂色彩变化和细节。这导致上色结果可能缺乏真实感，使图像看起来失真或人工；此外该类方法通常依赖于预定义的颜色模型或规则，而这些模型可能无法完全适应图像中不同区域的复杂颜色分布。这导致在某些情况下，上色可能不够准确。

技术实现思路

1、针对上述现有技术的不足，本专利技术的目的在于提出了一种基于多颜色空间的图像上色方法，本专利技术通过引入多颜色空间，更全面地考虑图像中的颜色信息，并通过更

2、本专利技术提供一种基于多颜色空间的图像上色方法，包括以下几个步骤：

3、步骤一、利用编码器对灰度图像进行特征提取，获取不同尺度的图像特征；

4、步骤二、颜色空间建模，初始化颜色查询向量并将其与多尺度图像特征输入基于tramsformer的解码器中，对颜色查询向量进行细化调整；将细化后的颜色查询向量与最大尺度图像特征输入颜色映射模块中，获取到单颜色空间下灰度图像对应的颜色通道；

5、步骤三、重复多次颜色空间的建模操作，获取到多颜色空间下灰度图像对应的颜色通道；

6、步骤四、将灰度图像以及多颜色空间对应的颜色通道输入颜色空间互补网络中，最后得到rgb彩色图像。

7、本专利技术中，步骤一中，编码器由特征提取器和上采样模块组成；编码器对灰度图像经过特征提取后，经过一系列的上采样操作获得不同尺度的图像特征；其中：resnet,densenet,mobilenet,efficientnet,convnext,vit等常见的主干网络都可以作为本专利技术的特征提取器。

8、本专利技术中，步骤二中，将细化后的颜色查询向量与最大尺度图像特征输入颜色映射模块中，依次经过点乘操作和卷积操作，获得单颜色空间下灰度图像对应的颜色通道。

9、本专利技术中，步骤三中，tramsformer的解码器包括交叉注意力机制，自注意力机制以及前向传播网络。

10、本专利技术中，步骤三中，多颜色空间包括lab、yuv和hsv等颜色空间。

11、本专利技术中，步骤四中，颜色空间互补网络的任务是学习将输入的灰度图像以及多颜色空间的颜色通道映射到对应的彩色空间中；颜色空间互补网络由2-10个串行的卷积模块组成，每个卷积模块包括卷积层、归一化层和激活函数，以学习输入和输出之间的复杂映射关系。优选的，颜色空间互补网络由4-6个串行的卷积模块组成，每个卷积模块由两个标准卷积块(卷积层、归一化层和激活函数)组成。

12、本专利技术中，训练基于多颜色空间的图像上色模型以实现图像上色，模型的损失函数l由颜色通道损失lcc，感知损失lper，对抗损失ladv以及色彩损失lc四项组成；损失函数l计算为：

13、l＝λcclcc+λperlper+λadvladv+λclc

14、其中，λcc＝1.0,λper＝5.0,λadv＝1.0,λc＝0.5；

15、各个损失的计算如下：

16、

17、其中，yi是真实的颜色通道值，λci是不同颜色空间中颜色通道的权重值。

18、

19、其中，φj表示vgg-16网络的第j个模块的第一层卷积操作，ic表示真实的彩色图像；λj表示对应层的权重值。

20、

21、其中，d表示辨别器；

22、lc＝1-[σrgb(ic′)+0.3·μrgb(ic′)]/100

23、其中，σrgb和μrgb分别表示srgb色彩空间的标准差和平均值。

24、和现有技术相比，本专利技术的有益效果在于：由于rgb、hsv、lab等颜色空间对颜色的描述方式不同，例如，hsv颜色空间更符合人眼对颜色的感知，lab颜色空间对颜色的亮度和饱和度分离较好；即不同的颜色空间提供了多样性，因此本专利技术利用不同的颜色空间，通过更全面地考虑图像中的颜色信息进而更全面地表示图像的颜色信息以在不同的应用场景中能更具有适应性；并且本专利技术通过更精细的颜色建模提高了上色效果的质量。

本文档来自技高网...

【技术保护点】

1.一种基于多颜色空间的图像上色方法，其特征在于，包括以下几个步骤：

2.根据权利要求1所述的基于多颜色空间的图像上色方法，其特征在于，步骤一中，编码器由特征提取器和上采样模块组成；编码器对灰度图像经过特征提取后，经过一系列的上采样操作获得不同尺度的图像特征。

3.根据权利要求1所述的基于多颜色空间的图像上色方法，其特征在于，步骤二中，将细化后的颜色查询向量与最大尺度图像特征输入颜色映射模块中，依次经过点乘操作和卷积操作，获得单颜色空间下灰度图像对应的颜色通道。

4.根据权利要求1所述的基于多颜色空间的图像上色方法，其特征在于，步骤三中，多颜色空间包括Lab、YUV和HSV。

5.根据权利要求1所述的基于多颜色空间的图像上色方法，其特征在于，步骤四中，颜色空间互补网络的任务是学习将输入的灰度图像以及多颜色空间的颜色通道映射到对应的彩色空间中；颜色空间互补网络由2-10个串行的卷积模块组成，每个卷积模块包括卷积层、归一化层和激活函数，以学习输入和输出之间的复杂映射关系。

6.根据权利要求1所述的基于多颜色空间的图像上色方法

...

【技术特征摘要】

1.一种基于多颜色空间的图像上色方法，其特征在于，包括以下几个步骤：

4.根据权利要求1所述的基于多颜色空间的图像上色方法，其特征在于，步骤三中，多颜色...

【专利技术属性】
技术研发人员：杜响成，周钊，郑莹斌，金城，
申请(专利权)人：复旦大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人