一种基于文本色彩描述与Transformer的灰度图像着色方法技术

技术编号：39271753 阅读：11 留言：0更新日期：2023-11-07 10:51

本发明专利技术涉及一种基于文本色彩描述与Transformer的灰度图像着色方法，属于灰度图像自动着色技术领域。本发明专利技术通过利用色彩语言描述文本信息辅助灰度图像着色，以满足用户对灰度图像着色的实际需求。本发明专利技术将色彩语言描述文本信息提炼为两类特征向量，更好的辅助灰度图像进行色彩的映射，实现自然语言描述对灰度图像的色彩编辑；将灰度图像空间信息将与文本描述色彩信息进行深度融合，利用视觉Transformer和残差注意力模块等模型设计方法，更好地提取图像的特征，提高了图像特征融合的效果，生成的着色结果更加清晰、自然。自然。自然。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于文本色彩描述与Transformer的灰度图像着色方法

[0001]本专利技术涉及一种基于文本色彩描述与Transformer的灰度图像着色方法，属于灰度图像自动着色

技术介绍

[0002]随着计算机视觉技术的发展，灰度图像着色成为了一个备受关注的研究领域。传统的灰度图像着色方法需要大量的人工干预，包括手动标记和修正，以及预处理相关操作，限制了灰度图像着色的应用范围。基于文本色彩描述的人工色彩信息输入是一种新颖的解决思路，核心思想是利用自然语言描述辅助灰度图像的着色。基于文本色彩描述的图像着色技术不仅可以对灰度图像进行色彩补充，还可以应用于特定图像的颜色信息替换，为图像颜色处理领域的研究提供发展空间。

技术实现思路

[0003]本专利技术要解决的技术问题是提供一种基于文本色彩描述与Transformer的灰度图像着色方法，用于解决现有对灰度图像自动着色效果较差的问题。
[0004]本专利技术的技术方案是：一种基于文本色彩描述与Transformer的灰度图像着色方法。该方法可以根据不同的文本色彩描述对灰度图像中的目标进行着色。相比于一般自动的着色方法，本专利技术考虑到了不同用户对灰度图像中不同目标的差异化的着色要求，将需要着色的灰度图像和文本色彩描述同时作为条件输入到生成器中，以满足用户输入的要求。本专利技术的关键在于将文本色彩描述作为用户着色输入，同时基于Transformer模型来处理文本与图像的特征关联，从而实现对目标图像的着色。
[0005]具体步骤为：Ste

【技术保护点】

【技术特征摘要】
1.一种基于文本色彩描述与Transformer的灰度图像着色方法，其特征在于：Step 1：特征编码阶段Step 1.1：将待着色的灰度图像由默认的RGB色彩空间转化为CIE
‑
Lab色彩空间，并提取灰度通道L；Step 1.2：将Step1.1中得到的灰度通道L输入到图像编码器中，获得包含空间特征信息的灰度图像特征；Step1.3：将色彩语言描述文本输入到文本编码器，把色彩语言描述文本中的色彩实例信息进行特征提取，分别编码为颜色特征向量和实例特征向量；Step1.4：将Step1.2和Step1.3中得到的灰度图像特征、颜色特征向量和实例特征向量特征按通道维度进行水平拼接得到特征组合；Step2：色彩解码阶段Step2.1：将Step1.4中拼接得到的特征组合输入到灰度图像颜色
‑
实例Transformer中，进行灰度空间特征与文本颜色和实例的特征深度融合得到特征图；Step2.2：将Step2.1中得到的特征图输入到色彩解码器中，通过反卷积将高维特征恢复为两个维度的色彩特征，输出为色彩通道a和色彩通道b；Step2.3：将Step 1.1中原始的灰度通道L与Step2.2中得到的色彩通道a和色彩通道b进行合并，得到CIE
‑
Lab色彩空间的着色结果，随后进行色彩空间转换得到RGB色彩空间的图像，最终得到彩色图像。2.根据权利要求1所述的基于文本色彩描述与Transformer的灰度图像着色方法，其特征在于：所述Step1.2中，将单维度的灰度通道L复制堆叠为三个维度，输入到基于ResNet的图像编码器中，将三个维度的灰度空间信息特征编码为512维，大小为28
×
28的灰度图像特征。3.根据权利要求1所述的基于文本色彩描述与Transformer的灰度图像着色方法，其特征在于：所述Step1.3中，对色彩语言描述文本按照...

【专利技术属性】
技术研发人员：甘健侯，吴迪，李金根，韩晓瑜，陈恳，周菊香，王俊，马然，
申请(专利权)人：云南师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人