当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于双路视觉Transformer的图像风格迁移方法技术

技术编号:43571922 阅读:63 留言:0更新日期:2024-12-06 17:40
一种基于双路视觉Transformer的图像风格迁移方法,对内容图像和风格图像分别配置一路视觉Transformer编码器,得到内容编码和风格编码;由Transformer风格参数提取器将风格编码表征为风格参数向量;再通过视觉Transformer图像解码器加权融合内容编码与风格编码,并基于风格参数向量预测目标风格的特征分布参数,得到风格化编码,最后解码输出生成风格化图像。本发明专利技术基于双路编码‑解码的视觉Transformer架构,既考虑了不同图像域间的编码差异,提升风格表征的准确性,又引入了风格分布度量,进一步提升风格表达能力,使图像渲染无论是色彩分布还是纹理质感均高度契合真实风格,同时能完整保留原始内容语义,避免因施加局部风格纹理而出现失真问题。

【技术实现步骤摘要】

本专利技术属于计算机图像,涉及针对图像的风格迁移方法,具体为一种基于双路视觉transformer的图像风格迁移方法。


技术介绍

1、图像风格迁移旨在分离解耦并重新组合图像内容与图像风格,进而融合内容图像的语义概念以及风格图像的纹理样式以生成风格化图像。其中,被施加风格纹理的图像称作内容图像;提供目标纹理样式的图像称作风格图像;生成图像称作风格化图像。图像风格迁移技术能满足人们编辑渲染既有图像的基本需求,创作出具有艺术表现力和视觉吸引力的合成图像。

2、得益于卷积神经网络(convolutional neural network,cnn)强大的非线性表征学习能力,图像风格迁移技术得到蓬勃发展。基于cnn的图像风格迁移方法通常按编码-解码架构划分网络逻辑,其中编码器大多基于预训练图像分类网络,其表征能力直接决定了风格呈现质量。这类方法需堆叠大量卷积池化层以获取充足的感受野,从而将低层视觉特征重组为高层抽象语义。与此同时,网络量级和复杂度得到同步提升,且特征分辨率不断降低,进而无法精准刻画内容语义及纹理样式。此外,这类方法未考虑不同图像域间的编码差本文档来自技高网...

【技术保护点】

1.一种基于双路视觉Transformer的图像风格迁移方法,其特征是构建一个基于双路编码-解码的视觉Transformer网络模型用于图像风格迁移任务,首先对内容图像和风格图像分别配置一路视觉Transformer编码器,得到内容编码和风格编码;然后对风格编码离散化将风格表征为一组特征,得到为风格参数向量;再通过视觉Transformer图像解码器加权融合内容编码与风格编码,并基于风格参数向量预测目标风格的特征分布参数,在图像风格化过程中引入风格分布度量,自适应学习目标风格的特征分布参数,将内容编码映射至目标风格域实现特定风格渲染,得到风格化编码,最后对风格化编码解码输出生成风格化图像...

【技术特征摘要】

1.一种基于双路视觉transformer的图像风格迁移方法,其特征是构建一个基于双路编码-解码的视觉transformer网络模型用于图像风格迁移任务,首先对内容图像和风格图像分别配置一路视觉transformer编码器,得到内容编码和风格编码;然后对风格编码离散化将风格表征为一组特征,得到为风格参数向量;再通过视觉transformer图像解码器加权融合内容编码与风格编码,并基于风格参数向量预测目标风格的特征分布参数,在图像风格化过程中引入风格分布度量,自适应学习目标风格的特征分布参数,将内容编码映射至目标风格域实现特定风格渲染,得到风格化编码,最后对风格化编码解码输出生成风格化图像。

2.根据权利要求1所述的基于双路视觉transformer的图像风格迁移方法,其特征是基于双路编码-解码的视觉transformer网络模型的实现包括以下步骤:

3.根据权利要求1或2所述的基于双路视觉transformer的图像风格迁移方法,其特征是训练所述网络模型时,对内容图像、风格图像和风格化图像分别进行特征编码,计算内容损失来评估风格化图像与内容图像的语义结构相似性,计算风格损失来评估风格化图像与风格图像的视...

【专利技术属性】
技术研发人员:任桐炜贝佳纪宗杏
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1