利用预训练StyleGAN模型动态卷积核修正的图像重构方法技术

技术编号:37506882 阅读:28 留言:0更新日期:2023-05-07 09:44
本发明专利技术公开了一种利用预训练StyleGAN模型动态卷积核修正的图像重构方法,其特点是将输入图像送入多尺度编码器中得到多尺度特征,构建注意力模块,从多尺度特征中提取图像信息,得到风格码字和残差码字;将风格码字和残差码字送入预训练StyleGAN模型的生成器中,将生成器中的静态卷积核用风格码字调制为动态卷积核,并利用残差码字修正动态卷积核;将多尺度编码器和注意力模块结合,训练一个编码网络,利用修正后的生成器,实现图像的重构。本发明专利技术与现有技术相比具有参数量低,计算量低,显著提高重构图像质量的特点,方法简便,效率高,较好地解决了由于生成器动态卷积核缺乏有效修正而导致的重构图像质量差的问题。修正而导致的重构图像质量差的问题。修正而导致的重构图像质量差的问题。

【技术实现步骤摘要】
利用预训练StyleGAN模型动态卷积核修正的图像重构方法


[0001]本专利技术涉及计算机视觉与数字图像处理
,尤其是一种利用预训练StyleGAN模型动态卷积核修正的图像重构方法。

技术介绍

[0002]目前,生成对抗网络和transformer都在计算机视觉领域取得了良好的效果,图像重构作为计算机视觉中一项图像生成的任务,也得到了很多的发展。图像重构需要将输入图像编码为码字,再通过生成器生成重构图像,生成对抗网络的训练代价过大,增大了高清图像重构的难度。由于StyleGAN模型拥有强大的高清图像生成能力和从侧枝引入风格码字的特点,不少方法利用预训练StyleGAN模型实现高清图像重构,提高了图像质量和效率。
[0003]在利用预训练StyleGAN模型的图像重构方法中,需要训练一个编码器将输入图像编码为风格码字,再将风格码字从侧枝输入预训练StyleGAN模型的生成器中得到重构图像,在输入图像和重构图像之间建立均方误差损失、感知损失和身份标识损失完成训练。仅利用风格码字重构图像,可能丢失图像中的高频细节,有些方法用微调或训练本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种利用预训练StyleGAN模型动态卷积核修正的图像重构方法,其特征在于,该方法包括以下具体步骤:步骤1:将输入图像送入多尺度编码器中得到多尺度特征,构建注意力模块,从多尺度特征中提取图像信息,得到风格码字和残差码字;步骤2:将风格码字和残差码字送入预训练StyleGAN模型的生成器中,将生成器中的静态卷积核用风格码字调制为动态卷积核,并利用残差码字修正动态卷积核;步骤3:将多尺度编码器和注意力模块结合,训练一个编码网络,利用修正后的生成器,实现图像的重构。2.根据权利要求1所述的图像重构方法,其特征在于,所述注意力模块由若干自注意力模块和交叉注意力模块串联构成,产生风格码字和残差码字的注意力模块参数不共享。3.根据权利要求1所述的图像重构方法,其特征在于,所述步骤2,具体包括:步骤2

1:将风格码字经过全连接层映射为调制码字s,逐像素乘在静态卷积核上,得到动态卷积核W
d
,其维度大小为C
out
×
C
in
×3×
3,C
out
为卷...

【专利技术属性】
技术研发人员:孙力胡雪琦
申请(专利权)人:华东师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1