一种图像生成系统技术方案

技术编号：39003338 阅读：13 留言：0更新日期：2023-10-07 10:34

本发明专利技术涉及图像处理领域，尤其涉及一种图像生成系统，包括：目标图像A和A对应的目标语义特征向量B，所述系统实现以下步骤：将A作为待加噪图像A0，初始化加噪次数t=0，通过噪声预测模型对A0和B进行噪声预测，得到噪声预测结果C

全部详细技术资料下载

【技术实现步骤摘要】
一种图像生成系统

[0001]本专利技术涉及图像处理领域，特别是涉及一种图像生成系统。

技术介绍

[0002]图像生成的目标是根据一种原始风格的输入图像生成另一种目标风格的输出图像，例如，该方法不需要艺术家的人工绘画便可由神经网络依据输入照片生成对应的肖像画、卡通画等，或是根据画家的草图、油画等生成对应的照片。图像生成在为画家提供参考和灵感，娱乐软件等等领域具有一定的商业价值和社会应用价值。
[0003]线条肖像画是一种独特的艺术风格，高度抽象而又富有表现力，经常使用一组稀疏的连续图形元素尤其是线条来捕捉一个人的独特外观，但是，由于线条肖像画的艺术风格高度抽象且缺乏纹理信息，现有的图像生成方法不能很好地根据原始图像生成线条肖像画，生成结果往往带有许多伪影、模糊、扭曲、不连贯线条等问题。
[0004]为了解决上述问题，研究人员在生成对抗网络的基础结构上进行了完善，利用多个分类器提取眼睛、鼻子、嘴巴等面部器官信息，将局部特征与全局特征融合，从而生成高质量的线条肖像画。然而，这些方法都以生成对抗网络为基础，容易产生训练不稳定、模式崩溃等问题，极大地降低了图像生成结果的准确性。同时，为满足线条肖像画这一抽象艺术风格的生成需求，往往需要额外的分类器等结构，增加了模型的复杂度。
[0005]因此，在图像生成场景中，如何精简图像生成任务中的模型，提高图像生成结果的准确性成为亟待解决的问题。

技术实现思路

[0006]针对上述技术问题，本专利技术采用的技术方案为一种图像生成系统，包括：目标图像...

【技术保护点】

【技术特征摘要】
1.一种图像生成系统，其特征在于，所述系统包括：目标图像A、A对应的目标语义特征向量B、处理器和存储有计算机程序的存储器，当所述计算机程序被处理器执行时，实现以下步骤：S1，将A作为待加噪图像A0，将加噪次数t初始化为t=0；S2，通过经训练的噪声预测模型对A0和B进行噪声预测，得到t对应的噪声预测结果C
t
；S3，对A0和C
t
进行加权相加，得到加噪图像D
t
；S4，以D
t
作为A0，更新t=t+1；S5，返回执行S2步骤至S4步骤，直至t=Z，得到目标加噪图像E，其中，Z为预设的目标加噪次数；S6，将E和B输入至经训练的图像生成模型中进行图像生成，得到目标生成图像，其中， S6具体包括如下步骤：S61，将生成次数s初始化为s= Z
‑
1；S62，将E和B输入至所述经训练的图像生成模型中进行图像生成，得到s对应的生成图像E
s
，以E
s
作为E，更新s=s
‑
1；S63，返回执行S62步骤，直至s=0，得到s=0对应的生成图像E0，确定E0为所述目标生成图像。2.根据权利要求1所述的系统，其特征在于，所述系统还包括经训练的语义编码器，A对应的目标语义特征向量B通过如下步骤获取：通过所述经训练的语义编码器对A进行语义特征提取，得到B。3.根据权利要求1所述的系统，其特征在于，所述经训练的噪声预测模型包括第一下采样模块、第一注意力模块和第一上采样模块，S2具体包括如下步骤：S21，将A0和B输入至所述第一下采样模块，输出第M个中间图像特征T
M
，其中，M为大于2的整数；S22，将T
M
输入至所述第一注意力模块，输出原始注意力图像特征P；S23，将P和T
M
输入至所述第一上采样模块，输出t对应的噪声预测结果C
t
。4.根据权利要求3所述的系统，其特征在于，所述第一下采样模块包括M个第一下采样层，T
m
为第m个下采样层输出的第m个中间图像特征，其中，m=1，2，
……
，M
‑
1，S21具体包括如下步骤：S211，将A0和B输入至第一个第一下采样层进行下采样，输出T1；S212，将T
m
‑1输入至第m个第一下采样层进行下采样，输出T
m
；S213，将T
M
‑1输入至第M个第一下采样层进行下采样，输出T
M
。5.根据权利要求4所述的系统，其特征在于，所述...

【专利技术属性】
技术研发人员：王磊，徐楠，郝艳妮，陈博，李军锋，曹家，罗引，
申请(专利权)人：北京中科闻歌科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人