当前位置: 首页 > 专利查询>罗伯特专利>正文

用于生成具有对象预定计数的图像的生成器网络制造技术

技术编号:33080190 阅读:44 留言:0更新日期:2022-04-15 10:31
用于生成具有对象预定计数的图像的生成器网络。一种用于训练生成器网络的方法,该生成器网络被配置为生成具有多个对象的图像,该方法包括:

【技术实现步骤摘要】
用于生成具有对象预定计数的图像的生成器网络
[0001]本专利技术涉及用于产生合成图像的生成器网络的对抗性训练,该合成图像尤其可以用于训练图像分类器或用于获得机器的空间设计。

技术介绍

[0002]图像分类器需要用训练图像来训练,对于训练图像,分类器应该分配给相应图像的“真实”分类分数是已知的。获得具有足够可变性的训练图像的大集合是耗时且昂贵的。例如,如果图像分类器要对利用车辆携带的一个或多个传感器捕获的交通情形进行分类,则需要长时间的试驾来获得足够数量的训练图像。训练所需的“真实”分类分数频繁地需要通过手动注释训练图像来获得,这也是耗时且昂贵的。此外,诸如暴风雪的一些交通情形在训练图像的捕获期间仅罕见地发生。
[0003]为了缓解训练图像的稀缺性,可以训练生成对抗性网络(GAN)来生成看起来像现实图像的合成图像,并且可以将其用作图像分类器的训练图像。条件GAN(cGAN)可以用于生成合成图像,所述合成图像属于真实感图像分布的特定模式。例如,条件GAN可以生成属于分类的特定类的合成图像。
[0004]DE 10 2018 204 494 B3公开本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于训练生成器网络(1)的方法(100),生成器网络(1)被配置为生成具有多个对象(14a

14d)的图像(13),所述方法包括:
●ꢀ
提供(110)训练图像(11)集合,并且对于每个训练图像(11),提供相应训练图像(11)包含的对象(14a

14d)的至少一个实际计数(15a

15d);
●ꢀ
提供(115)生成器网络(1),生成器网络(1)被配置为将噪声样本(17)和对象(14a

14d)的至少一个目标计数(16a

16d)的组合映射到生成图像(13);
●ꢀ
提供(120)鉴别器网络(2),鉴别器网络(2)被配置为将图像(21)映射到以下各项的组合:图像是训练图像(11)还是由生成器网络(1)生成的生成图像(13)的判定(23),以及图像(21)中对象(14a

14d)的至少一个预测计数(18a

18d);
●ꢀ
抽取(130)噪声样本(17)和对象(14a

14d)的目标计数(16a

16d);
●ꢀ
由生成器网络(1)将噪声样本(17)和对象(14a

14d)的目标计数(16a

16d)映射(140)到生成图像(13);
●ꢀ
从包括生成图像(13)以及训练图像(11)的池(P)随机抽取(150)图像(21);
●ꢀ
将随机抽取的图像(21)供应(160)到鉴别器网络(2),从而将它们映射到以下各项的组合:相应的图像(21)是训练图像(11)还是生成图像(13)的判定(23),以及该图像(21)中对象(14a

14d)的至少一个预测计数(18a

18d);
●ꢀ
用如下目标优化(170)表征鉴别器网络(2)行为的鉴别器参数(22):改进鉴别器网络(2)在生成图像(13)和训练图像(11)之间进行区分所具有的准确度;
●ꢀ
用退化所述准确度的目标优化(180)表征生成器网络(1)行为的生成器参数(12);和
●ꢀ
用如下目标进一步优化(190)生成器参数(12)和鉴别器参数(22)二者:改进在一方面对象(14a

14d)的预测计数(18a

18d)与另一方面对象(14a

14d)的实际(15a

15d)或目标(16a

16d)计数之间的匹配。2.根据权利要求1所述的方法(100),其中,提供(121)鉴别器网络(2),鉴别器网络(2)包括:
●ꢀ
包括多个卷积层和分类层的第一网络(2a),被配置为将这些卷积层的结果映射到被输入到鉴别器网络(2)的图像是训练图像(11)还是生成图像(13)的判定(23);和
●ꢀ
包括多个卷积层和回归层的第二网络(2b),被配置为将这些卷积层的结果映射到图像(21)中对象(14a

14d)的至少一个预测计数(18a

18d)。3.根据权利要求2所述的方法(100),其中,在鉴别器网络(2)的训练期间,
●ꢀ
表征第一网络(2a)中至少一个卷积层的行为的更新参数也在第二网络(2b)中的对应卷积层中被更新(121a),和/或
●ꢀ
表征第二网络(2b)中至少一个卷积层的行为的更新参数也在第一网络(2a)中的对应卷积层中被更新(121b)。4.根据权利要求1至3中任一项所述的方法(100),其中,用优化公共损失函数值的目标来执行(195)生成器参数(12)和鉴别器参数(22)的优化(170

190),所述公共损失函数值包括:
●ꢀ
鉴别器网络(2)识别训练图像(11)变得越低越好的第一贡献;
●ꢀ
鉴别器网络(2)识别生成图像(13)变得越低越好的第二贡献;和
●ꢀ
如果输入到鉴别器网络(2)的图像(21)是训练图像(13),则对象(14a

14d)的预测计数(18a

18d)与对象(14a

14d)的实际计数(15a

15d)匹配变得越低越好,或者如果输入到鉴别器网络(2)的图像(21)是生成图像(13),则对象(14a

14d)的预测计数(18a

18d)与对象(14a

14d)的目标计数(16a

16d)匹配变得越低越好的第三贡献。5.根据权利要求4所述的方法(100),其中,第三贡献是一方面对象(14a

14d)的实际(15a

15d)或目标(16a

【专利技术属性】
技术研发人员:A
申请(专利权)人:罗伯特
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1