用于产生逼真图像的生成器的训练方法技术

技术编号：37297675 阅读：21 留言：0更新日期：2023-04-21 22:44

用于从语义图(2、5a)中训练图像(3)的生成器(1)的方法(100)，所述语义图向所述图像(3)的每个像素分配该像素所属对象的语义含义(4)，其中

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于产生逼真图像的生成器的训练方法

[0001]本专利技术涉及对逼真图像的生成器的训练，所述逼真图像又可用于训练图像分类器。

技术介绍

[0002]人类驾驶员在道路交通中驾驶车辆所需的信息中，大约90％是视觉信息。因此，对于车辆的至少部分自动化驾驶来说，重要的是正确地评估在监视车辆环境期间所记录的图像数据的内容，而不管是什么模态的图像数据。对于驾驶任务特别重要的是对图像数据进行分类，以确定所述图像数据中包含哪些交通相关的对象，例如其他交通参与者、车道标记、障碍物和交通标志。
[0003]对应的图像分类器必须使用在大量交通状况下记录的训练图像加以训练。训练图像的获取相对困难且昂贵。现实中很少发生的交通状况在具有训练图像的数据集中可能在数量上未能得到充分代表，从而图像分类器无法最佳地学习如何正确地对这些交通状况进行分类。此外，需要大量手动工作来使用相关联的目标类别分配(“地面实况”)“标记”训练图像或其像素。
[0004]因此，还使用了利用基于生成对抗网络(GAN)的生成器产生的综合产生的训练数据。这种雷达数据的...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于从语义图(2、5a)中训练图像(3)的生成器(1)的方法(100)，所述语义图向所述图像(3)的每个像素分配该像素所属对象的语义含义(4)，具有以下步骤：
·
提供(110)真实训练图像(5)和相关联的语义训练图(5a)，所述语义训练图向相应训练图像(5)的每个像素分配语义含义(4)；
·
使用所述生成器(1)从至少一个语义训练图(5a)中产生(120)图像(3)；
·
针对相同的至少一个语义训练图(5a)确定(130)至少一个真实训练图像(5)；
·
从所述生成器(1)所产生的至少一个图像(3)和所确定的至少一个真实训练图像(5)中产生(140)混合图像(6)，在所述混合图像中第一真实像素子集(6a)被所述生成器(1)所产生的图像(3)的分别对应的像素值占据，其余的真实像素子集(6b)被所述真实训练图像(5)的分别对应的像素值占据；
·
将全都属于相同语义训练图(5a)的所述生成器(1)所产生的图像(3)、所述至少一个真实训练图像(5)和至少一个混合图像(6)输送(150)给鉴别器(7)，所述鉴别器被构造为将所述生成器(1)所产生的图像(3)与通过所述语义训练图(5a)预给定的场景的真实图像(5)区分开来；
·
对表征所述生成器(1)的行为的生成器参数(1a)进行优化(160)，目标是将所述生成器(1)所产生的图像(3)由所述鉴别器(7)错误分类为真实图像(5)；
·
对表征所述鉴别器(7)的行为的鉴别器参数(7a)进行优化(170)，目标是在区分产生的图像(3)和真实图像(5)时提高准确性。2.根据权利要求1所述的方法(100)，其中所述混合图像(6)的像素的以下连续区域(61、62)统一被所述生成器(1)所产生的图像(3)的对应像素值或统一被所述真实训练图像(5)的对应像素值占据(141)，所述连续区域由所述语义训练图(5a)分配了相同的语义含义(4)。3.根据权利要求1至2中任一项所述的方法(100)，其中对所述鉴别器参数(7a)附加地进行优化(171)，目标是将所述混合图像(6)在一定程度上分类为真实图像(5)，该程度对应于从真实训练图像(5)接管到所述混合图像(6)中的像素和/或对象的数量比例。4.根据权利要求1至3中任一项所述的方法(100)，其中选择(151)PatchGAN鉴别器作为鉴别器(7)，所述PatchGAN鉴别器确定产生的图像(3)与真实图像(5)之间在所述图像(3、5、6)的具有预给定大小的子区域处的区别，并且将在此过程中分别获得的结果组合成总结果。5.根据权利要求1至3中任一项所述的方法(100)，其中选择(152)具有编码器结构和解码器结构的鉴别器(7)，所述编码器结构将输入图像在多个连续的处理层中转换为信息减少的表示，所述解码器结构进一步将所述信息减少的...

【专利技术属性】
技术研发人员：E，
申请(专利权)人：罗伯特，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人