一种自动驾驶长尾数据增强方法技术

技术编号：31579251 阅读：16 留言：0更新日期：2021-12-25 11:22

本发明专利技术公开了一种自动驾驶长尾数据增强方法，包括扩增阶段，所述扩增阶段包括获取场景信息不同的多张训练图片；基于第一生成式对抗网络的训练模型分别对多张训练图片进行编码，得到多个隐变量；选取具有目标车型的至少一张车型图片；根据隐变量与车型图片，基于第二生成式对抗网络的训练模型生成目标车型处于多种不同场景信息下的扩增图片；其中，第一生成式对抗网络和第二生成式对抗网络的训练模型由训练阶段得到；将得到的扩增图片添加到数据集中。本发明专利技术通过训练两个生成式对抗网络对长尾数据进行扩增，提升训练模型的性能；并且根据目标车型快速、准确地生成不同场景中车型不变的图像，以实现少量样本扩充，解决数据长尾问题。长尾问题。长尾问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种自动驾驶长尾数据增强方法

[0001]本专利技术涉及智能驾驶
，尤其涉及一种自动驾驶长尾数据增强方法。

技术介绍

[0002]自动驾驶的数据集是自动驾驶领域感知模块的关键要素，有了数据就有了算法的各种应用；然而现今状况下很多数据集有长尾效应的问题出现，所谓的长尾效应是指在训练数据中，一小部分的类别(头部类别)占据了大多数的训练样本，而大部分的类别(尾部类别)只有极少数的训练样本；例如，有一辆新款的车，在采集的过程中出现的频率很低或者某些场景下没有出现这种车型，导致最后算法检测不出这种车型。
[0003]而现有技术中，对长尾数据的扩增只是在测试用例层面进行数据扩增，并没有增加训练出来模型的性能；此外，这种扩增方式仅仅只能用于分类模型，在检测任务上并没有实际对生成的图像中车型进行限制，并且由于训练过程中并没有这些生成的图像场景，反而会导致准确率下降。
[0004]因此，需要一种自动驾驶长尾数据增强方法，能够生成不同场景中车型不变的图像，以实现少量样本扩充，解决数据长尾问题。

技术实现思路

[0005]针对上述现有技术中存在的问题，本专利技术提供了一种自动驾驶长尾数据增强方法，能够生成不同场景中车型不变的图像，以实现少量样本扩充，解决数据长尾问题，准确率高，适用范围广泛。所述技术方案如下：
[0006]本专利技术提供了一种自动驾驶长尾数据增强方法，包括扩增阶段，所述扩增阶段包括：
[0007]获取场景信息不同的多张训练图片；
[0008]基于第一生成式对抗网

【技术保护点】

【技术特征摘要】
1.一种自动驾驶长尾数据增强方法，其特征在于，包括扩增阶段，所述扩增阶段包括：获取场景信息不同的多张训练图片；基于第一生成式对抗网络的训练模型分别对多张所述训练图片进行编码，得到与所述场景信息对应的多个隐变量；选取具有目标车型的至少一张车型图片；根据所述隐变量与所述车型图片，基于第二生成式对抗网络的训练模型生成所述目标车型处于多种不同所述场景信息下的扩增图片；其中，所述第一生成式对抗网络的训练模型和所述第二生成式对抗网络的训练模型由训练阶段得到；将得到的所述扩增图片添加到数据集中。2.根据权利要求1所述的一种自动驾驶长尾数据增强方法，其特征在于，在所述扩增阶段之前，所述方法还包括训练阶段，所述训练阶段包括：获取场景信息不同的多张训练图片；基于第一生成式对抗网络分别对多张所述训练图片进行编码，得到与所述场景信息对应的多个训练隐变量；选取具有目标车型的至少一张车型图片；根据所述训练隐变量与所述车型图片，基于第二生成式对抗网络生成所述目标车型处于多种不同所述场景信息下的扩增图片。3.根据权利要求2所述的一种自动驾驶长尾数据增强方法，其特征在于，所述第一生成式对抗网络用于将所述训练图片进行编码得到所述训练隐变量，所述第一生成式对抗网络包括第一生成模型和第一判别模型：所述第一生成模型用于根据起始隐变量生成场景图片，所述第一判别模型用于判别生成的所述场景图片与获取的所述训练图片的真假；所述第二生成式对抗网络用于根据所述训练隐变量和所述车型图片生成所述扩增图片，所述第二生成式对抗网络包括第二生成模型和第二判别模型：所述第二生成模型用于根据所述训练隐变量和所述车型图片生成所述扩增图片，所述第二判别模型用于判别生成的所述扩增图片的车型与选取的所述目标车型是否一致。4.根据权利要求2所述的一种自动驾驶长尾数据增强方法，其特征在于，所述基于第一生成式对抗网络分别对多张所述训练图片进行编码，得到与所述场景信息对应的多个训练隐变量包括：随机初始化一个起始隐变量；通过卷积神经网络将所述起始隐变量生成场景图片；将所述场景图片与所述训练图片...

【专利技术属性】
技术研发人员：李嘉琦，李丰军，周剑光，
申请(专利权)人：中汽创智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人