图像识别模型训练方法、设备、云控平台及自动驾驶车辆技术

技术编号：31024758 阅读：18 留言：0更新日期：2021-11-30 03:23

本公开提供了一种图像识别模型训练方法、设备、云控平台及自动驾驶车辆，涉及智能交通、自动驾驶、计算机视觉和深度学习技术领域。具体实现方案为：获取基础训练样本集，利用基础训练样本集训练神经网络模型，得到第一图像识别模型；根据测试样本集，获取第一图像识别模型的难样本集和伪标签样本集，伪标签样本集中各样本的样本标签通过第一图像识别模型预测得到；基于基础训练样本集、难样本集和伪标签样本集中的至少两项，对第一图像识别模型进行训练，得到第二图像识别模型。采用本公开，可以拓展图像识别模型的边界能力，从而提升图像识别模型的泛化能力。别模型的泛化能力。别模型的泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别模型训练方法、设备、云控平台及自动驾驶车辆

[0001]本公开涉及人工智能领域。本公开尤其涉及智能交通、自动驾驶、计算机视觉和深度学习

技术介绍

[0002]目前，图像识别模型通过训练样本集训练好之后，部署在线上使用，如果遇到没有在训练样本集分布上的新场景数据，在导致人工接管的情况下，把新场景数据收集起来，发起众测标注，得到新的训练样本集，然后重新训练模型。这种训练样本集的获取方式存在的缺点主要包括两方面：一是发现新场景数据是一种被动方式，而且是在导致人工接管的方式下得到的，比较滞后；二是只能处理人工接管的新场景数据，实际中还存在其他未导致接管的新场景数据，没有充分挖掘。因此，采用现有技术中的方式训练得到的图像识别模型的泛化能力较弱。

技术实现思路

[0003]本公开提供了一种图像识别模型训练方法、设备、云控平台及自动驾驶车辆。
[0004]根据本公开的一方面，提供了一种图像识别模型训练方法，包括：
[0005]获取基础训练样本集，利用基础训练样本集训练神经网络模型，得到第一图像识别模型；
[0006]根据测试样本集，获取第一图像识别模型的难样本集和伪标签样本集，伪标签样本集中各样本的样本标签通过第一图像识别模型预测得到；
[0007]基于基础训练样本集、难样本集和伪标签样本集中的至少两项，对第一图像识别模型进行训练，得到第二图像识别模型。
[0008]根据本公开的一方面，提供了一种图像识别方法，包括：
[0009]将待识别图像输入训练...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型训练方法，所述方法包括：获取基础训练样本集，利用所述基础训练样本集训练神经网络模型，得到第一图像识别模型；根据测试样本集，获取所述第一图像识别模型的难样本集和伪标签样本集，所述伪标签样本集中各样本的样本标签通过所述第一图像识别模型预测得到；基于所述基础训练样本集、难样本集和伪标签样本集中的至少两项，对所述第一图像识别模型进行训练，得到第二图像识别模型。2.根据权利要求1所述的方法，其中，所述根据测试样本集，获取所述第一图像识别模型的难样本集，包括：在所述测试样本集中的测试样本为道路图像的情况下，将所述测试样本集输入所述第一图像识别模型，得到所述测试样本集中的各测试样本各自对应的预测结果；将高精地图和所述各测试样本各自对应的预测结果进行比对，得到比对结果；根据所述比对结果，确定所述第一图像识别模型的难样本集。3.根据权利要求1所述的方法，其中，所述根据测试样本集，获取所述第一图像识别模型的难样本集，包括：将所述测试样本集输入所述第一图像识别模型，得到所述测试样本集中的各测试样本各自对应的预测结果的置信度；将置信度小于预设置信度阈值的测试样本作为难样本集中的样本。4.根据权利要求1所述的方法，其中，根据测试样本集，获取所述第一图像识别模型的伪标签样本集，包括：将所述测试样本集输入所述第一图像识别模型，得到所述测试样本集中的各测试样本各自对应的预测结果和置信度；将置信度大于或等于预设置信度阈值的测试样本的预测结果作为所述测试样本对应的样本标签，基于所述置信度大于或等于预设置信度阈值的测试样本和对应的样本标签，确定所述伪标签样本集。5.根据权利要求4所述的方法，其中，所述基于所述置信度大于或等于预设置信度阈值的测试样本和对应的样本标签，确定所述伪标签样本集，包括：将所述置信度大于或等于预设置信度阈值的测试样本进行聚类，得到至少一个聚类中心；将每一个聚类中心对应的测试样本和样本标签，作为所述伪标签样本集中的样本和样本标签。6.根据权利要求1所述的方法，在所述基于所述基础训练样本集、难样本集和伪标签样本集中的至少两项，对所述第一图像识别模型进行训练之前，还包括：根据所述基础训练样本集和所述神经网络模型，对所述伪标签样本集进行校验。7.根据权利要求6所述的方法，所述根据所述基础训练样本集和所述神经网络模型，对所述伪标签样本集进行校验，包括：利用所述基础训练样本集和所述伪标签样本集对所述神经网络模型进行训练，得到第三图像识别模型；在所述第三图像识别模型的识别准确率高于所述第一图像识别模型的准确率的情况
下，所述伪标签样本集校验通过。8.根据权利要求6所述的方法，所述基于所述基础训练样本集、难样本集和伪标签样本集中的至少两项，对所述第一图像识别模型进行训练，得到第二图像识别模型，包括：基于所述基础训练样本集、难样本集和校验通过的伪标签样本集中的至少两项，对所述第一图像识别模型进行训练，得到第二图像识别模型。9.一种图像识别方法，所述方法包括：将待识别图像输入训练后的图像识别模型，所述训练后的图像识别模型根据权利要求1
‑
8任一项所述的图像识别模型训练方法训练获得；根据所述训练后的图像识别模型，对所述待识别图像进行识别处理。10.一种视频处理方法，所述方法包括：从待处理视频数据流中提取出多个图像帧；将所述多个图像帧输入训练后的图像识别模型，所述训练后的图像识别模型根据权利要求1
‑
8任一项所述的图像识别训练方法训练获得；根据所述训练后的图像识别模型，对所述多个图像帧进行图像识别，得到图像识别结果；根据所述图像识别结果，对所述待识别视频数据流中的目标对象执行包括识别、定位中的至少一种视频处理。11.一种图像识别模型训练装置，所述装置包括：第一训练模块，用于获取基础训练样本集，利用所述基础训练样本集训练神经网络模型，得到第一图像识别模型；样本获取模块，用于根据测试样本集，获取所述第一图像识别模型的难样本集和伪标签样本集，所述伪标签样本集中各样本的样本标签通过所述第一图像识别模型预测得到；第二训练模块，用于基于所述基础训练样本集、难样本集和伪标签样...

【专利技术属性】
技术研发人员：何雷，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人