图像识别模型训练方法、设备、云控平台及自动驾驶车辆技术

技术编号:31024758 阅读:18 留言:0更新日期:2021-11-30 03:23
本公开提供了一种图像识别模型训练方法、设备、云控平台及自动驾驶车辆,涉及智能交通、自动驾驶、计算机视觉和深度学习技术领域。具体实现方案为:获取基础训练样本集,利用基础训练样本集训练神经网络模型,得到第一图像识别模型;根据测试样本集,获取第一图像识别模型的难样本集和伪标签样本集,伪标签样本集中各样本的样本标签通过第一图像识别模型预测得到;基于基础训练样本集、难样本集和伪标签样本集中的至少两项,对第一图像识别模型进行训练,得到第二图像识别模型。采用本公开,可以拓展图像识别模型的边界能力,从而提升图像识别模型的泛化能力。别模型的泛化能力。别模型的泛化能力。

【技术实现步骤摘要】
图像识别模型训练方法、设备、云控平台及自动驾驶车辆


[0001]本公开涉及人工智能领域。本公开尤其涉及智能交通、自动驾驶、计算机视觉和深度学习


技术介绍

[0002]目前,图像识别模型通过训练样本集训练好之后,部署在线上使用,如果遇到没有在训练样本集分布上的新场景数据,在导致人工接管的情况下,把新场景数据收集起来,发起众测标注,得到新的训练样本集,然后重新训练模型。这种训练样本集的获取方式存在的缺点主要包括两方面:一是发现新场景数据是一种被动方式,而且是在导致人工接管的方式下得到的,比较滞后;二是只能处理人工接管的新场景数据,实际中还存在其他未导致接管的新场景数据,没有充分挖掘。因此,采用现有技术中的方式训练得到的图像识别模型的泛化能力较弱。

技术实现思路

[0003]本公开提供了一种图像识别模型训练方法、设备、云控平台及自动驾驶车辆。
[0004]根据本公开的一方面,提供了一种图像识别模型训练方法,包括:
[0005]获取基础训练样本集,利用基础训练样本集训练神经网络模型,得到第一图像识别模型;
[0006]根据测试样本集,获取第一图像识别模型的难样本集和伪标签样本集,伪标签样本集中各样本的样本标签通过第一图像识别模型预测得到;
[0007]基于基础训练样本集、难样本集和伪标签样本集中的至少两项,对第一图像识别模型进行训练,得到第二图像识别模型。
[0008]根据本公开的一方面,提供了一种图像识别方法,包括:
[0009]将待识别图像输入训练后的图像识别模型,训练后的图像识别模型根据本公开任一实施例所提供的模型训练方法训练获得;
[0010]根据训练后的图像识别模型,对待识别图像进行识别处理。
[0011]根据本公开的一方面,提供了一种视频处理方法,包括:
[0012]从待处理视频数据流中提取出多个图像帧;
[0013]将多个图像帧输入训练后的图像识别模型,训练后的图像识别模型根据本公开任一实施例所提供的训练方法训练获得;
[0014]根据训练后的图像识别模型,对多个图像帧进行图像识别,得到图像识别结果;
[0015]根据图像识别结果,对待识别视频数据流中的目标对象执行包括识别、定位中的至少一种视频处理。
[0016]根据本公开的另一方面,提供了一种图像识别模型训练装置,包括:
[0017]第一训练模块,用于获取基础训练样本集,利用基础训练样本集训练神经网络模型,得到第一图像识别模型;
[0018]样本获取模块,用于根据测试样本集,获取第一图像识别模型的难样本集和伪标签样本集,伪标签样本集中各样本的样本标签通过第一图像识别模型预测得到;
[0019]第二训练模块,用于基于基础训练样本集、难样本集和伪标签样本集中的至少两项,对第一图像识别模型进行训练,得到第二图像识别模型。
[0020]根据本公开的另一方面,提供了一种图像识别装置,包括:
[0021]输入模块,用于将待识别图像输入训练后的图像识别模型,训练后的图像识别模型根据本公开任一实施例所提供的图像识别模型训练方法训练获得;
[0022]识别模块,用于根据训练后的图像识别模型,对待识别图像进行识别处理。
[0023]根据本公开的另一方面,提供了一种视频处理装置,包括:
[0024]提取模块,用于从待处理视频数据流中提取出多个图像帧;
[0025]输入模块,用于将多个图像帧输入训练后的图像识别模型,训练后的图像识别模型本公开任一实施例所提供的图像识别模型训练方法训练获得;
[0026]识别模块,用于根据训练后的图像识别模型,对多个图像帧进行图像识别,得到图像识别结果;
[0027]处理模块,用于根据图像识别结果,对待识别视频数据流中的目标对象执行包括识别、定位中的至少一种视频处理。
[0028]根据本公开的另一方面,提供了一种电子设备,包括:
[0029]至少一个处理器;以及
[0030]与该至少一个处理器通信连接的存储器;其中,
[0031]该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任一实施例中的方法。
[0032]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行本公开任一实施例中的方法。
[0033]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本公开任一实施例中的方法。
[0034]根据本公开的另一方面,提供了一种路侧设备,包括上述电子设备。
[0035]根据本公开的另一方面,提供了一种云控平台,包括上述电子设备。
[0036]根据本公开的另一方面,提供了一种自动驾驶车辆,包括上述电子设备。
[0037]采用本公开,可以首先获取基础训练样本集,通过基础训练样本集训练神经网络模型,得到第一图像识别模型。然后获取难样本集和伪标签样本集,基于基础训练样本集、难样本集和伪标签样本集中的至少两项作为训练样本集,对第一图像识别模型进行训练,这种模型训练方式,可以扩展图像识别模型的边界能力,从而提升图像识别模型的泛化能力。
[0038]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0039]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0040]图1为本公开一实施例的图像识别模型训练方法的流程图;
[0041]图2为本公开一实施例的图像识别模型训练方法的流程图;
[0042]图3为本公开一实施例的图像识别方法的流程图;
[0043]图4为本公开一实施例的视频处理方法的流程图;
[0044]图5为本公开一实施例的图像识别模型训练方法的流程图;
[0045]图6为本公开一实施例的图像识别模型训练装置的结构示意图;
[0046]图7为本公开一实施例的样本获取模块的结构示意图;
[0047]图8为本公开一实施例的图像识别装置的结构示意图;
[0048]图9为本公开一实施例的视频处理装置的结构示意图;
[0049]图10是用来实现本公开实施例的图像识别模型训练方法、图像识别方法和视频处理方法的电子设备的框图。
具体实施方式
[0050]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0051]本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别模型训练方法,所述方法包括:获取基础训练样本集,利用所述基础训练样本集训练神经网络模型,得到第一图像识别模型;根据测试样本集,获取所述第一图像识别模型的难样本集和伪标签样本集,所述伪标签样本集中各样本的样本标签通过所述第一图像识别模型预测得到;基于所述基础训练样本集、难样本集和伪标签样本集中的至少两项,对所述第一图像识别模型进行训练,得到第二图像识别模型。2.根据权利要求1所述的方法,其中,所述根据测试样本集,获取所述第一图像识别模型的难样本集,包括:在所述测试样本集中的测试样本为道路图像的情况下,将所述测试样本集输入所述第一图像识别模型,得到所述测试样本集中的各测试样本各自对应的预测结果;将高精地图和所述各测试样本各自对应的预测结果进行比对,得到比对结果;根据所述比对结果,确定所述第一图像识别模型的难样本集。3.根据权利要求1所述的方法,其中,所述根据测试样本集,获取所述第一图像识别模型的难样本集,包括:将所述测试样本集输入所述第一图像识别模型,得到所述测试样本集中的各测试样本各自对应的预测结果的置信度;将置信度小于预设置信度阈值的测试样本作为难样本集中的样本。4.根据权利要求1所述的方法,其中,根据测试样本集,获取所述第一图像识别模型的伪标签样本集,包括:将所述测试样本集输入所述第一图像识别模型,得到所述测试样本集中的各测试样本各自对应的预测结果和置信度;将置信度大于或等于预设置信度阈值的测试样本的预测结果作为所述测试样本对应的样本标签,基于所述置信度大于或等于预设置信度阈值的测试样本和对应的样本标签,确定所述伪标签样本集。5.根据权利要求4所述的方法,其中,所述基于所述置信度大于或等于预设置信度阈值的测试样本和对应的样本标签,确定所述伪标签样本集,包括:将所述置信度大于或等于预设置信度阈值的测试样本进行聚类,得到至少一个聚类中心;将每一个聚类中心对应的测试样本和样本标签,作为所述伪标签样本集中的样本和样本标签。6.根据权利要求1所述的方法,在所述基于所述基础训练样本集、难样本集和伪标签样本集中的至少两项,对所述第一图像识别模型进行训练之前,还包括:根据所述基础训练样本集和所述神经网络模型,对所述伪标签样本集进行校验。7.根据权利要求6所述的方法,所述根据所述基础训练样本集和所述神经网络模型,对所述伪标签样本集进行校验,包括:利用所述基础训练样本集和所述伪标签样本集对所述神经网络模型进行训练,得到第三图像识别模型;在所述第三图像识别模型的识别准确率高于所述第一图像识别模型的准确率的情况
下,所述伪标签样本集校验通过。8.根据权利要求6所述的方法,所述基于所述基础训练样本集、难样本集和伪标签样本集中的至少两项,对所述第一图像识别模型进行训练,得到第二图像识别模型,包括:基于所述基础训练样本集、难样本集和校验通过的伪标签样本集中的至少两项,对所述第一图像识别模型进行训练,得到第二图像识别模型。9.一种图像识别方法,所述方法包括:将待识别图像输入训练后的图像识别模型,所述训练后的图像识别模型根据权利要求1

8任一项所述的图像识别模型训练方法训练获得;根据所述训练后的图像识别模型,对所述待识别图像进行识别处理。10.一种视频处理方法,所述方法包括:从待处理视频数据流中提取出多个图像帧;将所述多个图像帧输入训练后的图像识别模型,所述训练后的图像识别模型根据权利要求1

8任一项所述的图像识别训练方法训练获得;根据所述训练后的图像识别模型,对所述多个图像帧进行图像识别,得到图像识别结果;根据所述图像识别结果,对所述待识别视频数据流中的目标对象执行包括识别、定位中的至少一种视频处理。11.一种图像识别模型训练装置,所述装置包括:第一训练模块,用于获取基础训练样本集,利用所述基础训练样本集训练神经网络模型,得到第一图像识别模型;样本获取模块,用于根据测试样本集,获取所述第一图像识别模型的难样本集和伪标签样本集,所述伪标签样本集中各样本的样本标签通过所述第一图像识别模型预测得到;第二训练模块,用于基于所述基础训练样本集、难样本集和伪标签样...

【专利技术属性】
技术研发人员:何雷
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1