一种无人驾驶训练数据分类方法、装置及电子设备制造方法及图纸

技术编号:21572594 阅读:29 留言:0更新日期:2019-07-10 15:40
本发明专利技术提供一种无人驾驶训练数据分类方法、装置及电子设备,该方法包括:获得N个数据集,其中,N个数据集包括采集的数据样本中的数据,每个数据样本包括N种属性信息的数据,属于同一数据集的数据的属性信息相同,N为大于1的整数;对N个数据集逐个进行聚类,得到N个数据集中最后进行聚类的数据集的M个数据类别,且不同数据类别中的数据所对应的数据样本用于不同预测模型的训练,其中,第K+1个数据集的聚类是基于第K个数据集的聚类结果进行聚类,K为小于N的正整数,M为大于1的整数。这样,不仅可以提升训练预测模型的效率,还可以提升训练得到的预测模型的准确性。

An Unmanned Driver Training Data Classification Method, Device and Electronic Equipment

【技术实现步骤摘要】
一种无人驾驶训练数据分类方法、装置及电子设备
本专利技术涉及人工智能
,尤其涉及一种无人驾驶训练数据分类方法、装置及电子设备。
技术介绍
随着计算机、图像处理以及无线通信等技术的飞速发展,目前汽车行业正朝着智能化方向发展,自动驾驶则是汽车智能化发展的方向。现有的自动驾驶汽车,通常是应用深度学习技术,通过预先对预测模型的训练,来根据具体驾驶场景的需求输出车辆的控制指令,从而实现车辆的自动驾驶。其中,现有的预测模型的训练过程中,为保证得到的预测模型的准确性,通常需要通过包含丰富的测试场景的训练数据训练预测模型。但是,目前为实现对训练数据的场景选择,通常是由人工进行标注,操作繁琐,尤其是所需的训练数据较多时,直接导致训练预测模型的效率降低。可见,目前在预测模型的训练过程中,存在训练预测模型的效率低的问题。
技术实现思路
本专利技术实施例提供一种无人驾驶训练数据分类方法、装置及电子设备,以解决目前在预测模型的训练过程中,存在训练预测模型的效率低的问题。为解决上述问题,本专利技术实施例是这样实现的:第一方面,本专利技术实施例提供了一种无人驾驶训练数据分类方法,包括:获得N个数据集,其中,所述N个数据集包括采集的数据样本中的数据,每个数据样本包括N种属性信息的数据,属于同一数据集的数据的属性信息相同,所述N为大于1的整数;对所述N个数据集逐个进行聚类,得到所述N个数据集中最后进行聚类的数据集的M个数据类别,且不同数据类别中的数据所对应的数据样本用于不同预测模型的训练,其中,第K+1个数据集的聚类是基于第K个数据集的聚类结果进行聚类,所述K为小于N的正整数,M为大于1的整数。第二方面,本专利技术实施例还提供了一种无人驾驶训练数据分类装置,包括:数据集获取模块,用于获得N个数据集,其中,所述N个数据集包括采集的数据样本中的数据,每个数据样本包括N种属性信息的数据,属于同一数据集的数据的属性信息相同,所述N为大于1的整数;聚类模块,用于对所述N个数据集逐个进行聚类,得到所述N个数据集中最后进行聚类的数据集的M个数据类别,且不同数据类别中的数据所对应的数据样本用于不同预测模型的训练,其中,第K+1个数据集的聚类是基于第K个数据集的聚类结果进行聚类,所述K为小于N的正整数,M为大于1的整数。第三方面,本专利技术实施例还提供了一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述无人驾驶训练数据分类方法的步骤。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述无人驾驶训练数据分类方法的步骤。本专利技术实施例,通过获得N个数据集,并对N个数据集逐个进行聚类,从而得到M个数据类别,且电子设备可以使用该M个数据类别中各数据类别的数据所对应的数据样本分别训练预测模型,实现对采集的数据的分类,且使聚类后的每一数据类别的数据的场景更丰富,操作便捷且简单,不仅可以提升训练预测模型的效率,还可以提升训练得到的预测模型的准确性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的无人驾驶训练数据分类方法的流程图;图2是本专利技术实施例提供的无人驾驶训练数据分类方法实际应用实例的流程图;图3是本专利技术实施例中对车辆动力学数据进行聚类的聚类结果示意图;图4是本专利技术实施例中对环境场景数据进行聚类的聚类结果示意图;图5是本专利技术实施例提供的无人驾驶训练数据分类装置的结构示意图之一;图6是本专利技术实施例提供的聚类模块的结构示意图;图7是本专利技术实施例提供的无人驾驶训练数据分类装置的结构示意图之二;图8是本专利技术实施例提供的无人驾驶训练数据分类装置的结构示意图之三;图9是本专利技术实施例提供的电子设备的硬件结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参见图1,图1是本专利技术实施例提供的一种无人驾驶训练数据分类方法的流程图,如图1所示,方法包括以下步骤:步骤101、获得N个数据集,其中,所述N个数据集包括采集的数据样本中的数据,每个数据样本包括N种属性信息的数据,属于同一数据集的数据的属性信息相同,所述N为大于1的整数;步骤102、对所述N个数据集逐个进行聚类,得到所述N个数据集中最后进行聚类的数据集的M个数据类别,且不同数据类别中的数据所对应的数据样本用于不同预测模型的训练,其中,第K+1个数据集的聚类是基于第K个数据集的聚类结果进行聚类,所述K为小于N的正整数,M为大于1的整数。这里,电子设备通过获得N个数据集,并对N个数据集逐个进行聚类,从而得到M个数据类别,且电子设备可以使用该M个数据类别中各数据类别的数据所对应的数据样本分别训练预测模型,实现对采集的数据的分类,且使聚类后的每一数据类别的数据的场景更丰富,操作便捷且简单,不仅可以提升训练预测模型的效率,还可以提升训练得到的预测模型的准确性。需要说明的是,上述电子设备可以是任何能够实现上述无人驾驶训练数据分类方法的设备或者系统,例如:上述电子设备可以是一台服务器或者车载智能终端,等等,在此并不进行限定。本专利技术实施例中,在上述步骤101中,可以是电子设备接收操作人员的筛选操作,该筛选操作为:操作人员在数据样本的采集过程中,基于预设的N种属性信息对各数据样本中的数据进行筛选和标注的操作,且电子设备基于该筛选操作将每一数据样本中的数据进行分类,从而得到N个不同类别的数据集,即属于同一数据集的数据的属性信息相同。或者,上述获得N个数据集,也可以是电子设备根据预设的N种属性信息,将采集的所有数据样本中属于同一属性信息的数据分类至同一数据集,从而得到上述N个数据集,操作更便捷且省时。另外,上述数据样本可以是在模型训练过程中人工采集,或者也可以是在在线驾驶过程中车辆自动采集,且每一数据样本包括上述N中属性信息的数据,在此并不进行限定。需要说明的是,上述N种属性信息可以是预设的任何能够用于对数据样本中的数据进行分类的信息,而在自动驾驶中,用于预测模型训练的数据包括环境数据和车辆动力学数据,其中,环境数据包括由摄像头,激光雷达,毫米波雷达和全球定位系统(GlobalPositioningSystem,GPS)等收集得到的数据;车辆动力学数据包括由车辆的惯性测量单元(Inertialmeasurementunit,IMU)和车身物理装置等收集得到的数据,故上述N种属性信息可以包括环境数据和车辆动力学数据,或者,也可以是将环境数据和车辆动力学数据中的至少一种划分为两种或者两种以上的数据,从而形成的两种以上的属性信息,在此并不进行限定。可选的,上述N个数据集包括车辆动力学数据集和环境数据集,例如:将所有数据样本中每一数据样本的车辆动力学数据作为第一数据集中的数据,以及每一本文档来自技高网...

【技术保护点】
1.一种无人驾驶训练数据分类方法,其特征在于,包括:获得N个数据集,其中,所述N个数据集包括采集的数据样本中的数据,每个数据样本包括N种属性信息的数据,属于同一数据集的数据的属性信息相同,所述N为大于1的整数;对所述N个数据集逐个进行聚类,得到所述N个数据集中最后进行聚类的数据集的M个数据类别,且不同数据类别中的数据所对应的数据样本用于不同预测模型的训练,其中,第K+1个数据集的聚类是基于第K个数据集的聚类结果进行聚类,所述K为小于N的正整数,M为大于1的整数。

【技术特征摘要】
1.一种无人驾驶训练数据分类方法,其特征在于,包括:获得N个数据集,其中,所述N个数据集包括采集的数据样本中的数据,每个数据样本包括N种属性信息的数据,属于同一数据集的数据的属性信息相同,所述N为大于1的整数;对所述N个数据集逐个进行聚类,得到所述N个数据集中最后进行聚类的数据集的M个数据类别,且不同数据类别中的数据所对应的数据样本用于不同预测模型的训练,其中,第K+1个数据集的聚类是基于第K个数据集的聚类结果进行聚类,所述K为小于N的正整数,M为大于1的整数。2.根据权利要求1所述的方法,其特征在于,所述对所述N个数据集逐个进行聚类,包括:对第K个数据集进行聚类,得到多个第一数据类别;确定所述第K+1个数据集中的目标数据,其中,所述目标数据与目标第一数据类别的数据关联,所述目标第一数据类别为所述多个第一数据类别中的任一第一数据类别;对所述目标数据进行聚类。3.根据权利要求2所述的方法,其特征在于,所述目标数据为:与所述目标第一数据类别中的部分数据关联的数据。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述获得N个数据集之后,还包括:对所述N个数据集中的目标数据集进行数据预处理,生成所述目标数据集的多个场景片段;其中,所述多个场景片段中场景片段包括预设时间间隔内的数据;所述目标数据集中的多个场景片段为所述目标数据集的聚类数据。5.根据权利要求1至3中任一项所述的方法,其特征在于,所述N个数据集包括车辆动力学数据集和环境数据集。6.根据权利要求1至3中任一项所述的方法,其特征在于,所述对所述N个数据集逐个进行聚类之前,还包括:对所述N个数据集中至少一个数据集进行降维处理。7.一种无人驾驶训练数据分类装置,其特征在于,包括:数据集获取模块,用于获得N个数据集,其中,所述N个数据集包括采集的数据样本中的数据,每个数据样本包括N种属性信息的数据,属于同一数据集的数据的属性信息相同,所...

【专利技术属性】
技术研发人员:鞠策陶睿涓
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1