自动驾驶车辆数据质量评估方法、装置及存储介质制造方法及图纸

技术编号:21363192 阅读:34 留言:0更新日期:2019-06-15 09:42
本发明专利技术公开了自动驾驶车辆数据质量评估方法、装置及存储介质,其中方法包括:按照预先设定的数据组织格式,对自动驾驶车辆数据进行组织,得到数据记录;按照基于所述数据组织格式定义的数据质量分级标准,对每份数据记录进行分级。应用本发明专利技术所述方案,能够实现对于数据质量的有效评估等。

Data Quality Assessment Method, Device and Storage Medium for Automatic Driving Vehicles

The present invention discloses a method, device and storage medium for data quality evaluation of automatic driving vehicles. The method includes: organizing data of automatic driving vehicles according to pre-set data organization format and obtaining data records; grading each data record according to data quality classification standard defined based on the data organization format. By applying the scheme of the invention, the effective evaluation of data quality can be realized.

【技术实现步骤摘要】
自动驾驶车辆数据质量评估方法、装置及存储介质
本专利技术涉及计算机应用技术,特别涉及自动驾驶车辆数据质量评估方法、装置及存储介质。
技术介绍
数据是自动驾驶车辆研发的基础,每天都有大量数据通过落盘程序记录、并被传输、存储和使用。自动驾驶车辆数据量规模庞大,不同质量的数据有不同的价值,价值不同,数据可用范围也不同。相应的,就需要对数据质量进行评估,但目前还没有一种有效的评估方式。
技术实现思路
有鉴于此,本专利技术提供了自动驾驶车辆数据质量评估方法、装置及存储介质。具体技术方案如下:一种自动驾驶车辆数据质量评估方法,包括:按照预先设定的数据组织格式,对自动驾驶车辆数据进行组织,得到数据记录;按照基于所述数据组织格式定义的数据质量分级标准,对每份数据记录进行分级。根据本专利技术一优选实施例,所述数据组织格式包括:分别用一个任务标识task_id对每份数据记录进行标识,每份数据记录分别对应一次数据采集任务;每份数据记录中分别包括根目录和子目录;所述根目录中包含全局meta文件,用于记录所述数据记录的全局信息;所述子目录用于存储不同类型的数据文件。根据本专利技术一优选实施例,所述task_id由车辆标识以及时间构成;所述车辆标识为所述数据采集任务对应的自动驾驶车辆的车辆识别码;所述时间为所述数据采集任务的任务开始时间。根据本专利技术一优选实施例,所述全局信息包括:所述车辆识别码、所述任务开始时间、任务结束时间、数据采集任务类型。根据本专利技术一优选实施例,所述不同类型的数据文件包括:消息记录文件、日志文件、核心转储文件、版本文件和参数文件。根据本专利技术一优选实施例,所述对每份数据记录进行分级之前,进一步包括:获取定义的至少两个级别;获取针对每个级别,基于所述数据组织格式,分别定义的所述级别对应的数据质量分级标准。根据本专利技术一优选实施例,所述对每份数据记录进行分级包括:针对每份数据记录,分别根据不同级别的数据质量分级标准,通过决策树分类方法对所述数据记录进行分级。根据本专利技术一优选实施例,该方法进一步包括:根据分级结果确定出问题数据记录;根据所述问题数据记录进行自动驾驶车辆的故障诊断。一种自动驾驶车辆数据质量评估装置,包括:数据组织单元以及质量评估单元;所述数据组织单元,用于按照预先设定的数据组织格式,对自动驾驶车辆数据进行组织,得到数据记录;所述质量评估单元,用于按照基于所述数据组织格式定义的数据质量分级标准,对每份数据记录进行分级。根据本专利技术一优选实施例,所述数据组织格式包括:分别用一个任务标识task_id对每份数据记录进行标识,每份数据记录分别对应一次数据采集任务;每份数据记录中分别包括根目录和子目录;所述根目录中包含全局meta文件,用于记录所述数据记录的全局信息;所述子目录用于存储不同类型的数据文件。根据本专利技术一优选实施例,所述task_id由车辆标识以及时间构成;所述车辆标识为所述数据采集任务对应的自动驾驶车辆的车辆识别码;所述时间为所述数据采集任务的任务开始时间。根据本专利技术一优选实施例,所述全局信息包括:所述车辆识别码、所述任务开始时间、任务结束时间、数据采集任务类型。根据本专利技术一优选实施例,所述不同类型的数据文件包括:消息记录文件、日志文件、核心转储文件、版本文件和参数文件。根据本专利技术一优选实施例,所述质量评估单元进一步用于,在对每份数据记录进行分级之前,获取定义的至少两个级别,并获取针对每个级别,基于所述数据组织格式,分别定义的所述级别对应的数据质量分级标准。根据本专利技术一优选实施例,所述质量评估单元针对每份数据记录,分别根据不同级别的数据质量分级标准,通过决策树分类方法对所述数据记录进行分级。根据本专利技术一优选实施例,所述装置中进一步包括:故障诊断单元;所述故障诊断单元,用于根据分级结果确定出问题数据记录,根据所述问题数据记录进行自动驾驶车辆的故障诊断。一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。基于上述介绍可以看出,采用本专利技术所述方案,可按照预先设定的数据组织格式,对自动驾驶车辆数据进行组织,从而得到一份份的数据记录,并可按照基于该数据组织格式定义的数据质量分级标准,对每份数据记录进行分级,从而实现了对于数据质量的有效评估,进而有利于区分数据的价值,为数据管理提供了数据价值依据,并能够为用户更好的使用等。【附图说明】图1为本专利技术所述自动驾驶车辆数据质量评估方法实施例的流程图。图2为本专利技术所述数据记录的示意图。图3为本专利技术所述自动驾驶车辆数据质量评估装置实施例的组成结构示意图。图4示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框图。【具体实施方式】为了使本专利技术的技术方案更加清楚、明白,以下参照附图并举实施例,对本专利技术所述方案进行进一步说明。显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。另外,应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。图1为本专利技术所述自动驾驶车辆数据质量评估方法实施例的流程图。如图1所示,包括以下具体实现方式。在101中,按照预先设定的数据组织格式,对自动驾驶车辆数据进行组织,得到数据记录。在102中,按照基于所述数据组织格式定义的数据质量分级标准,对每份数据记录进行分级。自动驾驶车辆数据类型复杂,需要进行合理的组织。本实施例中提出,可按照预先设定的数据组织格式,对自动驾驶车辆数据进行组织,从而得到一份份的数据记录。可分别用一个任务标识(task_id)来对每份数据记录进行标识,每份数据记录可分别对应一次数据采集任务。每份数据记录中可分别包括根目录和子目录。其中,根目录中可包含全局meta文件,用于记录数据记录的全局信息,子目录可用于存储不同类型的数据文件。task_id可由车辆标识以及时间组成。车辆标识可为数据采集任务对应的自动驾驶车辆的车辆识别码(VIN,VehicleIdentificationNumber),可通过控制器局域网络总线(CANBus,ControllerAreaNetworkBus)从整车控制器(VCU,VehicleControlUnit)中获取。时间可为数据采集任务的任务开始时间(任务启动时间)。task_id的格式可为vehicleID_timestamp。其中,vehileID为车辆识别码,timestamp为任务开始时间,格式可为%Y%m%d%H%M%S,Y表示年,m表示月,d表示日,H表示小时,M表示分钟,S表示秒。比如,一个task_id为:LSVFA49J232037048_20171012152312。根目录中包括一个全局meta文件,用于记录数据记录的全局信息,通常包括车辆识别码、任务开始时间、任务结束时间以及数据采集任务类型等,如果需要,还本文档来自技高网...

【技术保护点】
1.一种自动驾驶车辆数据质量评估方法,其特征在于,包括:按照预先设定的数据组织格式,对自动驾驶车辆数据进行组织,得到数据记录;按照基于所述数据组织格式定义的数据质量分级标准,对每份数据记录进行分级。

【技术特征摘要】
1.一种自动驾驶车辆数据质量评估方法,其特征在于,包括:按照预先设定的数据组织格式,对自动驾驶车辆数据进行组织,得到数据记录;按照基于所述数据组织格式定义的数据质量分级标准,对每份数据记录进行分级。2.根据权利要求1所述的方法,其特征在于,所述数据组织格式包括:分别用一个任务标识task_id对每份数据记录进行标识,每份数据记录分别对应一次数据采集任务;每份数据记录中分别包括根目录和子目录;所述根目录中包含全局meta文件,用于记录所述数据记录的全局信息;所述子目录用于存储不同类型的数据文件。3.根据权利要求2所述的方法,其特征在于,所述task_id由车辆标识以及时间构成;所述车辆标识为所述数据采集任务对应的自动驾驶车辆的车辆识别码;所述时间为所述数据采集任务的任务开始时间。4.根据权利要求3所述的方法,其特征在于,所述全局信息包括:所述车辆识别码、所述任务开始时间、任务结束时间、数据采集任务类型。5.根据权利要求2所述的方法,其特征在于,所述不同类型的数据文件包括:消息记录文件、日志文件、核心转储文件、版本文件和参数文件。6.根据权利要求1所述的方法,其特征在于,所述对每份数据记录进行分级之前,进一步包括:获取定义的至少两个级别;获取针对每个级别,基于所述数据组织格式,分别定义的所述级别对应的数据质量分级标准。7.根据权利要求6所述的方法,其特征在于,所述对每份数据记录进行分级包括:针对每份数据记录,分别根据不同级别的数据质量分级标准,通过决策树分类方法对所述数据记录进行分级。8.根据权利要求1所述的方法,其特征在于,该方法进一步包括:根据分级结果确定出问题数据记录;根据所述问题数据记录进行自动驾驶车辆的故障诊断。9.一种自动驾驶车辆数据质量评估装置,其特征在于,包括:数据组织单元以及质量评估单元;所述数据组织单元,用于按照预先设定的数据组织格式,对自动驾驶车辆数据进行组织,得到数据记录;所述质量评估单元,用于按照基于所述数据...

【专利技术属性】
技术研发人员:于宁杨凡王成法
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1