基于多主体互学习的自动驾驶模型训练方法及系统技术方案

技术编号:28038671 阅读:10 留言:0更新日期:2021-04-09 23:21
本发明专利技术公开了一种基于多主体互学习的自动驾驶模型训练方法及系统,方法包括:通过获取目标车辆及其周边车辆的感知结果、时间、空间基准数据;将周边车辆的感知结果转化到目标车辆的时间、空间基准上;通过目标车辆及其周边车辆的感知结果,判断目标车辆与其周边车辆是否存在矛盾;当存在矛盾时,根据矛盾数据进行模型再训练,当训练结果满足预设条件时,更新目标车辆的自动驾驶模型。本发明专利技术提出了直接在常规驾驶状态下挖掘感知结果的矛盾数据,相比失效处理、接管处理触发的数据回传逻辑,本发明专利技术提供的方法不再局限于极限情况和临界情况及目标车辆本身的感知数据,提高了再训练数据集的构建效率及覆盖面。

【技术实现步骤摘要】
基于多主体互学习的自动驾驶模型训练方法及系统
本专利技术涉及自动驾驶
,具体涉及一种基于多主体互学习的自动驾驶模型训练方法及系统。
技术介绍
当前,自动驾驶系统与传统信息系统的本质区别是信息物理系统与信息系统之间的区别,作为在实际道路交通环境中运行的智能机器人系统,自动驾驶系统缺少传统信息系统所具有的明确边界、传统机器人系统运行的场景边界。在自动驾驶架构中,作为车辆路径规划的依据,车辆的感知和定位是至关重要的两个环节,而在高级别自动驾驶中广泛采用的基于高精地图的高精度定位方案很大程度上依赖于对地图定位元素的视觉感知能力,因此提高视觉感知水平是提升自动驾驶能力关键。基于深度学习的计算机视觉技术是主流视觉感知技术,其感知能力的高低主要取决于所采用的网络模型和训练的质量,深度学习模型训练质量依赖于所采用的数据集和标注的质量。当前所采用的模型训练如图1所示,分为交付前和交付后两个阶段。原始感知数据量巨大,量产车不具备专业采集车的车载高性能计算、大容量存储和车云高速通信能力,不可能回传所有数据。何时触发数据回传,回传哪些数据,成为交付后训练的关键问题。目前常见的以系统失效或用户接管触发数据回传的方式存在矛盾事件发现效率低下、覆盖面小的问题。
技术实现思路
因此,本专利技术提供的一种基于多主体互学习的自动驾驶模型训练方法及系统,克服了现有系统失效或用户接管触发数据回传方式存在矛盾事件发现效率低下、覆盖面小的缺陷。为达到上述目的,本专利技术提供如下技术方案:第一方面,本专利技术实施例提供一种基于多主体互学习的自动驾驶模型训练方法,包括:获取目标车辆及其周边车辆的感知数据及时间、空间基准数据;根据目标车辆及其周边车辆的感知数据,获取目标车辆及其周边车辆的感知结果;通过目标车辆及其周边车辆的感知结果、时间、空间基准数据,判断目标车辆与其周边车辆是否存在矛盾,所述矛盾包括:感知结果的不足及潜在的感知结果的不足;当存在矛盾时,根据矛盾数据进行模型再训练,当训练结果满足预设条件时,更新目标车辆的自动驾驶模型。在一实施例中,所述获取目标车辆及其周边车辆的感知数据,包括:分别获取目标车辆及其周边车辆自身的感知数据、独立于目标车辆及其周边车辆自身的感知设备获取的数据。在一实施例中,获取目标车辆及其周边车辆的感知数据及时间、空间基准数据的过程,包括:目标车辆及其周边车辆通过传感器及独立于目标车辆及其周边车辆自身的感知设备获取各自的感知数据;将统一的时间基准数据下发至目标车辆及其周边车辆;将统一的空间基准数据下发至目标车辆及其周边车辆。在一实施例中,空间基准数据的获取包括:载波相位差分技术和局部地图定位技术;时间基准数据的获取包括:网络时间服务技术和卫星授时技术。在一实施例中,感知数据包括:视觉感知数据、超声波感知数据、毫米波感知数据及红外感知数据;感知结果数据包括:感知对象的空间位置、姿态、时间戳,对象属性。在一实施例中,感知结果采用将目标车辆及其周边车辆的感知数据,转换成统一的语义和语法、统一的时空基准、统一的标识符,并采用统一的交互协议。在一实施例中,统一的语义和语法中,语义包括:高级语义、中级语义、初级语义;其中,初级语义包括:识别的对象和感知元数据;中级语义包括:事件发生时间、地点和对象分类;高级语义包括:静态对象的描述,交通参与者的状态认知、行为预测结果;统一的标识符包括:前缀集和随机ID,其中,前缀集包括:空间、时间、类别、感知主体ID;统一的交互协议包括:帧头和有效数据,其中,帧头部分的字段包括数据来源、分发类型、语义类别、数据格式、地域标识、时间戳、有效期、置信度和协议版本。在一实施例中,通过目标车辆及其周边车辆的感知结果、时间、空间基准数据,判断目标车辆与其周边车辆是否存在矛盾的过程,包括:目标车辆接收周边车辆的感知结果,根据帧头进行初筛,根据各感知对象的时间、空间基准数据筛选出和目标车辆感知有交集的部分,利用占据栅格进行多源感知结果的融合和比对,识别出未被当前自动驾驶模型识别出或识别错误的对象,判断目标车辆与其周边车辆是否存在矛盾。在一实施例中,当存在矛盾时包括:利用占据栅格进行多源感知结果的融合和比对,识别出未被目标车辆当前自动驾驶模型识别出或识别错误的对象。第二方面,本专利技术实施例提供一种基于多主体互学习的自动驾驶模型训练系统,包括:数据获取模块,用于获取目标车辆及其周边车辆的感知数据及时间、空间基准数据;感知结果获取模块,用于根据目标车辆及其周边车辆的感知数据,获取目标车辆及其周边车辆的感知结果;矛盾判断模块,通过目标车辆及其周边车辆的感知结果、时间、空间基准数据,判断目标车辆与其周边车辆是否存在矛盾,所述矛盾包括:感知结果的不足及潜在的感知结果的不足;再训练自动驾驶模型更新模块,用于当存在矛盾时,根据矛盾数据进行模型再训练,当训练结果满足预设条件时,更新目标车辆的自动驾驶模型。第三方面,本专利技术实施例提供一种终端,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行本专利技术实施例第一方面所述的基于多主体互学习的自动驾驶模型训练方法。第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行本专利技术实施例第一方面所述的基于多主体互学习的自动驾驶模型训练方法。本专利技术技术方案,具有如下优点:本专利技术提供的基于多主体互学习的自动驾驶模型训练方法及系统,通过获取目标车辆及其周边车辆的感知结果、时间、空间基准数据;将周边车辆的感知结果转化到目标车辆的时间、空间基准上;通过目标车辆及其周边车辆的感知结果,判断目标车辆与其周边车辆是否存在矛盾;当存在矛盾时,根据矛盾数据进行模型再训练,当训练结果满足预设条件时,更新目标车辆的自动驾驶模型。本专利技术提出了直接在常规驾驶状态下挖掘感知结果的矛盾数据,相比失效处理、接管处理触发的数据回传逻辑,本专利技术提供的方法不再局限于极限情况和临界情况及目标车辆本身的感知数据,提高了再训练数据集的构建效率及覆盖面。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为现有技术采用的模型训练流程图;图2为本专利技术实施例提供的一种基于多主体互学习的自动驾驶模型训练方法的一个具体示例的流程图;图3为本专利技术实施例提供的交互协议的示意图;图4为本专利技术实施例提供的一种基于多主体互学习的自动驾驶模型训练方法的另一具体示例的流程图;图5为本专利技术实施例本文档来自技高网...

【技术保护点】
1.一种基于多主体互学习的自动驾驶模型训练方法,其特征在于,包括:/n获取目标车辆及其周边车辆的感知数据及时间、空间基准数据;/n根据目标车辆及其周边车辆的感知数据,获取目标车辆及其周边车辆的感知结果;/n通过目标车辆及其周边车辆的感知结果、时间、空间基准数据,判断目标车辆与其周边车辆是否存在矛盾,所述矛盾包括:感知结果的不足及潜在的感知结果的不足;/n当存在矛盾时,根据矛盾数据进行模型再训练,当训练结果满足预设条件时,更新目标车辆的自动驾驶模型。/n

【技术特征摘要】
1.一种基于多主体互学习的自动驾驶模型训练方法,其特征在于,包括:
获取目标车辆及其周边车辆的感知数据及时间、空间基准数据;
根据目标车辆及其周边车辆的感知数据,获取目标车辆及其周边车辆的感知结果;
通过目标车辆及其周边车辆的感知结果、时间、空间基准数据,判断目标车辆与其周边车辆是否存在矛盾,所述矛盾包括:感知结果的不足及潜在的感知结果的不足;
当存在矛盾时,根据矛盾数据进行模型再训练,当训练结果满足预设条件时,更新目标车辆的自动驾驶模型。


2.根据权利要求1所述的基于多主体互学习的自动驾驶模型训练方法,其特征在于,所述获取目标车辆及其周边车辆的感知数据,包括:分别获取目标车辆及其周边车辆自身的感知数据、独立于目标车辆及其周边车辆自身的感知设备获取的数据。


3.根据权利要求1所述的基于多主体互学习的自动驾驶模型训练方法,其特征在于,获取目标车辆及其周边车辆的感知数据及时间、空间基准数据的过程,包括:
目标车辆及其周边车辆通过传感器及独立于目标车辆及其周边车辆自身的感知设备获取各自的感知数据;
将统一的时间基准数据下发至目标车辆及其周边车辆;
将统一的空间基准数据下发至目标车辆及其周边车辆。


4.根据权利要求3所述的基于多主体互学习的自动驾驶模型训练方法,其特征在于,空间基准数据的获取包括:载波相位差分技术和局部地图定位技术;时间基准数据的获取包括:网络时间服务技术和卫星授时技术。


5.根据权利要求3所述的基于多主体互学习的自动驾驶模型训练方法,其特征在于,感知数据包括:视觉感知数据、超声波感知数据、毫米波感知数据及红外感知数据;感知结果数据包括:感知对象的空间位置、姿态、时间戳,对象属性。


6.根据权利要求1所述的基于多主体互学习的自动驾驶模型训练方法,其特征在于,感知结果采用将目标车辆及其周边车辆的感知数据,转换成统一的语义和语法、统一的时空基准、统一的标识符,并采用统一的交互协议。


7.根据权利要求6所述的基于多主体互学习的自动驾驶模型训练方法,其特征在于,统一的语义和语法中,语义包括:高级语义、中级语义、初级语义;其中,初级语义包括:识别的对象和感知元数据;中级语义包括:事件发生时间、地点和对象分类;高级语义包括:静态对象的描述,...

【专利技术属性】
技术研发人员:潘晏涛韩晓健冉雪峰包哈达
申请(专利权)人:国汽智控北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1