车辆自动驾驶的速度规划方法、装置及计算装置制造方法及图纸

技术编号:16237055 阅读:30 留言:0更新日期:2017-09-19 16:40
用于车辆自动驾驶的速度规划方法、装置及计算装置。方法包括:采用训练样本集进行机器学习,获得机器学习模型;对于输入空间进行分区,以及基于所述获得的机器学习模型,得到与确定分区对应的决策结果,形成各个分区对应于相应决策结果的分区决策表;实时获得行驶中车辆的各维特征分量作为输入特征量,确定该输入特征量所属于的输入分区,基于所确定的分区,查询分区决策表来获得相应的决策结果。很好地解决了不能对机器学习训练出的模型做局部调整的问题,易于修改某个分区的决策,而完全不影响其它分区的决策结果;分区决策表的直观特性可以很好的帮助发现和解决机器学习过程中存在的问题;分区决策表可以加速决策过程。

Speed planning method, device and calculation device for vehicle automatic driving

Speed planning method, device and computing device for vehicle automatic driving. The method includes: using the training samples for machine learning, machine learning model; partition the input space, and based on the machine learning model, get the corresponding decision results and determine the partition, the partition table of each partition corresponds to the corresponding decision making decision; real-time access to each feature component of the vehicles as the input features, input partitions belonging to the input feature quantity, as determined by the partition based on query partition decision table to obtain the corresponding decision results. Is a good solution for machine learning not trained model partial adjustment problems, easy to modify a partition of the decision, but does not affect the other partition decision results; partition decision table intuitive properties can be very good to help find and solve the existing problems in the process of machine learning; decision table partition can be accelerated the decision making process.

【技术实现步骤摘要】
【国外来华专利技术】车辆自动驾驶的速度规划方法、装置及计算装置
本专利技术涉及车辆控制领域,特别是涉及一种用于车辆自动驾驶的速度规划方法、装置及计算装置。
技术介绍
随着车辆技术的发展,车辆自动驾驶成为热点研究领域。速度规划和控制是自动驾驶中的一个重要研究内容,其基本目标是根据检测到的状态(如当前车速、前车的车速、与前车的距离)规划出一系列后续时间点车的预期车速,并计算出车的最终控制参数(如油门和刹车)对车进行实际的控制操作。速度规划在保证乘客的基本舒适和安全的同时,需要保证在其它车辆有非预期的行为(如突然刹车)时能保证乘客绝对的安全。为了处理各种可能出现的情况,需要设计较复杂的速度规划和控制模型。在人工设计和实现中,很容易漏掉某些少见的情况和因素。同时,从驾驶员驾驶的汽车上可以采集很丰富的成熟的驾驶数据。由于机器学习方法可以很方便的从数据中学习模型,机器学习方法越来越多地应用到速度规划和控制。另外,在现实世界中,每个驾驶员都有不同的驾驶习惯和对安全舒适程度的界定,因此如果使用同一种规划和控制方法很难满足各种不同的需求,而机器学习方法可以很好的适配这种个性化驾驶习惯需求。
技术实现思路
本专利技术的专利技术人通过长期研究,认识到应用机器学习对车辆进行速度规划存在一些问题。首先,通过机器学习方法学习到的模型的效果和训练数据直接相关。由于驾驶员通常都是在一个很舒适的范围内驾驶,收集到的训练数据很难覆盖到所有可能出现的场景(如车速极快而据前车距离很短等极端场景),虽然泛化等技术可以一定程度上解决这个问题,但不能完全解决这个问题。另外,收集到的驾驶员的行为不一定完全满足舒适安全的需求,如有些驾驶员并不能保证和前车的距离,因此当前车突然刹车时,驾驶车辆很难保证不碰上前车的情况下完全刹车。显然,用这种数据训练出来的模型同样也不能处理这种情况。机器学习存在的另一个问题是很难对其训练出来的模型做局部微调。在应用于自动驾驶的速度规划和控制中,通常需要针对某种特殊情况对模型进行局部调整。而对机器学习得到的模型,对学习到的每个参数的调整,都可能带来全局的不易控制的影响。通过添加更多的训练用例也可以修正模型,但是这种方法周期比较长,并且最后训练出来的模型也不能完全预知。本专利技术的目的在于克服现有技术中的缺点与不足,提出一种全新的用于车辆自动驾驶的速度规划方法、装置及计算装置。根据本专利技术的一个方面,提供一种用于车辆自动驾驶的速度规划方法,具体包括:首先为机器学习步骤,采用训练样本集进行机器学习,获得机器学习模型,每个训练样本由形成输入空间的多维特征分量和形成输出空间的决策结果来描述,所述多维特征分量的每维是用于描述车辆特定时刻状态的、与速度规划有关的变量,所述决策结果指示下一时刻的预期速度和/或与速度控制相关的控制参数数值;其次为分区决策表取得步骤,对于输入空间进行分区,以及基于所述获得的机器学习模型,得到与确定分区对应的决策结果,形成各个分区对应于相应决策结果的分区决策表;再次为实时决策步骤,实时获得行驶中车辆的各维特征分量作为输入特征量,确定该输入特征量所属于的输入分区,基于所确定的分区,查询分区决策表来获得相应的决策结果。进一步地,速度规划方法还可以包括实时控制步骤,基于所获得的决策结果,对车辆发出控制命令,从而控制车辆的速度。进一步地,在实时控制中,在发现确定分区的决策结果不符合预期时,可以对该分区的分区决策结果进行调整。进一步地,对该分区的分区决策结果进行调整,可以依经验对该分区的分区决策结果进行调整,也可以通过机器学习方法对该分区进行学习,调整该分区的分区决策结果。进一步地,各维特征分量可以包括当前车速、和前车的距离、前车相对速度和最大车速。进一步地,在机器学习步骤之前,需要对特征空间进行离散化编码。进一步地,根据本专利技术实施例的速度规划方法,离散化编码方法优选为TilingCoding,其中用只有一个Tiling的TilingCoding对每个特征分量进行编码,并且将每个特征分量所处的维度划分成优选的7-13个区间,从而对所述输入空间进行分区。进一步地,在分区决策表取得步骤中,首先需要计算采用离散化编码方法得到的离散化编码结果的空间大小,当所述空间大于确定阈值时,采用动态存储方法存储分区决策表,仅遍历训练空间的输入,存储相应决策模型的输出结果,同时除了分区决策表,还存储训练出的决策模型备用;当所述空间小于所述确定阈值时,采用静态存储方法存储分区决策表,遍历所有编码空间,存储决策模型的输出结果。进一步地,在实时决策步骤中,首先采用所述离散化编码方法对所述输入特征量进行离散化编码,然后将获得的离散化编码结果作为分区决策表的索引,当分区决策表为采用静态存储方法存储时,直接获取分区决策表中已存储的决策结果;进一步地,在实时决策步骤中,首先采用所述离散化编码方法对所述输入特征量进行离散化编码,然后将获得的离散化编码结果作为分区决策表的索引,当分区决策表为采用动态存储方法存储时,如果分区决策表内存储有该离散化编码结果的决策结果,则直接从分区决策表中获取决策结果;反之如果分区决策表内没有存储该离散化编码结果的决策结果,则调用所述存储的决策模型来得到决策结果,并将得到的决策结果加入到分区决策表。进一步地,机器学习的方法可以采用监督式学习方法或非监督式学习方法,也可以采用增强式学习方法。进一步地,对特征空间进行离散化编码时,只要两个输入最终的离散编码相同,即认为这两个输入属于同一个分区。进一步地,离散化编码方法可以包括各类CoarseCoding方法,如TileCoding。进一步地,在实时控制中,在对该分区的分区决策结果进行调整后需要确定被调整过分区决策结果的分区的数目,当所述分区的数目超过预定阈值时,应当重新执行所述机器学习步骤和分区决策表取得步骤。根据本专利技术的另一个方面,提供一种用于车辆自动驾驶的速度规划装置,该装置包括机器学习单元、分区决策表取得单元、实时决策单元。可选地,速度规划装置还可以包括实时控制单元。其中,机器学习单元配置为采用训练样本集进行机器学习,获得机器学习模型,每个训练样本由形成输入空间的多维特征分量和形成输出空间的决策结果来描述,所述多维特征分量的每维是用于描述车辆特定时刻状态的、与速度规划有关的变量,所述决策结果指示下一时刻的预期速度和/或与速度控制相关的控制参数数值。其中,分区决策表取得单元配置为对于输入空间进行分区,以及基于所述获得的机器学习模型,得到与确定分区对应的决策结果,形成各个分区对应于相应决策结果的分区决策表。其中,实时决策单元配置为实时获得行驶中车辆的各维特征分量作为输入特征量,确定该输入特征量所属于的输入分区,基于所确定的分区,查询分区决策表来获得相应的决策结果。其中,实时控制单元配置为基于所获得的决策结果,对车辆发出控制命令,从而控制车辆的速度。进一步地,其中的实时控制单元还配置为在实时控制中,在发现确定分区的决策结果不符合预期时,对该分区的分区决策结果进行调整。进一步地,其中的分区决策表取得单元还配置为对该分区的分区决策内容进行调整,可以依经验对该分区的分区决策内容进行调整,也可以通过机器学习方法对该分区进行学习,调整该分区的分区决策结果。进一步地,其中实时决策单元还配置为各维特征分量包括当前车速、和前车的本文档来自技高网...
车辆自动驾驶的速度规划方法、装置及计算装置

【技术保护点】
一种用于车辆自动驾驶的速度规划方法,包括:机器学习步骤,采用训练样本集进行机器学习,获得机器学习模型,每个训练样本由形成输入空间的多维特征分量和形成输出空间的决策结果来描述,所述多维特征分量的每维是用于描述车辆特定时刻状态的、与速度规划有关的变量,所述决策结果指示下一时刻的预期速度和/或与速度控制相关的控制参数数值;分区决策表取得步骤,对于输入空间进行分区,以及基于所述获得的机器学习模型,得到与确定分区对应的决策结果,形成各个分区对应于相应决策结果的分区决策表;实时决策步骤,实时获得行驶中车辆的各维特征分量作为输入特征量,确定该输入特征量所属于的输入分区,基于所确定的分区,查询分区决策表来获得相应的决策结果。

【技术特征摘要】
【国外来华专利技术】1.一种用于车辆自动驾驶的速度规划方法,包括:机器学习步骤,采用训练样本集进行机器学习,获得机器学习模型,每个训练样本由形成输入空间的多维特征分量和形成输出空间的决策结果来描述,所述多维特征分量的每维是用于描述车辆特定时刻状态的、与速度规划有关的变量,所述决策结果指示下一时刻的预期速度和/或与速度控制相关的控制参数数值;分区决策表取得步骤,对于输入空间进行分区,以及基于所述获得的机器学习模型,得到与确定分区对应的决策结果,形成各个分区对应于相应决策结果的分区决策表;实时决策步骤,实时获得行驶中车辆的各维特征分量作为输入特征量,确定该输入特征量所属于的输入分区,基于所确定的分区,查询分区决策表来获得相应的决策结果。2.根据权利要求1的速度规划方法,还包括:实时控制步骤,基于所获得的决策结果,对车辆发出控制命令,从而控制车辆的速度。3.根据权利要求1的方法,还包括:在发现确定分区的决策结果不符合预期时,对该分区的分区决策结果进行调整。4.根据权利要求3的方法,所述对该分区的分区决策结果进行调整包括:依经验对该分区的分区决策结果进行调整;和/或通过机器学习方法对该分区进行学习,调整该分区的分区决策结果。5.根据权利要求1的方法,所述各维特征分量包括:当前车速、和前车的距离、前车相对速度和最大车速。6.根据权利要求1的方法,还包括,在机器学习步骤之前,对特征空间进行离散化编码。7.根据权利要求6所述的方法,其特征在于,所述分区决策表取得步骤包括:计算采用离散化编码方法得到的离散化编码结果的空间大小:当所述空间大于确定阈值时,采用动态存储方法存储分区决策表,仅遍历训练空间的输入,存储相应决策模型的输出结果,同时除了分区决策表,还存储训练出的决策模型备用;以及当所述空间小于所述确定阈值时,采用静态存储方法存储分区决策表,遍历所有编码空间,存储决策模型的输出结果。8.根据权利要求7所述的方法,其特征在于,所述实时决策步骤包括:采用所述离散化编码方法对所述输入特征量进行离散化编码;将获得的离散化编码结果作为分区决策表的索引,当分区决策表为采用静态存储方法存储时,直接获取分区决策表中已存储的决策结果;将获得的离散化编码结果作为分区决策表的索引,当分区决策表为采用动态存储方法存储时,如果分区决策表内存储有该离散化编码结果的决策结果,则直接从分区决策表中获取决策结果;反之如果分区决策表内没有存储该离散化编码结果的决策结果,则调用所述存储的决策模型来得到决策结果,并将得到的决策结果加入到分区决策表。9.根据权利要求6所述的方法,其特征在于,只要两个输入最终的离散编码相同,即认为这两个输入属于同一个分区。10.根据权利要求6所述的方法,其特征在于,所述离散化编码方法为粗编码方法中的一种。11.根据权利要求2所述的方法,还包括:确定被调整过分区决策结果的分区的数目,当所述分区的数目超过预定阈值时,重新执行所述机器学习步骤和分区决策表取得步骤。12.一种用于车辆自动驾驶的速度规划装置,包括:机器学习单元,配置为采用训练样本集进行机器学习,获得机器学习模型,每个训练样本由形成输入空间的多维特征分量和形成输出空间的决策结果来描述,所述多维特征分量的每维是用于描述车辆特定时刻状态的、与速度规划有关的变量,所述决策结果指示下一时刻的预期速度和/或与速度控制相关的控制参数数值;分区决策表取得单元,配置为对于输入空间进行分区,以及基于所述获得的机器学习模型,得到与确定分区对应的决策结果,形成各个分区对应于相应决策结果的分区决策表;实时决策单元,配置为实时获得行驶中车辆...

【专利技术属性】
技术研发人员:周小成姜岩彭进展周鑫张丹罗赛
申请(专利权)人:驭势科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1