【技术实现步骤摘要】
基于场景切分和局部路径规划的驾驶控制策略训练方法
本专利技术涉及一种基于场景切分和局部路径规划的驾驶控制策略训练方法,属于自动驾驶
技术介绍
自动驾驶需要保证在尽可能多的场景下都能顺利完成任务,其中的任务即从指定的起点安全、顺利地达到终点。通常在每个任务中,都有多种道路场景,如直行、左、右转弯、变道等等。基于规则的驾驶控制策略需要在所有场景下合理定义控制规则,且无法处理规则未覆盖的场景。另一方面,可以利用真实的驾驶员驾驶数据和监督学习方法,得到驾驶控制策略,该途径则需要人工在多种场景下采集海量的样本进行训练,对于未见过的场景,同样也存在风险。强化学习作为一种有效的策略学习方法,通过在环境中大量试错,从试错的交互轨迹经验中学得控制策略,因此能探索更多未见场景并获得对应的最优控制策略。为了规避真实场景下不可忽视的试错代价,通常在自动驾驶模拟器中用强化学习来训练驾驶策略,然后将策略模型迁移部署到实车进行控制的方式,这可以获得更加智能的驾驶策略。使用强化学习来训练自动驾驶控制策略时,通常以摄像头、雷达等传感器的观测 ...
【技术保护点】
1.一种基于场景切分和局部路径规划的驾驶控制策略训练方法,其特征在于,包括如下步骤:/n步骤1,结合地图信息,利用3D引擎生成自动驾驶仿真环境;/n步骤2,根据地图上可行道路及GPS信息,将区域内所有道路离散化为关键点序列,每个点用GPS坐标表示;/n步骤3,将每个点空间位置上前后相邻的点连接成的路径曲线作为局部路段,并使用机器学习中方法对局部路段划分到不同集合,每个路段仅属于某一个集合;/n步骤4,在每个路段结合局部GPS信息,使用搜索算法得到局部行驶路径的关键点参考点列,根据当前车况,计算预瞄距离D,并选择预瞄点,使用预瞄点作为驾驶指示信息;/n步骤5,随机采样路段场景 ...
【技术特征摘要】
1.一种基于场景切分和局部路径规划的驾驶控制策略训练方法,其特征在于,包括如下步骤:
步骤1,结合地图信息,利用3D引擎生成自动驾驶仿真环境;
步骤2,根据地图上可行道路及GPS信息,将区域内所有道路离散化为关键点序列,每个点用GPS坐标表示;
步骤3,将每个点空间位置上前后相邻的点连接成的路径曲线作为局部路段,并使用机器学习中方法对局部路段划分到不同集合,每个路段仅属于某一个集合;
步骤4,在每个路段结合局部GPS信息,使用搜索算法得到局部行驶路径的关键点参考点列,根据当前车况,计算预瞄距离D,并选择预瞄点,使用预瞄点作为驾驶指示信息;
步骤5,随机采样路段场景,结合预瞄点形成的驾驶指示信息,结合当前传感器的观测,进行驾驶策略搜索。
2.如权利要求1所述的基于场景切分和局部路径规划的驾驶控制策略训练方法,其特征在于,步骤3中使用聚类算法对局部路段进行划分,对于关键点点集中每一个点Ni(i=1,2,...),根据前后相邻点构成的外接圆计算该点的曲率ci,对每个点,选择其前后各几个点,按顺序依次将每个点的曲率填充为一个向量特征,构成数据集D={x1,x2,...,xn}。
3.如权利要求2所述的基于场景切分和局部路径规划的驾驶控制策略训练方法,其特征在于,使用聚类算法k-means对局部路段进行划分:
首先,从数据集D中随机选取k个样本作为初始的k个聚类中心;
其次,为其余每个样本计算到当前k个聚类中心的距离,并将当前样本划分到到聚类中心距离最小的类;
再次,重新计算每个聚类Ci的均值向量,作为新的聚类中心,然后,重复执行以上两步,直到聚类中心不再发生变化;
最后,输出划分完后的聚类作为道路场景切分结果。
4.如权利要求2所述的基于场景切分和局部路径规划的驾驶控制策略训练方法,其特征在于,使用谱聚类算法对局部路段进行划分
首先,根据样本之间的相似度,构建邻接矩阵W;
其次,计算拉普拉斯矩阵,L=diag(deg(W))-W,其中diag(deg(W))是将W每行元素求和,构造出的度矩阵,是一个对角矩阵,;
然后,对上一步计算出的拉普拉斯矩阵进行特征值分解,取第2,3,…,m+1个特征值(从小到大排列,第一个为0)对应的特征向量,并列成矩阵U;
再次,U作为样本特征为m维数据集,输入k-means算法,得到k个聚类;
最后,输出划分完后的聚类作为道路场景切分结果。
5.如权利要求1所述的...
【专利技术属性】
技术研发人员:俞扬,秦熔均,余峰,刘亚文,范彧,
申请(专利权)人:南栖仙策南京科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。