变道策略确定方法、装置及存储介质制造方法及图纸

技术编号：25587658 阅读：22 留言：0更新日期：2020-09-11 23:46

本申请涉及一种变道策略确定方法、装置及存储介质，属于计算机技术领域，该方法包括：获取当前时刻采集到的环境信息；基于MCTS算法以当前时刻的环境信息作为根节点生成多条模拟路径，每条模拟路径包括m层子节点和不同层的节点间的传输路径，每条传输路径用于指示相邻两层节点之间的变道策略；获取多条模拟路径中每个子节点的累计质量得分和访问次数；基于累计质量得分和访问次数计算每个子节点的UCB值；将UCB值最大的目标子节点与目标子节点的父节点之间的变道策略确定为该环境信息的变道策略；可以解决仅根据当前时刻的道路环境确定变道策略时，确定出的变道策略可能不够准确的问题；可以提高确定变道策略的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
变道策略确定方法、装置及存储介质
本申请涉及一种变道策略确定方法、装置及存储介质，属于计算机

技术介绍
变道策略是指自动驾驶车辆通过感知周边交通状况，结合车辆当前位置、路面情况、及导航规划选择最合适的车道行驶的策略，是自动驾驶车辆的行为策略之一。现有技术中，变道策略的确定方式包括：获取当前时刻的道路环境；根据道路环境与变道策略之间的对应关系确定当前时刻的道路环境对应的变道策略，比如：当前时刻的道路环境为左侧行驶车辆较多，变道策略为向右变更车道。然而，通过在道路车道数量或者道路连接形态发生变化的复杂场景下，仅根据当前时刻的道路环境确定变道策略，可能会导致一些非必要的变道，从而降低给出的变道策略的准确度。
技术实现思路
本申请提供了一种变道策略确定方法、装置及存储介质，可以解决仅根据当前时刻的道路环境确定变道策略时，确定出的变道策略可能不够准确的问题。本申请提供如下技术方案：第一方面，提供了一种变道策略确定方法，所述方法包括：获取当前时刻采集到的环境信息；基于蒙特卡罗树搜索MCTS算法以所述环境信息作为根节点生成多条模拟路径，每条模拟路径包括m层子节点和不同层的节点间的传输路径，每条传输路径用于指示相邻两层节点之间的变道策略；每个子节点用于指示从所述子节点的父节点对应的环境信息执行变道策略后得到的变道后的环境信息，所述m为正整数；获取所述多条模拟路径中每个子节点的累计质量得分和访问次数；基于所述累计质量得分和访问次数计算每个子节...

【技术保护点】
1.一种变道策略确定方法，其特征在于，所述方法包括：/n获取当前时刻采集到的环境信息；/n基于蒙特卡罗树搜索MCTS算法以所述环境信息作为根节点生成多条模拟路径，每条模拟路径包括m层子节点和不同层的节点间的传输路径，每条传输路径用于指示相邻两层节点之间的变道策略；每个子节点用于指示从所述子节点的父节点对应的环境信息执行变道策略后得到的变道后的环境信息，所述m为正整数；/n获取所述多条模拟路径中每个子节点的累计质量得分和访问次数；/n基于所述累计质量得分和访问次数计算每个子节点的置信上限UCB值；/n将UCB值最大的目标子节点与所述目标子节点的父节点之间的变道策略确定为所述环境信息的变道策略。/n

【技术特征摘要】
1.一种变道策略确定方法，其特征在于，所述方法包括：
获取当前时刻采集到的环境信息；
基于蒙特卡罗树搜索MCTS算法以所述环境信息作为根节点生成多条模拟路径，每条模拟路径包括m层子节点和不同层的节点间的传输路径，每条传输路径用于指示相邻两层节点之间的变道策略；每个子节点用于指示从所述子节点的父节点对应的环境信息执行变道策略后得到的变道后的环境信息，所述m为正整数；
获取所述多条模拟路径中每个子节点的累计质量得分和访问次数；
基于所述累计质量得分和访问次数计算每个子节点的置信上限UCB值；
将UCB值最大的目标子节点与所述目标子节点的父节点之间的变道策略确定为所述环境信息的变道策略。

2.根据权利要求1所述的方法，其特征在于，所述变道策略的数量为n种，所述n为大于1的整数，所述基于MCTS算法以所述环境信息作为根节点生成多条模拟路径，包括：
对于第k层节点，确定与所述第k层节点相连的n个第k+1层子节点，不同的第k+1层子节点对应的变道策略不同；所述第k层节点包括所述根节点和所述m层子节点，1≤k＜m；
在所述第k+1层子节点存在未搜索的子节点时，选择未被搜索的第k+1层子节点；计算选择的第k+1层子节点的质量得分，并记录所述选择的第k+1层子节点的访问次数，并令k＝k+1，再次执行所述对于第k层节点，确定与所述第k层节点相连的n个第k+1层子节点的步骤；
在所述第k+1层子节点全部已搜索时，按照每个第k+1层子节点的UCB值从所述n个第k+1层子节点中选择一个第k+1层子节点；计算选择的第k+1层子节点的质量得分，并记录所述选择的第k+1层子节点的访问次数，并令k＝k+1，再次执行所述对于第k层节点，确定与所述第k层节点相连的n个第k+1层子节点的步骤；
对于从根节点至第m层子节点均被搜索过的路径，从第m层子节点开始，将每层子节点的质量得分反向传输至所有的父节点，得到所述路径上每个子节点的累计质量得分；基于每个子节点的累计质量得分和访问次数计算所述子节点的UCB值，得到模拟路径，直至路径模拟的迭代次数达到预设次数时停止。

3.根据权利要求2所述的方法，其特征在于，所述计算选择的第k+1层子节点的质量得分，包括：
基于预先训练的神经网络模型计算所述选择的第k+1层子节点的质量得分，所述神经网络模型基于多组训练数据训练得到，每组训练数据包括：变道前的第...

【专利技术属性】
技术研发人员：乔晓利，
申请(专利权)人：知行汽车科技苏州有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人