【技术实现步骤摘要】
基于自适应粒子与信念填充的部分可观察驾驶规划方法
本专利技术涉及一种基于自适应粒子与信念填充的部分可观察驾驶规划方法,属于自动驾驶
技术介绍
自动驾驶任务是一个典型的部分可观察任务,一方面障碍物造成的遮挡使得自动驾驶任务中的观察不完全,另一方面,其他智能体的意图、驾驶风格等是天然的部分可观察状态,需要根据观察对其进行推测,这种观察的不完全性带来了状态的不确定性。但是目前使用的方法如有限状态机、决策树模型等方法无法很好地处理这种不确定性。部分可观察马尔可夫决策过程是对马尔可夫决策过程(MDP)的一种拓展,它额外考虑了状态的不确定性。在MDP中,智能体能够准确地知道它的状态,但在POMDP中,尽管环境的动力系统(状态转移模型)仍然是由一个MDP过程所决定,但是智能体不能直接获取该状态,而只能从它所获得观察中对当前状态进行估计。为了能够在POMDP环境中做出决策,智能体需要能够处理状态的不确定性。一个处理状态不确定性的流行的方法是维护一个信念状态,一个信念状态是一个在状态空间上的分布,其中一个状态的概率表示智能体“相信”它有多可能。但是,精确地去更新信念状态需要的计算量,当状态空间很大时,这是难以承受的,如果一个POMDP问题有着连续状态空间,则精确更新信念状态会是不可能的。一个更加实际的方法是去用一组粒子(或样本)来近似信念状态,并且用粒子滤波来对其进行更新。寻找POMDP的一个最优解有着PSPACE-complete的计算复杂度,即使使用一些近似方法,这一般依然是难以解决的。因此,在线规划这样 ...
【技术保护点】
1.一种基于自适应粒子与信念填充的部分可观察驾驶规划方法,其特征在于,包括以下步骤:/nS1、对自动驾驶任务进行建模,将自动驾驶任务建模为一个POMDP问题,包括对道路信息的建模以及对障碍物和智能体的建模;/nS2、在执行自动驾驶任务时,首先需要对自车进行定位,获取道路信息,然后使用物体识别和追踪算法对传感器视野中的各个障碍物及智能体进行识别,按照S1所述模型对各个障碍物及智能体的状态以信念分布进行表示,获得对应当前行车场景的POMDP模型;/nS3、使用一种POMDP在线规划方法求解当前信念状态下的最优动作;执行该最优动作,按照在线规划所得到的动作进行更进一步的路径规划,并最终转化为线控系统的操作;执行动作后使用动作对信念状态进行更新;/nS4、从传感器获取新的观察,并使用观察对信念状态进行更新,对于某些进入或离开模型所考虑的范围的障碍物或智能体,需要对模型中相应的部分进行更新;S4与S3交替进行,或者S4与S3并行执行;/nS5、自动驾驶任务结束则结束上述过程。/n
【技术特征摘要】
1.一种基于自适应粒子与信念填充的部分可观察驾驶规划方法,其特征在于,包括以下步骤:
S1、对自动驾驶任务进行建模,将自动驾驶任务建模为一个POMDP问题,包括对道路信息的建模以及对障碍物和智能体的建模;
S2、在执行自动驾驶任务时,首先需要对自车进行定位,获取道路信息,然后使用物体识别和追踪算法对传感器视野中的各个障碍物及智能体进行识别,按照S1所述模型对各个障碍物及智能体的状态以信念分布进行表示,获得对应当前行车场景的POMDP模型;
S3、使用一种POMDP在线规划方法求解当前信念状态下的最优动作;执行该最优动作,按照在线规划所得到的动作进行更进一步的路径规划,并最终转化为线控系统的操作;执行动作后使用动作对信念状态进行更新;
S4、从传感器获取新的观察,并使用观察对信念状态进行更新,对于某些进入或离开模型所考虑的范围的障碍物或智能体,需要对模型中相应的部分进行更新;S4与S3交替进行,或者S4与S3并行执行;
S5、自动驾驶任务结束则结束上述过程。
2.根据权利要求1所述的基于自适应粒子与信念填充的部分可观察驾驶规划方法,其特征在于,所述S1中,建模过程包含状态空间、观察空间、动作空间的确定,转移模型和观察模型的构建,以及奖励函数的设计;这一过程需要离线构建,对于道路信息的建模需要预先收集道路数据,并根据所在位置调取相应道路信息;对于障碍物的模型构建即对道路上所有会导致碰撞的非智能体建立相应模型;对于智能体的建模需要对自动驾驶中会遇到的不同类型智能体分别进行建模。
3.根据权利要求1所述的基于自适应粒子与信念填充的部分可观察驾驶规划方法,其特征在于,S3所述的POMDP在线规划方法,包括以下步骤:
①在在线规划开始时,以当前信念状态为根节点建立信念树;所述信念树上的节点分为信念节点和动作节点,动作节点与信念节点相互交替;
②迭代构建信念树,每次从根节点出发选择根据预设标准依次选择动作和观察节点直至到达叶节点,对叶节点进行拓展,拓展时粒子的传播采用自适应粒子滤波,并为兄弟信念节点构建信念填充;待满足设定条件后,进行反传,将价值估计或价值上下界沿信念树上的路...
【专利技术属性】
技术研发人员:章宗长,俞扬,周志华,吴晨阳,杨国钰,
申请(专利权)人:南京大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。