【技术实现步骤摘要】
本专利技术涉及自动驾驶,特别是涉及一种基于马尔可夫决策过程与门控循环单元的混合a*自动驾驶接驳车泊车路径规划方法。
技术介绍
1、自动驾驶技术是当今科技领域的一项重要进展,其在改善交通安全、提高交通效率和改变出行方式等方面具有巨大潜力。然而,要实现完全自动驾驶,不仅需要车辆具备准确的感知和决策能力,还需要能够有效应对各种复杂路况的路径规划算法。在自动驾驶接驳车这一应用场景中,泊车路径规划是一个具有挑战性的任务,尤其是在复杂环境下,如停车场、道路交通拥堵等情况下。
2、传统的路径规划算法,如a算法,在静态环境下能够很好地工作,但在面对动态环境和不确定性因素时,往往无法取得良好的效果。为了克服这一问题,本专利技术提出了一种全新的泊车路径规划算法,将马尔可夫决策过程和门控循环单元(gru)神经网络与经典的a搜索算法相结合,实现了对泊车环境的动态预测和路径规划的自适应优化。
技术实现思路
1、本专利技术的目的是针对现有技术中存在的技术缺陷,而提供一种基于马尔可夫决策过程与门控循环单元的
...【技术保护点】
1.一种基于马尔可夫决策过程与门控循环单元的混合A*自动驾驶接驳车泊车路径规划方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于马尔可夫决策过程与门控循环单元的混合A*自动驾驶接驳车泊车路径规划方法,其特征在于,所述步骤1中,建立泊车环境模型时,停车场环境表示为一个二维网格G=(N,E),其中N是网格的节点集合,表示停车位和行驶路径的集合,E是边的集合,表示节点之间的可行驶路径,每个节点n∈N被赋予一个状态sn,该状态为“0”或“1”或“2”,“0”表示空闲停车位,“1”表示占用停车位,“2”表示行驶路径。
3.如权利要求1所述的
...【技术特征摘要】
1.一种基于马尔可夫决策过程与门控循环单元的混合a*自动驾驶接驳车泊车路径规划方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于马尔可夫决策过程与门控循环单元的混合a*自动驾驶接驳车泊车路径规划方法,其特征在于,所述步骤1中,建立泊车环境模型时,停车场环境表示为一个二维网格g=(n,e),其中n是网格的节点集合,表示停车位和行驶路径的集合,e是边的集合,表示节点之间的可行驶路径,每个节点n∈n被赋予一个状态sn,该状态为“0”或“1”或“2”,“0”表示空闲停车位,“1”表示占用停车位,“2”表示行驶路径。
3.如权利要求1所述的一种基于马尔可夫决策过程与门控循环单元的混合a*自动驾驶接驳车泊车路径规划方法,其特征在于,所述步骤1中,车辆状态s用三元组(x,y,θ,v)表示,其中:(x,y)表示车辆在停车场网格中的位置坐标,θ表示车辆的朝向,v表示车辆的速度。
4.如权利要求1所述的一种基于马尔可夫决策过程与门控循环单元的混合a*自动驾驶接驳车泊车路径规划方法,其特征在于,所述步骤1中,整个停车场路径规划通过马尔可夫决策过程(mdp)模型来描述,其中:s是状态空间,a是动作空间,p是状态转移概率函数,r=s×a×p,r是奖励函数,表示从状态s执行动作a转移到状态s′所获得的奖励;
5.如权利要求1所述的一种基于马尔可夫决策过程与门控循环单元的混合a*自动驾驶接驳车泊车路径规划方法,其特征在于,所述步骤2中,使用混合a*算法进行初始路径规划时,定义启发式函数h(n)估计从节点n到目标节点g的最小代价,对于每个节点n,总代价函数f(n)定义为:
6.如权利要求1所述的一种基于马尔可夫决策过程与门控循环单元的混合a*自动驾驶接驳车泊车路径规划方法,其特征在于,所述步骤2中,利用优化函数o(p)优化初始路径,p表示一条路径,o(p)=γ·l(p)+δ·t(p)+∈·e(p),l(p)表示路径的长度,t(p)表示路径的总时间成本,e(p)表示路径的总能耗成本,γ、δ、和∈是调节各成本因素重要性的权重系数。
7.如权利要求1所述的一种基于马尔可夫决策过程与门控循环...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。