当前位置: 首页 > 专利查询>大连大学专利>正文

一种基于POMDP模型的APF无人机路径规划方法技术

技术编号:36847467 阅读:13 留言:0更新日期:2023-03-15 16:43
本发明专利技术公开了一种基于POMDP模型的APF无人机路径规划方法,使用无人机所携带的传感器获取障碍物的信息,建立障碍物部分可观测马尔可夫预测模型,利用该模型预测障碍物下一步可能出现的位置;为了保证无人机在路径规划中的安全性,建立无人机和障碍物的影响模型,避免路径规划的过程中无人机与障碍物发生碰撞的情况;对传统的人工势场法进行改进,确保无人机能够安全到达目标点的同时避免其陷入局部极小值问题。本方法在UAV实时路径规划中具有良好的可行性和有效性,能够使UAV有效地避开障碍物,找到一条最优路径。找到一条最优路径。找到一条最优路径。

【技术实现步骤摘要】
一种基于POMDP模型的APF无人机路径规划方法


[0001]本专利技术涉及无人机路径规划
,具体涉及一种基于POMDP模型的APF无人机路径规划方法。

技术介绍

[0002]无人机是一种由动力驱动,无人驾驶、可重复使用的航空器,英文常用Unmanned Aerial Vehicle表示,缩写为UAV。无人机是人类拓展认知,探索天空的重要工具,它可以在人类无法到达的地方自主运行,完成人类无法完成的作业,具有非常深远的研究价值。与有人驾驶飞机相比,无人机具有尺寸小、重量轻、制造成本低、操作简单等优点。随着科学技术的突飞猛进,无人机在许多应用领域迅速增长,包括实时监控、遥感、搜索和救援、精准农业等。针对无人机的研究在最近几年得到了广泛的关注,无人机路径规划技术也成为了航空领域最具挑战性和研究价值的技术之一。
[0003]无人机路径规划技术是一门综合数学、统计学、运动学及人工智能等多个学科的最新研究成果,其发展对军事、交通、农业和电影等行业具有重大的影响。无人机路径规划是指在无人机飞行环境地图中设置起点和终点,并使用相关的路径规划方法规划一条无碰撞、最优和安全的无人机飞行路径。路径规划是提高无人机自主飞行能力、保障飞行安全的关键技术,合适的路径规划方法是无人机顺利完成飞行任务的前提和基础。常用无人机路径规划方式有很多,比如遗传算法、粒子群算法、A

star算法、快速随机搜索树算法、Dijkstra算法、人工势场法(Artificial Potential Field、APF)等。
[0004]人工势场法APF是一种原理比较简单的路径规划方法,由于其具有结构简单、计算量小以及实时性较高等优点被广泛的应用在局部路径规划方法中。此外,人工势场法还具有很强的移植性,通过改变人工势场的来源,还可以解决多智能体系统的避障问题和地形避障问题。但是,现有人工势场法也存在一些问题,Koren和Borrenstein指出了APF方法固有的四个重要问题。其中,局部最小值是亟需解决的问题。
[0005]由于空中的无人机以及运动障碍物具有很高的速度,仅仅依靠传感器的检测,无法满足无人机路径规划的实时性。因此,需要根据检测到的几个时刻数据,进一步估算障碍物的下一步运动位置,来保证路径规划的安全性和实时性。由于MDP模型在求解最优策略时需要已知全部的状态空间,而POMDP模型能够很好地用于环境、动作以及观测的不确定情况,目前使用POMDP模型进行无人机路径规划的文章中,多数都以无人机为中心建立模型,这很有可能造成无人机频繁的进行路径切换,降低路径规划的效率。此外,多数算法在无人机路径规划的过程中都将障碍物看作一个粒子,而忽略了障碍物的实际形状所造成的影响;这种情况下很有可能致使无人机和障碍物发生碰撞,导致路径规划失败。

技术实现思路

[0006]本专利技术在充分利用无人机路径规划特性的基础上,将部分可观察马尔科夫决策POMDP模型和改进的人工势场法APF结合,能够保证无人机在未知环境中路径规划的安全
性。
[0007]为实现上述目的,本申请提出一种基于POMDP模型的APF无人机路径规划方法,包括:
[0008]步骤1:设置无人机的起始点、目标点坐标,无人机的初始状态为奔向目标点的直线飞行;
[0009]步骤2:在无人机飞行过程中通过机载传感器检测周围的障碍物,使用云台获取障碍物信息,建立障碍物影响模型;
[0010]步骤3:当检测到无人机在障碍物影响模型内时,得到障碍物当前时刻的位置,通过POMDP模型预测动态障碍物轨迹,得到障碍物下一时刻的位置;
[0011]步骤4:由障碍物当前时刻和下一时刻的位置,对障碍物斥力建模,找到势场中最低斥力势场集合;
[0012]步骤5:分别从当前时刻和下一时刻最低斥力势场集合中,选取使目标函数D最小的两个位置;
[0013]步骤6:根据这两个位置和无人机当前的位置确定一个圆弧,无人机沿这条圆弧飞行,直到下一个时间段(可以设置为间隔2s)机载传感器检测到周围环境信息;
[0014]步骤7:若检测仍有障碍物存在于障碍物影响模型中,转到步骤3;若未检测到周围环境有障碍物或不在障碍物影响模型中,则无人机朝着目标点飞行,直至到达目标点。
[0015]进一步的,通过POMDP预测动态障碍物轨迹,具体为:
[0016]获取状态空间S,所述状态空间S包括两个子系统状态,分别是无人机的运动状态UAV
t
和障碍物的运动状态Obstacle
t
;故在t时刻的状态空间定义为:
[0017]S
t
=(UAV
t
,Obstacle
t
)
ꢀꢀ
(1)
[0018]其中,无人机的运动状态UAV
t
表示无人机在时刻t的位置和速度;它由一个五维向量表示其中表示无人机在t时刻的位置,表示无人机在t时刻的速度,表示无人机在t时刻的运动方向;同理,障碍物的运动状态其中表示障碍物在t时刻的位置,表示障碍物在t时刻的运动速度,表示障碍物在t时刻的运动方向;
[0019]使用t时刻障碍物采取的动作A
t
作为动作空间:
[0020][0021]其中,A
t
指的是t时刻障碍物所采取的动作,是指在t时刻状态下障碍物相对于t

1时刻在大地坐标系上所偏移的距离,是指相对于t

1时刻的倾斜角度,是指t时刻障碍物的加速度;
[0022]将观测空间定义为t时刻无人机通过机载传感器观测到障碍物的运动状态Ob
t

[0023]Ob
t
={ob
t
|ob
t
∈S
t
}
ꢀꢀ
(3)
[0024]其中,Ob
t
为t时刻机载传感器所观测到的障碍物运动状态,包括此时障碍物的位置、速度、运动方向以及相对于无人机的方位角θ;方位角θ由下式获取:
[0025][0026]进一步的,在POMDP模型中,将障碍物的观测空间定义成存在噪声情况下的观测概率函数:
[0027]O(a
t
,s
t+1
,o
t+1
)=Pro(o
t+1
|s
t+1
,a
t
)+Err
ꢀꢀ
(5)
[0028]该公式表示存在噪声时,障碍物在t时刻采取动作a
t
后,在t+1时刻到达状态s
t+1
时,观察到o
t+1
的概率;其中,a
t
∈A
t
、s
t+1
∈S
t
、o
t+1
∈Ob
t
,Err为传感器的观测噪声序列,如下式所示:
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于POMDP模型的APF无人机路径规划方法,其特征在于,包括:步骤1:设置无人机的起始点、目标点坐标,无人机的初始状态为奔向目标点的直线飞行;步骤2:在无人机飞行过程中通过机载传感器检测周围的障碍物,使用云台获取障碍物信息,建立障碍物影响模型;步骤3:当检测到无人机在障碍物影响模型内时,得到障碍物当前时刻的位置,通过POMDP模型预测动态障碍物轨迹,得到障碍物下一时刻的位置;步骤4:由障碍物当前时刻和下一时刻的位置,对障碍物斥力建模,找到势场中最低斥力势场集合;步骤5:分别从当前时刻和下一时刻最低斥力势场集合中,选取使目标函数D最小的两个位置;步骤6:根据这两个位置和无人机当前的位置确定一个圆弧,无人机沿这条圆弧飞行,直到下一个时间段机载传感器检测到周围环境信息;步骤7:若检测仍有障碍物存在于障碍物影响模型中,转到步骤3;若未检测到周围环境有障碍物或不在障碍物影响模型中,则无人机朝着目标点飞行,直至到达目标点。2.根据权利要求1所述一种基于POMDP模型的APF无人机路径规划方法,其特征在于,通过POMDP预测动态障碍物轨迹,具体为:获取状态空间S,所述状态空间S包括两个子系统状态,分别是无人机的运动状态UAV
t
和障碍物的运动状态Obstacle
t
;故在t时刻的状态空间定义为:S
t
=(UAV
t
,Obstacle
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,无人机的运动状态UAV
t
表示无人机在时刻t的位置和速度;它由一个五维向量表示其中表示无人机在t时刻的位置,表示无人机在t时刻的速度,表示无人机在t时刻的运动方向;同理,障碍物的运动状态其中表示障碍物在t时刻的位置,表示障碍物在t时刻的运动速度,表示障碍物在t时刻的运动方向;使用t时刻障碍物采取的动作A
t
作为动作空间:其中,A
t
指的是t时刻障碍物所采取的动作,是指在t时刻状态下障碍物相对于t

1时刻在大地坐标系上所偏移的距离,是指相对于t

1时刻的倾斜角度,是指t时刻障碍物的加速度;将观测空间定义为t时刻无人机通过机载传感器观测到障碍物的运动状态Ob
t
:Ob
t
={ob
t
|ob
t
∈S
t
}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中,Ob
t
为t时刻机载传感器所观测到的障碍物运动状态,包括此时障碍物的位置、速度、运动方向以及相对于无人机的方位角θ;方位角θ由下式获取:3.根据权利要求2所述一种基于POMDP模型的APF无人机路径规划方法,其特征在于,在
POMDP模型中,将障碍物的观测空间定义成存在噪声情况下的观测概率函数:O(a
t
,s
t+1
,o
t+1
)=Pro(o
t+1
|s
t+1
,a
t
)+Err
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)该公式表示存在噪声时,障碍物在t时刻采取动作a
t
后,在t+1时刻到达状态s
t+1
时,观察到o
t+1
的概率;其中,a
t
∈A
t
、s
t+1
∈S
t
、o
t+1
∈Ob
t
,Err为传感器的观测噪声序列,如下式所示:Err=k
·
Dis(UAV
t
,Obstacle
t
)+m
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)观测概率函数依赖无人机相对于障碍物的位置,其中k、m是一个大于0且固定的系数,Dis(UAV
t
,Obstacle
t
)表示t时刻无人机和障碍物之间的距离。4.根据权利要求3所述一种基于POMDP模型的APF无人机路径规划方法,其特征在于,所述无人机的状态转移函数为:函数是无人机的状态控制动力学方程的过程,采用的映射关系如下:通过式(8)得出无人机在t+1时刻的位置;其中,α是无人机的速度方向和y_z平面的夹角,β是无人机的速度方向和x_y平面的夹角,T为两个时刻之间的采样周期;所...

【专利技术属性】
技术研发人员:冯建新解爽郭冠麟潘成胜
申请(专利权)人:大连大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1