【技术实现步骤摘要】
基于离线增量学习的自动驾驶汽车路径规划方法及系统
[0001]本专利技术属于自动驾驶汽车路径规划领域,更具体地,涉及一种基于离线增量学习的自动驾驶汽车路径规划方法及系统。
技术介绍
[0002]尽管交通系统已经发展了几十年,但交通事故仍然是全世界的首要死因。自动驾驶技术有望减少事故,自动驾驶系统可以代替人类驾驶员,根据路况和车辆状态自主控制运动。自动驾驶的一项基本任务是在存在众多静态和移动障碍物的情况下规划无碰撞运动。避障的主要技术包括路径规划、决策和路径跟踪。路径规划模型旨在生成参考路径,避开障碍物,满足道路安全规则和车辆运动学约束的要求。
[0003]车辆行驶路径规划旨在设计一种轨迹规划算法,它基于车辆动力学并受车辆运动学极限的约束,同时可以避免行驶环境中的障碍物。在此基础上,通过某个优化准则(如规划路径最短、所需的时间最短、耗能最少等),为车辆选择一条最优的行驶路径。基于节点采样的快速扩展随机树(Rapidly
‑
Exploring Random Tree,RRT)的路径规划框架结合了采样效率 ...
【技术保护点】
【技术特征摘要】
1.一种基于离线增量学习的自动驾驶汽车路径规划方法,其特征在于,包括如下步骤:确定汽车的当前状态变量和目标信息;所述当前状态变量包括:汽车的位置、速度、加速度以及偏航速度;所述目标信息为汽车行驶目的地的区域范围信息;利用基于车辆运动学的概率路径预测模型实时预测汽车下一时刻的状态变量,以规划汽车的短期路径;基于二维地图信息构建人工势场,以为二维地图上不同类型的障碍物和道路结构分配不同的势函数,使得障碍物周围与道路边缘形成排斥势场,中间目标处周围形成引力势场;所述中间目标指的是汽车行驶路径中的位置点;通过线性二次调节策略获取汽车行驶路径的离线数据,并利用径向基函数神经网络对所述离线数据进行训练,以对汽车行驶路径的行驶距离进行预测;基于离线学习的快速扩展随机路径规划算法对汽车行驶的长期路径进行规划,并结合所述行驶距离的预测结果确定汽车自动驾驶的最优避障路径;其中,将所述汽车短期路径作为长期路径规划的采样指导,将所述人工势场作为长期路径规划的方向约束。2.根据权利要求1所述的自动驾驶汽车路径规划方法,其特征在于,所述利用基于车辆运动学的概率路径预测模型实时预测汽车下一时刻的状态变量具体为:x(k+1)=Ax(k)+Bu(k)+q(k)y(k)=Cx(k)+r(k)其中k∈[k
I
,k
F
],k表示采样时刻,k
I
表示开始采样时刻,k
F
表示结束采样时刻;是车辆当前状态变量,其包含n个状态向量,是下个采样时刻的车辆的状态变量,表示车辆的控制输入变量,是p个车辆传感器的测量输出,是高斯噪声,是观测噪声,A,B,C分别表示状态转移矩阵、输入矩阵和测量矩阵;x(k+Δk)=Δρ(k)+x(k)其中,x(k)=(x
v
,y
v
,θ,ω,v,a),x
v
与y
v
表示车辆的横向位置与纵向位置,v与a表示车辆的速度与加速度,θ表示转向角,ω表示角速度,Δk表示采样时间间隔,Δρ(k)表示车辆的状态转移矩阵;x(k+Δk)是预测的车辆下一个采样间隔的状态变量。3.根据权利要求2所述的自动驾驶汽车路径规划方法,其特征在于,所述基于二维地图信息构建人工势场,以为二维地图上不同类型的障碍物和道路结构分配不同的势函数,具体为:障碍物的斥力势场P
ov
(x
v
,y
v
)为:
其中,P
o
是障碍物产生的势场的最大振幅,δ1与δ2的取值范围为(0,1),共同决定势场电位上升与下降的速率,(x
v
,y
v
)与(x
o
,y
o
)分别表示车辆与障碍物的坐标;车辆行驶路径势场P
lane
(x
v
,y
v
)为:其中,A
lane
是道路中心线的最大振幅,D
safe
是确保安全的最短制动距离,L
w
是道路总宽度,A
X
和A
Y
表示中间变量;道路势场P
road
(x
v
,y
v
)为:P
road
(x
v
,y
v
)=ln(1
‑
|sin((x
v
π)/L
w
‑
π/2|);总势场力为:其中,P
U
(x
v
,y
v
)表示总的势函数,所述总势场力用于引导车辆到朝向目的地的最陡下降方向行径。4.根据权利要求2所述的自动驾驶汽车路径规划方法,其特征在于,所述通过线性二次调节策略获取汽车行驶路径的离线数据,并利用径向基函数神经网络对所述离线数据进行训练,以对汽车行驶路径的行驶距离进行预测,具体为:建立基于二次调节策略的二次代价函数度量距离,通过最小化车辆的状态误差来计算采样点之间的距离;其中,J表示二次代价函数,x
init
与x
f
是初始地的汽车状态变量与目标地的汽车状态变量,Q与Q
f
是半正定权重矩阵,R是正定权重矩阵,x
i
,u
i
(i∈{0,
…
,f
‑
1})分别表示采样点的汽车状态变量与控制输入变量,f表示采样点总个数;构建标准的线性优化控制模型,从而计算代价函数Cost;在基于线性二次调节策略的最优距离计算过程中,需要改变权重矩阵Q、Q
f
与R,并进行多次迭代,生成合适的距离度量:与R,并进行多次迭代,生成合适的距离度量:方程系数和权值的更新如下:
式中,以及均为中间变量;通过线性二次调节策略得到代价函数Cost(x
init
,x
f
)和增益矩阵K的局部最优解:其中S=Cost(x
init
,x
f
);设计径向基函数神经网络来提高计算效率,利用线性二次调节策略获得的离线训练数据学习成本函数的最优估计;y
k
=Cost(x
nI
,x
nF
)其中Dis_E(x
kI
,x
kF
)是样本点x
kI
到样本点x
kF
的欧几里得距离;y
k
表示估计的样本点x
kI
到样本点x
kF
的行驶距离;由于车辆运动轨迹的非完整性约束,采用Dubins距离Dis_D来衡量状态点的相似度;Dubins距离度量受最大曲率曲线的约束,以曲线路径的形式测量指定初始位置到目标位置的距离;此时,径向基函数神经网络的期望输出表示为:φ
jk
=exp(
‑
Dis_D(x
k
,x
cj
)/(2η2))1≤k≤N其中M是隐藏节点的数目,φ
jk
是第j个隐藏神经元的基函数,x
cj
是中心向量,Dis_D(x
k
,x
cj
)表示样本节点和中心节点之间的Dubins距离,η决定隐藏神经元的宽度,是径向基函数神经网络的实际输出,e
k
是建模误差,ω
j
是隐藏层和输出层之间的权重;由此,径向基函数神经网络的输出表示为:y=ΦW+e其中y=[y1,
…
,y
N
]
T
是期望输出向量,Φ=[φ1,
…
,φ
M
]
T
是回归矩阵,φ
i
=[φ
i1
,
…
,φ
iN
]
T
,W=[ω1,
…
,ω
M
]
T
是权重向量,e=[e1,
…
,e
M
]
T
是误差矩阵。5.根据权利要求4所述的自动驾驶汽车路径规划方法,其特征在于,所述并利用径向基函数神经网络对所述离线数据进行训练,以对汽车行驶路径的行驶距离进行预测,具体包括如下步骤:(1)网络参数的初始化:隐藏节点的数目M,迭代终止阈值ε,距离度量阈值G
j
(j∈{1,2,
…
,M});(2)中心向量x
c
=[x
c1
,
…
,x
cM
]
T
,x
cji
=minx
i
+(maxx
i
‑
minx
i
)/(2M)+(j
‑
1)(maxx
i
‑
minx
i
)/M;其中i∈{1,2},j∈{1,2,
…
,M},x
cj1
,x
cj2
是中心x
cj
的特征,minx
i
,maxx
i
分别是输入向量的第i个特征的最小值和最大值;(3)从隐藏层到输出层的权重向量W
j
=[ω
j1
,
…
,ω
jM
]
T
(j∈{1,2,
…
,M}),其中ω
jk
=
exp(
‑
0.5(x
k
‑
x...
【专利技术属性】
技术研发人员:周漫,韩福济,付才,张云鹤,袁斌,慕冬亮,韩兰胜,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。