一种自主避障规划方法、装置及系统制造方法及图纸

技术编号:38501881 阅读:32 留言:0更新日期:2023-08-15 17:09
本发明专利技术公开了一种自主避障规划方法、装置及系统,所述方法包括获取车辆的实时状态;将车辆的实时状态输入至采用深度确定策略梯度方法预先训练好的行为网络,获得车辆的控制量,完成自主避障规划;其中,所述预先训练好的行为网络在训练过程中,以避开障碍物为目标,以车辆的状态和障碍物的位置作为输入数据,以车辆的控制量作为标签数据。本发明专利技术相对于巨大参数量导致过程难以观测的深度神经网络更有确定性,提高自动移动车辆的安全性,十分适合于容错率低且任务复杂的场景下。于容错率低且任务复杂的场景下。于容错率低且任务复杂的场景下。

【技术实现步骤摘要】
一种自主避障规划方法、装置及系统


[0001]本专利技术属于避障
,具体涉及一种自主避障规划方法、装置及系统。

技术介绍

[0002]局部避障技术是自动驾驶、自动车辆或机器人等应用上的核心技术之一,帮助移动的车辆或机器人到达目标的任务中,躲避或绕开障碍物。目前局部避障算法可分为:传统避障算法和深度学习算法。更多、更复杂场景下深度学习算法在局部避障任务上表现出了更强的鲁棒性,但深度学习算法存在黑箱计算的弊端,神经网络本质上是一组多项式回归,人工神经网络通过大量的乘加近似问题的解,但网络参数通常都数以万计,实时的观测神经元会变得很困难,从而导致避障失败。

技术实现思路

[0003]针对上述问题,本专利技术提出一种自主避障规划方法、装置及系统,能够提高自动移动车辆的安全性,十分适合于容错率低且任务复杂的场景下。
[0004]为了实现上述技术目的,达到上述技术效果,本专利技术通过以下技术方案实现:
[0005]第一方面,本专利技术提供了一种自主避障规划方法,包括:
[0006]获取车辆的实时状态;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自主避障规划方法,其特征在于,包括:获取车辆的实时状态;将车辆的实时状态输入至采用深度确定策略梯度方法预先训练好的行为网络,获得车辆的控制量,完成自主避障规划;其中,所述预先训练好的行为网络在训练过程中,以避开障碍物为目标,以车辆的状态和障碍物的位置作为输入数据,以车辆的控制量作为标签数据。2.根据权利要求1所述的一种自主避障规划方法,其特征在于:所述预先训练好的行为网络包括顺次设置的感知神经元层、中间神经元层、指令神经元层和运动神经元层;相邻层之间的神经元通过以下方法建立连接:前一层中的每个神经元随机连接后一层中的k个神经元,创建k个突触,所述突触的极性服从二项分布;基于后一层中所有被连接过的神经元,计算平均扇入u;若后一层中存在没有被前一层中神经元连接的神经元,则从前一层中随机选择u个神经元连接到后一层中未被连接神经元,连接过程中产生的突触的极性服从二项分布;其中,所述指令神经元层还建立循环连接,所述循环连接包括随机选取k
c
个指令神经元,任意一个选中的指令神经元随机连接所有指令神经元中一个指令神经元,创建k
c
个突触。3.根据权利要求1所述的一种自主避障规划方法,其特征在于:所述行为网络中每层中的神经元的动力学模型的表达式为:的神经元的动力学模型的表达式为:其中,x
i
(t+Δ)是神经元i间隔时间步长Δ的膜电位,x
i
(t)是神经元i的膜电位,是神经元i的膜电容,x
j
(t)是神经元j的膜电位,w
ij
是神经元i连接到神经元j的突触权重参数,Δ是时间步长,是神经元i的静息电位,E
ij
是神经元i连接到神经元j的反突触电位,用于区分兴奋和抑制信号;g
li
是神经元i的漏电电导,σ(x
j
(t))为神经元j的激活值,γ
ij
和μ
ij
分别是神经元i和神经元j之间的σ(x
j
(t))的伸缩和平移变换的超参数。4.根据权利要求1所述的一种自主避障规划方法,其特征在于:所述预先训练好的行为网络的训练方法包括:基于车辆的当前状态和当前动作,生成车辆的下一时刻状态;将车辆的下一时刻状态输入至目标行为网络,由目标行为网络估计出车辆的下一时刻动作;将车辆的下...

【专利技术属性】
技术研发人员:杨宗林陶丽颖尚德龙周玉梅
申请(专利权)人:中科南京智能技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1