【技术实现步骤摘要】
本申请属于无人机控制,特别涉及一种基于强化学习面向任务与防撞的动态航路规划系统。
技术介绍
1、无人机具有无碰撞路径规划能力是顺利执行飞行任务的一个先决条件。路径规划就是搜索一条从起始位置到目标位置的无碰撞路径,同时优化性能指标(如距离、时间、能耗)或综合优化指标。根据无人机所具有的先验信息的多少,可将路径规划方法划分为全局和局部两种方法。其中局部路径规划可通过传感器在线动态探测无人机的工作环境信息,包括人工势场法、遗传算法、模糊逻辑方法等。
2、无人机飞行环境愈发复杂、装备信息化程度越来越高,电磁干扰会导致机载通信设备受干扰,甚至出现无线电通信和gps信号中断的情况。同时无人机执行低空、突防等任务时,也容易遭受障碍物等干扰,此时的复杂障碍环境严重考验了无人机的任务执行能力。
3、现有技术中的无人机基本依靠地面人员实时指控飞行,自主性、协同性较差,面对上述无线电通信和gps信号中断的情况,无人机将处于不受控的危险状态,同时复杂障碍环境也极大增加了无人机撞机的风险。
技术实现思路
1、本本文档来自技高网...
【技术保护点】
1.一种基于强化学习面向任务与防撞的动态航路规划系统,其特征在于,包括面向训练模式的动态航路规划架构和面向应用模式的动态航路规划架构,所述动态航路规划系统包括:环境观测模块、判断评估模块、智能决策模块、行动模块、环境模块、任务模块、任务解算模块;
2.如权利要求1所述的基于强化学习面向任务与防撞的动态航路规划系统,其特征在于,所述环境观测模块包括环境传感器模块与环境观测算法模块,所述环境传感器模块用于动态感知无人机在环境中的相对信息,所述环境观测算法模块用于对传感器的输出进行数据处理;
3.如权利要求1所述的基于强化学习面向任务与防撞的动态航路
...【技术特征摘要】
1.一种基于强化学习面向任务与防撞的动态航路规划系统,其特征在于,包括面向训练模式的动态航路规划架构和面向应用模式的动态航路规划架构,所述动态航路规划系统包括:环境观测模块、判断评估模块、智能决策模块、行动模块、环境模块、任务模块、任务解算模块;
2.如权利要求1所述的基于强化学习面向任务与防撞的动态航路规划系统,其特征在于,所述环境观测模块包括环境传感器模块与环境观测算法模块,所述环境传感器模块用于动态感知无人机在环境中的相对信息,所述环境观测算法模块用于对传感器的输出进行数据处理;
3.如权利要求1所述的基于强化学习面向任务与防撞的动态航路规划系统,其特征在于,所述判断评估模块包括判断评估算法模块;
4.如权利要求1所述的基于强化学习面向任务与防撞的动态航路规划系统,其特征在于,训练模式下,所述智能决策模块包括强化学习训练算法模块和神经网络控制器模块,所述强化学习训练算法模块与环境模块150交互,无人机行动变化,得到环境的奖惩,奖惩评价指明神经网络参数更新的方向和幅度,根据强化学习算法,更新神经网络控制器模块的参数;训练模式下的智能决策模块以障碍密度态势、无人机与目标点的航向偏差、环境奖惩、估计的无人机与目标点距离为输入,输出给定航向指令、给定速度指令、给定高度指令;
5.如权利要求1所述的基于强化学习面向任...
【专利技术属性】
技术研发人员:李贺琦,周大鹏,毕晓烨,窦晓之,杨大鹏,
申请(专利权)人:中国航空工业集团公司沈阳飞机设计研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。