基于进化引导深度强化学习的无人机自主飞行决策方法技术

技术编号:40837896 阅读:47 留言:0更新日期:2024-04-01 15:03
基于进化引导深度强化学习的无人机自主飞行决策方法,包括以下步骤;步骤1:无人机自主飞行过程建模,通过构建四旋翼无人机控制模型、强化学习算法设计以及网络模型构建,用于强化学习算法设计;步骤2:进化引导的改进SAC算法,通过进行进化算法模块和信息传递方式,用于实现无人机自主飞行决策。本发明专利技术根据无人机控制模型与自主飞行任务目标对问题进行马尔科夫决策过程建模,设计基于进化引导的深度强化学习算法,提高无人机自主飞行的探索能力。

【技术实现步骤摘要】

本专利技术属于无人机自主飞行,具体涉及基于进化引导深度强化学习的无人机自主飞行决策方法


技术介绍

1、随着无人机在诸多领域的快速发展及应用,无人机自主飞行决策技术成为工业界和学术界亟待突破的研究方向之一,要求无人机具有自主避障、路径规划等功能。深度强化学习通过智能体与环境交互来优化策略,对高维度的决策问题有着很好的解决能力,广泛应用于智能决策和优化控制问题中。在无人机自主飞行决策领域,深度强化学习取得了不错效果,可以应用于具有连续状态空间和动作空间的情况,但深度强化学习如何平衡探索与利用的问题仍然存在。

2、启发式算法对近似最优解进行求解。粒子群算法源于对鸟群优美而不可预测的运动的模拟,limhs等人将粒子群算法与量子物理结合,生成无人机的避障路径,但该方法容易陷入局部最优,且后期收敛速度变慢。引入启发信息因素的a*算法,在求解避障和路径规划问题时,搜索方向更加精准,马云红等人对a*算法进行改进,采用变步长策略,生成满足一系列约束的避障路径,但这类方法对启发函数依赖性高,使得决策缺乏灵活性和实时性。

3、yangx等人使用回归搜索本文档来自技高网...

【技术保护点】

1.基于进化引导深度强化学习的无人机自主飞行决策方法,其特征在于,包括以下步骤;

2.根据权利要求1所述的基于进化引导深度强化学习的无人机自主飞行决策方法,其特征在于,所述步骤1具体为:

3.根据权利要求1所述的基于进化引导深度强化学习的无人机自主飞行决策方法,其特征在于,所述步骤1中,1);四旋翼无人机控制模型为:

4.根据权利要求3所述的基于进化引导深度强化学习的无人机自主飞行决策方法,其特征在于,所述步骤1中,2):强化学习要素;

5.根据权利要求4所述的基于进化引导深度强化学习的无人机自主飞行决策方法,其特征在于,所述步骤1中,3)...

【技术特征摘要】

1.基于进化引导深度强化学习的无人机自主飞行决策方法,其特征在于,包括以下步骤;

2.根据权利要求1所述的基于进化引导深度强化学习的无人机自主飞行决策方法,其特征在于,所述步骤1具体为:

3.根据权利要求1所述的基于进化引导深度强化学习的无人机自主飞行决策方法,其特征在于,所述步骤1中,1);四旋翼无人机控制模型为:

4.根据权利要求3所述的基于进化引导深度强化学习的无人机自主飞行决策方法,其特征在于,所述步骤1中,2):强化学习要素;

...

【专利技术属性】
技术研发人员:柯良军郭言笑
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1