一种基于深度强化学习的稳定平台伺服控制方法技术

技术编号：40419683 阅读：24 留言：0更新日期：2024-02-20 22:38

本发明专利技术公开了一种基于深度强化学习的稳定平台伺服控制方法，涉及伺服控制技术领域。本发明专利技术与之前的PID控制器相比，改进了其快速性与抗干扰能力不足、性能依赖设计人员经验且自适应能力欠缺的问题，通过设计并训练深度强化学习智能体，使其在与环境的不断交互中学习出最佳控制策略，构成深度强化学习自适应PID速度环、经典PID位置环的双闭环校正稳定平台控制器，并将之应用于基于斜置稳定平台的过顶控制策略中。仿真验证结果显示，该方法动态性能良好、抗干扰能力强，能够稳定跟踪高速机动的目标，满足稳定平台伺服控制系统的工程应用要求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及稳定平台伺服控制领域，尤其涉及一种基于深度强化学习的伺服控制方法。

技术介绍

1、稳定平台被广泛应用于飞行器、车辆、舰船等移动载体的目标识别与跟踪系统中，其工作原理为根据探测器测得的误差角和平台状态解算出框架角控制指令驱动框架电机，从而隔离载体运动的影响，使光学感知系统保持惯性稳定。然而，稳定平台的框架运动之间存在耦合，消除探测器失调角需同时驱动两框架，且载体的快速运动与框架姿态扰动会引起光轴抖动，不仅影响光学传感器成像质量，目标识别准确度下降；还降低了探测系统跟踪精度，目标从视场中丢失的风险加剧。因此，为使探测设备相对惯性空间保持稳定，避免系统失稳，稳定平台控制系统需要具备快速响应和隔离扰动能力。

2、滚仰式稳定平台存在其机械结构固有的过顶奇异问题。当目标位于载体纵轴附近做微小运动时，滚仰式稳定平台由于结构限制，会出现滚转框架角速度指令趋于无穷，探测设备无法及时跟踪目标的过顶奇异问题。

3、针对此问题，目前的通用方案是将基于经典pid或模糊pid的控制算法应用于稳定平台控制系统的位置速度双闭环校正...

【技术保护点】

1.一种基于深度强化学习的稳定平台伺服控制方法，其特征在于，具体包括以下步骤：

2.根据权利要求1所述的一种基于深度强化学习的稳定平台伺服控制方法，其特征在于，S2中所述基于深度学习的深度确定性策略梯度算法网络具体包括以下内容：

3.根据权利要求1所述的一种基于深度强化学习的稳定平台伺服控制方法，其特征在于，所述S3具体包括以下内容：

4.根据权利要求1所述的一种基于深度强化学习的稳定平台伺服控制方法，其特征在于，所述S4具体包括以下内容：

5.根据权利要求1所述的一种基于深度强化学习的稳定平台伺服控制方法，其特征在于，所述S5具体包括以下...

【技术特征摘要】

1.一种基于深度强化学习的稳定平台伺服控制方法，其特征在于，具体包括以下步骤：

2.根据权利要求1所述的一种基于深度强化学习的稳定平台伺服控制方法，其特征在于，s2中所述基于深度学习的深度确定性策略梯度算法网络具体包括以下内容：

3.根据权利要求1所述的一种基于深度强化学习的稳定平台伺服控制方法，其特征在于，所述s3具体包括以下内容：

4.根据权利要求1所述的一种基于深度强化学习的稳定平台伺服控制方法，其特征在于，所述s4具体包括以下内容：...

【专利技术属性】
技术研发人员：刘福祥，何玮钰，金秋延，李磊，李函潞，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人