【技术实现步骤摘要】
本专利技术涉及稳定平台伺服控制领域,尤其涉及一种基于深度强化学习的伺服控制方法。
技术介绍
1、稳定平台被广泛应用于飞行器、车辆、舰船等移动载体的目标识别与跟踪系统中,其工作原理为根据探测器测得的误差角和平台状态解算出框架角控制指令驱动框架电机,从而隔离载体运动的影响,使光学感知系统保持惯性稳定。然而,稳定平台的框架运动之间存在耦合,消除探测器失调角需同时驱动两框架,且载体的快速运动与框架姿态扰动会引起光轴抖动,不仅影响光学传感器成像质量,目标识别准确度下降;还降低了探测系统跟踪精度,目标从视场中丢失的风险加剧。因此,为使探测设备相对惯性空间保持稳定,避免系统失稳,稳定平台控制系统需要具备快速响应和隔离扰动能力。
2、滚仰式稳定平台存在其机械结构固有的过顶奇异问题。当目标位于载体纵轴附近做微小运动时,滚仰式稳定平台由于结构限制,会出现滚转框架角速度指令趋于无穷,探测设备无法及时跟踪目标的过顶奇异问题。
3、针对此问题,目前的通用方案是将基于经典pid或模糊pid的控制算法应用于稳定平台控制系统的位置速度双闭环校正
...【技术保护点】
1.一种基于深度强化学习的稳定平台伺服控制方法,其特征在于,具体包括以下步骤:
2.根据权利要求1所述的一种基于深度强化学习的稳定平台伺服控制方法,其特征在于,S2中所述基于深度学习的深度确定性策略梯度算法网络具体包括以下内容:
3.根据权利要求1所述的一种基于深度强化学习的稳定平台伺服控制方法,其特征在于,所述S3具体包括以下内容:
4.根据权利要求1所述的一种基于深度强化学习的稳定平台伺服控制方法,其特征在于,所述S4具体包括以下内容:
5.根据权利要求1所述的一种基于深度强化学习的稳定平台伺服控制方法,其特征在于,
...【技术特征摘要】
1.一种基于深度强化学习的稳定平台伺服控制方法,其特征在于,具体包括以下步骤:
2.根据权利要求1所述的一种基于深度强化学习的稳定平台伺服控制方法,其特征在于,s2中所述基于深度学习的深度确定性策略梯度算法网络具体包括以下内容:
3.根据权利要求1所述的一种基于深度强化学习的稳定平台伺服控制方法,其特征在于,所述s3具体包括以下内容:
4.根据权利要求1所述的一种基于深度强化学习的稳定平台伺服控制方法,其特征在于,所述s4具体包括以下内容:...
【专利技术属性】
技术研发人员:刘福祥,何玮钰,金秋延,李磊,李函潞,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。