【技术实现步骤摘要】
本申请涉及空间机器人在轨维修维护,特别涉及一种双臂空间机器人视觉伺服协调控制方法及装置。
技术介绍
1、双臂空间机器人系统包括两部机械臂和操作平台(卫星基座),其操作平台和机械臂间存在动力学耦合,机械臂的运动会对操作平台的位姿产生干扰,同时操作平台位姿的变化又影响机械臂的末端位姿。
2、在双臂空间机器人对非合作目标进行操作的过程中,由于目标对象及操作任务的复杂性,对被控对象精确建模代价非常大或几乎不可能,除了外部干扰因素外,往往含有一定的不确定性、柔性动态或非线性因素;此外,由于空间机器人距离地球较远,通信时延的存在使得人工遥操作难以实现。
3、然而,由于空间机器人经常工作于充满各种不确定性的非结构化环境中,空间操作任务多种多样,事先无法设定完备的操作计划和任务,因此,现有技术中的双臂空间机器人还无法自主适应各种非结构化环境,完成多种多样的空间操作任务,难以满足未来空间在轨服务精细操作的需求,自主性和智能性较差,亟待解决。
技术实现思路
1、本申请提供一种双臂空间机
...【技术保护点】
1.一种双臂空间机器人视觉伺服协调控制方法,其特征在于,应用于离线训练阶段,其中,所述方法包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述基于预设双臂协作任务场景,训练所述宏观运动决策模型中的预评价网络和预策略网络,生成满足预设训练条件的所述双臂空间机器人的评价网络和策略网络,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述观测输入和预设策略梯度,更新所述评价网络和所述策略网络,包括:
4.一种双臂空间机器人视觉伺服协调控制方法,其特征在于,应用于在线决策阶段,其中,所述方法包括以下步骤:
5
...【技术特征摘要】
1.一种双臂空间机器人视觉伺服协调控制方法,其特征在于,应用于离线训练阶段,其中,所述方法包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述基于预设双臂协作任务场景,训练所述宏观运动决策模型中的预评价网络和预策略网络,生成满足预设训练条件的所述双臂空间机器人的评价网络和策略网络,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述观测输入和预设策略梯度,更新所述评价网络和所述策略网络,包括:
4.一种双臂空间机器人视觉伺服协调控制方法,其特征在于,应用于在线决策阶段,其中,所述方法包括以下步骤:
5.一种双臂空间机器人视觉伺服协调控制装置,其特征在于,应用于离线训练阶段,其...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。