【技术实现步骤摘要】
一种地外星表危险场景脱困策略学习训练系统与方法
[0001]本专利技术涉及一种地外星表危险场景脱困策略学习训练系统与方法,属于深空探测
技术介绍
[0002]深空探测任务中,着陆后的巡视探测是一种深入开展地外天体科学探测活动的重要方式.然而,地外星表地形环境复杂未知、光照差异大,探测器依靠视觉测量仅能获得目标的几何特征,对于沙地、浮坑等危险地形的感知识别能力弱,一旦发生车轮沉陷等情况,将严重影响巡视器安全。例如美国的勇气号火星车,即因车轮陷入火壤,无法脱困,不得不终止任务。因此,地面应充分识别风险,研究危险场景下脱困控制策略。
[0003]利用物理试验开展脱困控制策略的学习训练,代价大,风险高,效率低,力触测量信息难以获取,不能满足智能学习算法对大样本、反复试错学习的需求。因此,急需建立数字仿真环境及分布式学习训练平台,以获得有效脱困控制策略样本库,为发生危险情况下的成功脱困提供技术支持和地面试验手段,但目前未见相关报道。
技术实现思路
[0004]本专利技术的目的在于克服上述缺陷,提供一种 ...
【技术保护点】
【技术特征摘要】
1.一种地外星表危险场景脱困策略学习训练方法,其特征在于,包括以下步骤:(1)构建地外星表地貌环境数字模型和巡视器数字模型,所述地外星表地貌环境数字模型包括地貌特征和环境参数,巡视器数字模型包括巡视器动力学模型和状态参数;(2)制定训练科目,所述训练科目包括与巡视器脱困场景对应的地外星表地貌环境、巡视器动力学状态、巡视器运行规则和脱困胜负条件;(3)根据训练科目设置地外星表地貌环境数字模型中环境参数和巡视器数字模型中动力学状态参数的初始值,生成与训练科目对应的仿真试验环境;(4)构建脱困控制决策神经网络模型,并利用仿真试验环境对所述模型进行训练,得到训练好的脱困控制决策神经网络模型;(5)将训练好的脱困控制决策神经网络模型转移到外部仿真平台或实际应用平台上,进行脱困控制策略的实时验证和二次优化。2.根据权利要求1所述的一种地外星表危险场景脱困策略学习训练方法,其特征在于,所述步骤(3)中,根据训练科目设置地外星表地貌环境数字模型中环境参数和巡视器数字模型中动力学状态参数的初始值为n组不同的数值,生成与训练科目对应的n组仿真试验环境;所述步骤(4)中,构建脱困控制决策神经网络模型,并在n组仿真试验环境中对所述模型进行并行训练,得到训练好的脱困控制决策神经网络模型;所述n>1。3.根据权利要求1或2所述的一种地外星表危险场景脱困策略学习训练方法,其特征在于,所述步骤(4)中,在仿真试验环境中对所述模型进行训练的方法包括如下步骤:(41)当前时刻t时,脱困控制决策神经网络模型接收样本,根据样本进行决策并向巡视器输出控制指令,并基于决策结果计算损失函数值,对模型参数进行优化;所述样本包括仿真试验环境中地外星表地貌环境当前时刻t的环境参数、巡视器当前时刻t的动力学状态参数、上一时刻t
‑
1脱困控制决策神经网络模型向巡视器输出控制指令以及上一时刻脱困控制决策神经网络模型中的损失函数值;所述决策结果根据训练科目中的脱困胜负条件进行判定;所述脱困控制决策神经网络模型根据样本进行决策的约束条件包括巡视器运行规则;(42)下一时刻t+1时,巡视器根据控制指令执行动作;使t+1=t,并返回步骤(41),直至损失函数值收敛到预定值。4.根据权利要求1或2所述的一种地外星表危险场景脱困策略学习训练方法,其特征在于,所述步骤(1)中,地外星表地貌环境数字模型中的地貌特征包括地表沙石,基岩或软土中的一种或一种以上的组合,环境参数包括重力,地面硬度系数,加速比中的一种或一种以上的组合。5.根据权利要求1或2所述的一种地外星表危险场景脱困策略学习训练方法,其...
【专利技术属性】
技术研发人员:邢琰,胡海霞,王硕,黄煌,毛晓艳,魏春岭,彭勃,何健,贾永,
申请(专利权)人:北京控制工程研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。