温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明一种基于优势函数引导注意力机制的机器人运动控制方法及系统,该方法步骤包括:S1.从离线数据集中提取多条历史运动轨迹数据构成训练数据集,输入至转换器中进行训练;S2.根据生成的动作集合以及状态集合构建双状态动作值网络与价值网络,通过迭代...该专利属于中国人民解放军国防科技大学所有,仅供学习研究参考,未经过中国人民解放军国防科技大学授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明一种基于优势函数引导注意力机制的机器人运动控制方法及系统,该方法步骤包括:S1.从离线数据集中提取多条历史运动轨迹数据构成训练数据集,输入至转换器中进行训练;S2.根据生成的动作集合以及状态集合构建双状态动作值网络与价值网络,通过迭代...