温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明实施例提供一种面向超实时仿真环境的分布式强化学习训练方法及装置,所述方法包括:通过将超实时仿真环境与行动器部署在同一台虚拟机上,并控制超实时仿真环境在向所述行动器发送环境观察时添加包含有动作指令最晚反馈时间限制信息的附加信息戳,控制行...该专利属于中国人民解放军军事科学院战争研究院所有,仅供学习研究参考,未经过中国人民解放军军事科学院战争研究院授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明实施例提供一种面向超实时仿真环境的分布式强化学习训练方法及装置,所述方法包括:通过将超实时仿真环境与行动器部署在同一台虚拟机上,并控制超实时仿真环境在向所述行动器发送环境观察时添加包含有动作指令最晚反馈时间限制信息的附加信息戳,控制行...