温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明实施例提供一种面向多智能体对抗的强化学习训练优化方法及装置,该方法包括:规则耦合算法训练流程,包括:对于每个训练步,获取红方多智能体初始的第一状态结果集,若红方多智能体初始的第一状态结果集满足预设动作规则,则根据预设动作规则获取决策行...该专利属于中国人民解放军军事科学院国防科技创新研究院所有,仅供学习研究参考,未经过中国人民解放军军事科学院国防科技创新研究院授权不得商用。