下载一种面向混合行为空间的批约束离线强化学习算法的技术资料

文档序号:36447983

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种面向混合行为空间的批约束离线强化学习算法,属于计算机生成兵力对抗决策建模领域。针对混合行为空间的兵力行为决策问题进行针对性的算法设计,本发明提出了一种面向混合行为空间的批约束离线强化学习算法,采用离线强化学习范式,脱离与仿真...
该专利属于北京航空航天大学所有,仅供学习研究参考,未经过北京航空航天大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。