一种面向混合行为空间的批约束离线强化学习算法制造技术资料下载

当前位置: 首页 > 专利查询>北京航空航天大学 > 一种面向混合行为空间的批约束离线强化学习算法制造技术 >技术资料下载

下载一种面向混合行为空间的批约束离线强化学习算法的技术资料

文档序号：36447983

温馨提示：您尚未登录，请点登陆后下载，如果您还没有账户请点注册，登陆完成后，请刷新本页查看技术详细信息。

本发明公开了一种面向混合行为空间的批约束离线强化学习算法，属于计算机生成兵力对抗决策建模领域。针对混合行为空间的兵力行为决策问题进行针对性的算法设计，本发明提出了一种面向混合行为空间的批约束离线强化学习算法，采用离线强化学习范式，脱离与仿真...
该专利属于北京航空航天大学所有，仅供学习研究参考，未经过北京航空航天大学授权不得商用。

详细技术文档下载地址

温馨提示：您尚未登录，请点登陆后下载，如果您还没有账户请点注册，登陆完成后，请刷新本页查看技术详细信息。