下载基于强化学习的非完备信息博弈的模型决策方法及系统的技术资料

文档序号:29940663

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明提供一种基于强化学习的非完备信息博弈的模型决策方法及系统,方法包括:获取博弈模型的场面信息;根据场面信息分别获得模型中目标函数的当前更新对局轨迹的策略熵、及当前更新对局轨迹的散度项;根据当前更新对局轨迹的策略熵、及当前更新对局轨迹的散...
该专利属于中至江西智能技术有限公司所有,仅供学习研究参考,未经过中至江西智能技术有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。