下载基于深度强化学习方法的中国象棋博弈学习方法及系统的技术资料

文档序号:30704042

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明提供了一种基于深度强化学习方法的中国象棋博弈学习方法及系统,包括:步骤S1:将局面特征输入深度卷积神经网络,输出当前局面评估值和所有合法着法的概率;步骤S2:当前局面根据当前局面评估值和合法着法的概率,利用蒙特卡洛树搜索对当前局面进行...
该专利属于上海燧原科技有限公司所有,仅供学习研究参考,未经过上海燧原科技有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。