下载一种计算机实现的方法及其系统的技术资料

文档序号:40020719

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

用于训练强化学习系统的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。在一个方面,训练动作选择策略神经网络以用于选择要由导航经过环境以实现一个或多个目标的代理执行的动作的方法包括:接收表征环境的当前状态的观察图像;使用动作选择策略...
该专利属于渊慧科技有限公司所有,仅供学习研究参考,未经过渊慧科技有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。