下载利用合成环境改进强化学习的设备和方法的技术资料

文档序号:34170716

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

提供了利用合成环境改进强化学习的设备和方法。一种用于学习策略()的计算机实现的方法和/或用于学习合成环境的方法,其中所述策略被配置为控制智能体,包括以下步骤:提供合成环境参数()和真实环境()以及策略群体。后续,重复以下步骤达预定次数的重复...
该专利属于罗伯特所有,仅供学习研究参考,未经过罗伯特授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。