温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明是关于一种基于集群节点计算梯度的分布式强化学习方法及装置。其中,该方法包括:基于深度强化学习策略网络的训练场景,通过对初始化集群节点进行构建,生成初始化网络参数;基于所述初始化网络参数,通过所述初始化集群节点对预设模型环境进行交互,生...该专利属于中国船舶集团有限公司系统工程研究院所有,仅供学习研究参考,未经过中国船舶集团有限公司系统工程研究院授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明是关于一种基于集群节点计算梯度的分布式强化学习方法及装置。其中,该方法包括:基于深度强化学习策略网络的训练场景,通过对初始化集群节点进行构建,生成初始化网络参数;基于所述初始化网络参数,通过所述初始化集群节点对预设模型环境进行交互,生...