下载一种基于强化学习PPO2算法的无人艇位姿控制方法的技术资料

文档序号:32435545

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种基于强化学习PPO2算法的无人艇位姿控制方法,包括无人艇环境建模;根据无人艇的情况设置动作和状态空间;设置奖励目标权重,基于所需无人艇控制目标设置奖励函数来控制无人艇;设计深度神经网络,包括状态价值函数估计器网络和策略网络;...
该专利属于江苏科技大学所有,仅供学习研究参考,未经过江苏科技大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。