下载一种基于深度确定性策略梯度的自适应控制方法的技术资料

文档序号:27936581

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明提供了一种基于深度确定性策略梯度的自适应控制方法,依据真实系统特性构建的仿真训练环境;构建状态(观测量),回报函数,截止条件,动作;构建深度确定性策略梯度方法的critic网络、actor网络和相应的目标网络,通过与仿真训练环境的试错...
该专利属于沈阳航盛科技有限责任公司所有,仅供学习研究参考,未经过沈阳航盛科技有限责任公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。