下载自动化控制的训练过程的加速方法的技术资料

文档序号:39001490

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了自动化控制的训练过程的加速方法,包括:建立强化学习环境,初始化砖瓦编码器;初始化时间窗口、时间窗口最大值和回退间隔;判断智能体的当前步数是否与上一次回退时的步数相差了一个回退间隔,若是,则智能体回退到时间窗口中具有最大Q值的状态...
该专利属于南京邮电大学所有,仅供学习研究参考,未经过南京邮电大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。