下载一种连续动作控制强化学习框架及学习方法的技术资料

文档序号:38845422

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种连续动作控制强化学习框架及学习方法,涉及人工智能技术领域。该学习框架包括:多步状态转移学习模块,用于采用卷积神经网络学习多步状态转移,更新策略;期望估计模块,用于采用多步时序差分算法估计多步累计回报的期望;样本聚类模块,用于...
该专利属于西湖大学所有,仅供学习研究参考,未经过西湖大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。