下载基于短时访问机制的强化学习方法、装置及存储介质的技术资料

文档序号:26260151

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本公开涉及一种基于短时访问机制的强化学习方法、装置及存储介质,其中,该方法包括:配置状态缓存列表,用于存储智能体在符合预设短时访问机制情况下当前环境状态变化得到的状态增量信息;将智能体下一时刻的所有动作输入环境状态转移概率模型中,输出所有动...
该专利属于清华大学所有,仅供学习研究参考,未经过清华大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。