下载一种统一的基于好奇心驱动的强化学习方法的技术资料

文档序号:26343618

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种统一的基于好奇心驱动的强化学习方法,用于智能体在奖励稀疏的情况下能够快速有效地学习策略。具体包括如下步骤:1)通过注意力模块获得状态可靠的特征表达;2)使用状态新颖性估计和前向动态预测来估计状态以及状态动作对的探索程度,即初...
该专利属于浙江大学所有,仅供学习研究参考,未经过浙江大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。