温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明公开了一种基于专家经验的强化学习方法,包含如下步骤:在外部的智能体中创建专家数据缓冲器、优先级数据缓冲器、目标网络、预测网络、策略网络、learner模块与若干个worker模块;对任务环境进行数据采集,获得若干组第一经验数据与若干组...该专利属于中国人民解放军军事科学院战争研究院所有,仅供学习研究参考,未经过中国人民解放军军事科学院战争研究院授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明公开了一种基于专家经验的强化学习方法,包含如下步骤:在外部的智能体中创建专家数据缓冲器、优先级数据缓冲器、目标网络、预测网络、策略网络、learner模块与若干个worker模块;对任务环境进行数据采集,获得若干组第一经验数据与若干组...