下载一种基于模仿学习的深度强化学习策略优化防御方法和装置的技术资料

文档序号:28675708

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种基于模仿学习的深度强化学习策略优化防御方法和装置,包括:搭建深度强化学习的智能体自动驾驶模拟环境,基于强化学习中的深度Q网络构建目标智能体,对目标智能体进行强化学习以优化深度Q网络的参数;利用参数优化的深度Q网络产生T个时刻...
该专利属于浙江工业大学所有,仅供学习研究参考,未经过浙江工业大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。