下载一种基于风险估计的强化学习自动驾驶安全可解释决策方法的技术资料

文档序号:42204076

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明属于强化学习与自动驾驶领域,涉及一种基于风险估计的强化学习自动驾驶安全可解释决策方法。本发明包括以下步骤:基于Gym库搭建仿真环境并设置状态和动作空间;根据约束马尔可夫决策过程建模以处理安全约束;设置奖励函数;构建独立的风险估计模块和...
该专利属于大连理工大学所有,仅供学习研究参考,未经过大连理工大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。