下载基于双流信息瓶颈的深度强化学习行动者-评价者网络结构的车辆路径跟踪控制方法的技术资料

文档序号:44601898

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

基于双流信息瓶颈的深度强化学习行动者‑评价者网络结构及对四轮独立转向独立驱动车辆的路径跟踪控制方法,包括:在Critic网络中,在Q值估计之前加入已知信息瓶颈模块,从中提取已知类信息,并设计训练目标以最小化时间差分误差、最小化互信息、并约束...
该专利属于浙江工业大学所有,仅供学习研究参考,未经过浙江工业大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。