一种山路自动驾驶的控制方法及系统技术方案

技术编号：35704529 阅读：21 留言：0更新日期：2022-11-23 15:00

本申请公开了一种山路自动驾驶的控制方法及系统，涉及自动驾驶领域，方法应用于一山路自动驾驶的控制系统，包括：通过自动驾驶仿真器TORCS建立山路模拟环境，遍历山路模拟环境设计自动驾驶任务集合；将自动驾驶任务集合转换为马尔可夫决策元组；基于python语言，利用PyTorch框架，建立TAD3算法模型；根据马尔可夫决策元组，基于演员

全部详细技术资料下载

【技术实现步骤摘要】
一种山路自动驾驶的控制方法及系统

[0001]本专利技术涉及自动驾驶相关
，具体涉及一种山路自动驾驶的控制方法及系统。

技术介绍

[0002]随着人工智能、物联网的研究不断深入，汽车行业的自动驾驶朝着电动化、网联化、智能化的方向快速发展，深度学习在自动驾驶领域具有巨大的潜力，在诸多深度学习算法中，深度强化学习可以使智能体不断学习周围的环境状态，进而依据周围实时的环境状态给出当前较佳的行驶控制方案。
[0003]自动驾驶技术在面对简单的道路环境中使用传统的强化学习训练得到的智能体尚能做出相对准确的行驶策略，但是在山区道路中，由于山区弯路、道路不平整、上下坡路、道路窄道等各类场景错综复杂，导致道路场景较为复杂，使用传统的强化学习训练智能体，由于复杂的道路场景，导致训练数据需求较多，且模型难以收敛，导致训练效率低下，学习效果较差。
[0004]综上所述，现有技术中由于传统的强化学习方式无法快速得到适用于山区场景的自动化驾驶控制的智能体，导致存在缺乏可快速训练确定，且对山区道路适应性较强的智能体的技术问题。

技术实现思路

[0005]本申请实施例通过提供了一种山路自动驾驶的控制方法及系统，解决了现有技术中由于传统的强化学习方式无法快速得到适用于山区场景的自动化驾驶控制的智能体，导致存在缺乏可快速训练确定，且对山区道路适应性较强的智能体的技术问题。
[0006]鉴于上述问题，本申请实施例提供了一种山路自动驾驶的控制方法及系统。
[0007]第一方面，本申请实施例提供了一种山...

【技术保护点】

【技术特征摘要】
1.一种山路自动驾驶的控制方法，其特征在于，所述方法应用于一山路自动驾驶的控制系统，所述方法包括：通过自动驾驶仿真器TORCS建立山路模拟环境，遍历所述山路模拟环境设计自动驾驶任务集合；将所述自动驾驶任务集合转换为马尔可夫决策元组；基于python语言，利用PyTorch框架，建立TAD3算法模型；根据所述马尔可夫决策元组，基于演员
‑
评论家算法，对所述TAD3算法模型进行训练，生成山路自动驾驶控制智能体。2.如权利要求1所述的方法，其特征在于，所述通过自动驾驶仿真器TORCS建立山路模拟环境，遍历所述山路模拟环境设计自动驾驶任务集合，包括：通过所述自动驾驶仿真器TORCS建立所述山路模拟环境；根据所述山路模拟环境，设计第一自动驾驶任务，其中，所述第一自动驾驶任务具有第一评价标准，所述第一评价标准为车道线保持；根据所述山路模拟环境，设计第二自动驾驶任务，其中，所述第一自动驾驶任务具有第二评价标准，所述第二评价标准为圈速；将所述第一自动驾驶任务和所述第一评价标准、所述第二自动驾驶任务和所述第二评价标准，添加进所述自动驾驶任务集合。3.如权利要求2所述的方法，其特征在于，所述通过所述自动驾驶仿真器TORCS建立所述山路模拟环境中的所述山路模拟环境的车辆模型为car1
‑
trb1模型。4.如权利要求2所述的方法，其特征在于，所述将所述自动驾驶任务集合转换为马尔可夫决策元组，包括：遍历所述自动驾驶任务集合提取评价标准集合，设定奖励函数；构建马尔可夫决策元组结构式：<S,A,P,R,γ>,γ∈[0,1]其中，S为车辆状态信息，A为车辆控制动作，R为奖励函数，P为状态转移函数，γ为衰减率；通过所述奖励函数和所述马尔可夫决策元组结构式，遍历所述自动驾驶任务集合转换为所述马尔可夫决策元组。5.如权利要求4所述的方法，其特征在于，所述遍历所述自动驾驶任务集合提取评价标准集合，设定奖励函数，包括：当所述自动驾驶任务的评价标准为所述第一评价标准时，构建第一奖励函数：其中，r
1t
为第一评价标准对应的奖励值，v
x
为车辆在x轴的速度，α为车辆朝向与道路中线的夹角，d为车辆与道路中线的距离；当所述自动驾驶任务的评价标准为所述第二评价标准时，构建第二奖励函数：
其中，r
2t
为第二评价标准的奖励值，v
x
为车辆在x轴的速度，α为车辆朝向与道路中线的夹角，d为车辆与道路中线的距离，λ为平衡奖...

【专利技术属性】
技术研发人员：王广玮，颜宇，赵津，
申请(专利权)人：贵州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人