【技术实现步骤摘要】
一种基于深度强化学习算法的车辆汇合控制方法
本专利技术涉及一种基于深度强化学习算法的车辆汇合控制方法,属于汽车驾驶控制的
技术介绍
随着人工智能技术的不断突破,汽车在自动驾驶方面结合人工智能技术中的深度学习、机器学习后,自动驾驶的水平也取得了明显的进步。深度强化学习作为人工智能的重要方向,其原理为智能体在设定的环境中与环境进行交互,智能体在环境中做出动作,环境对动作进行奖励,智能体根据动作来进行学习,原理相当于人类的自学习进化过程,当算法设计合理时,理论上可以比人类开车更优秀,所以将深度强化学习应用于自动驾驶具有无限的可能性,目前已经有很多公司研究将深度强化学习应用于自动驾驶领域。强化学习是人工智能中的重要分支,但目前深度强化学习算法的发展水平表明其适合处理简单场景的任务,同时算法的输出是基于概率模型,也就是说其输出具有不确定性。但自动驾驶面对的是一个复杂的场景,而且自动驾驶对安全性要求很高,深度强化学习的这种不确定性对其在自动驾驶领域的应用造成很大的影响。目前,如图1所示,深度强化学习在自 ...
【技术保护点】
1.一种基于深度强化学习算法的车辆汇合控制方法,其特征在于,包括以下步骤:/n步骤1、将车辆汇合场景分解为若干个问题点,并划分为适合和不适合深度强化学习训练的问题点两种;/n步骤2、对所划分的适合深度强化学习训练的问题点,利用提取出车辆汇合场景中的特征值并输入深度强化学习算法进行训练,得到各问题点的预测汇合信息;/n步骤3、对所划分的不适合深度强化学习训练的问题点,利用特征提取方法直接提取出车辆汇合场景中的特征值,并将不适合深度强化学习训练的问题点提取的特征值与步骤2所得各问题点的预测汇合信息结合进行汇合的逻辑判断,得到汇合控制结果并执行。/n
【技术特征摘要】
1.一种基于深度强化学习算法的车辆汇合控制方法,其特征在于,包括以下步骤:
步骤1、将车辆汇合场景分解为若干个问题点,并划分为适合和不适合深度强化学习训练的问题点两种;
步骤2、对所划分的适合深度强化学习训练的问题点,利用提取出车辆汇合场景中的特征值并输入深度强化学习算法进行训练,得到各问题点的预测汇合信息;
步骤3、对所划分的不适合深度强化学习训练的问题点,利用特征提取方法直接提取出车辆汇合场景中的特征值,并将不适合深度强化学习训练的问题点提取的特征值与步骤2所得各问题点的预测汇合信息结合进行汇合的逻辑判断,得到汇合控制结果...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。