一种基于深度强化学习算法的车辆汇合控制方法技术

技术编号：27920728 阅读：33 留言：0更新日期：2021-04-02 13:57

本发明专利技术公开了一种基于深度强化学习算法的车辆汇合控制方法，包括：将车辆汇合场景分解为若干个问题点，并划分为适合和不适合深度强化学习训练的问题点两种；对所划分的适合深度强化学习训练的问题点，利用提取出车辆汇合场景中的特征值并输入深度强化学习算法进行训练，得到各问题点的预测汇合信息；对所划分的不适合深度强化学习训练的问题点，利用特征提取方法直接提取出车辆汇合场景中的特征值，并将与所得各问题点的预测汇合信息结合进行汇合的逻辑判断，得到汇合控制结果并执行。本发明专利技术简化了深度强化学习的训练难度，深化了汇合逻辑判断的程度，使得汇合控制过程的结果更加准确，提高车辆在自动汇合控制中的安全性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度强化学习算法的车辆汇合控制方法
本专利技术涉及一种基于深度强化学习算法的车辆汇合控制方法，属于汽车驾驶控制的

技术介绍
随着人工智能技术的不断突破，汽车在自动驾驶方面结合人工智能技术中的深度学习、机器学习后，自动驾驶的水平也取得了明显的进步。深度强化学习作为人工智能的重要方向，其原理为智能体在设定的环境中与环境进行交互，智能体在环境中做出动作，环境对动作进行奖励，智能体根据动作来进行学习，原理相当于人类的自学习进化过程，当算法设计合理时，理论上可以比人类开车更优秀，所以将深度强化学习应用于自动驾驶具有无限的可能性，目前已经有很多公司研究将深度强化学习应用于自动驾驶领域。强化学习是人工智能中的重要分支，但目前深度强化学习算法的发展水平表明其适合处理简单场景的任务，同时算法的输出是基于概率模型，也就是说其输出具有不确定性。但自动驾驶面对的是一个复杂的场景，而且自动驾驶对安全性要求很高，深度强化学习的这种不确定性对其在自动驾驶领域的应用造成很大的影响。目前，如图1所示，深度强化学习在自...

【技术保护点】
1.一种基于深度强化学习算法的车辆汇合控制方法，其特征在于，包括以下步骤：/n步骤1、将车辆汇合场景分解为若干个问题点，并划分为适合和不适合深度强化学习训练的问题点两种；/n步骤2、对所划分的适合深度强化学习训练的问题点，利用提取出车辆汇合场景中的特征值并输入深度强化学习算法进行训练，得到各问题点的预测汇合信息；/n步骤3、对所划分的不适合深度强化学习训练的问题点，利用特征提取方法直接提取出车辆汇合场景中的特征值，并将不适合深度强化学习训练的问题点提取的特征值与步骤2所得各问题点的预测汇合信息结合进行汇合的逻辑判断，得到汇合控制结果并执行。/n

【技术特征摘要】
1.一种基于深度强化学习算法的车辆汇合控制方法，其特征在于，包括以下步骤：
步骤1、将车辆汇合场景分解为若干个问题点，并划分为适合和不适合深度强化学习训练的问题点两种；
步骤2、对所划分的适合深度强化学习训练的问题点，利用提取出车辆汇合场景中的特征值并输入深度强化学习算法进行训练，得到各问题点的预测汇合信息；
步骤3、对所划分的不适合深度强化学习训练的问题点，利用特征提取方法直接提取出车辆汇合场景中的特征值，并将不适合深度强化学习训练的问题点提取的特征值与步骤2所得各问题点的预测汇合信息结合进行汇合的逻辑判断，得到汇合控制结果...

【专利技术属性】
技术研发人员：董舒，
申请(专利权)人：的卢技术有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人