一种集中式车群决策控制方法、装置及电子设备制造方法及图纸

技术编号：32503516 阅读：9 留言：0更新日期：2022-03-02 10:12

本申请提供的集中式车群决策控制方法、装置及电子设备，应用于路侧智能设备，通过获取当前控制区域中各车辆的车辆行驶信息和各路侧感知设备检测到的道路交通状态信息，以得到当前控制区域下交通环境的全局感知信息；基于预设的车群决策控制模型，根据全局感知信息，确定各车辆的驾驶决策，并将驾驶决策发送到各车辆；在各车辆按照驾驶决策行驶后，重新检测当前控制区域下交通环境的全局感知信息，得到更新后的全局感知信息；根据更新后的全局感知信息和各车辆的驾驶决策，优化车群决策控制模型。通过利用路侧智能设备对车群进行集中决策控制，每次模型优化也仅针对路侧智能设备中的车群决策控制模型，提高了车辆自动驾驶决策的控制效率。控制效率。控制效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种集中式车群决策控制方法、装置及电子设备

[0001]本申请涉及车辆控制
，尤其涉及一种集中式车群决策控制方法、装置及电子设备。

技术介绍

[0002]现代城市交通中，辅助驾驶/自动驾驶作为最有潜力改善交通状况、提升出行安全与便捷程度的方式，受到越来越多的关注。现代社会的道路交通条件十分复杂，存在机动车数量多且车流密度大的特点，因此，为了提高车辆行车安全，如何基于全局信息进行车群决策控制成为了重点研究内容。
[0003]在现有技术中，通常是当前车辆将获取的感知信息与其他车辆进行共享，每辆车基于全局环境状态信息分别进行决策。
[0004]但是，基于全局环境信息同时训练多个自动驾驶策略的难度大、时间长，且车载计算设备难以满足算力需求，无法保证车辆自动驾驶决策的控制效率。

技术实现思路

[0005]本申请提供一种集中式车群决策控制方法、装置及电子设备，以解决现有技术无法保证车辆自动驾驶决策的控制效率等缺陷。
[0006]本申请第一个方面提供一种集中式车群决策控制方法，应用于路侧智能设备，所述方法包括：获取当前控制区域中各车辆的车辆行驶信息和各路侧感知设备检测到的道路交通状态信息，以得到所述当前控制区域下交通环境的全局感知信息；基于预设的车群决策控制模型，根据所述全局感知信息，确定各所述车辆的驾驶决策，并将所述驾驶决策发送到各所述车辆，以使各所述车辆按照所述驾驶决策行驶；在各所述车辆按照所述驾驶决策行驶后，重新检测所述当前控制区域下交通环境的全局感知信息，以得到更新后的全局感知...

【技术保护点】

【技术特征摘要】
1.一种集中式车群决策控制方法，应用于路侧智能设备，其特征在于，所述方法包括：获取当前控制区域中各车辆的车辆行驶信息和各路侧感知设备检测到的道路交通状态信息，以得到所述当前控制区域下交通环境的全局感知信息；基于预设的车群决策控制模型，根据所述全局感知信息，确定各所述车辆的驾驶决策，并将所述驾驶决策发送到各所述车辆，以使各所述车辆按照所述驾驶决策行驶；在各所述车辆按照所述驾驶决策行驶后，重新检测所述当前控制区域下交通环境的全局感知信息，以得到更新后的全局感知信息；根据所述更新后的全局感知信息和各所述车辆的驾驶决策，优化所述车群决策控制模型。2.根据权利要求1所述的方法，其特征在于，所述基于预设的车群决策控制模型，根据所述全局感知信息，确定各所述车辆的驾驶决策，包括：将所述全局感知信息输入到所述车群决策控制模型，以得到车群的联合动作集合；根据所述联合动作集合，确定各所述车辆的驾驶决策；其中，所述驾驶决策包括驾驶动作。3.根据权利要求1所述的方法，其特征在于，在根据所述更新后的全局感知信息和各所述车辆的驾驶决策，优化所述车群决策控制模型之前，所述方法包括：根据更新后的全局感知信息和各所述车辆的驾驶决策，确定车群的联合奖励；对所述更新后的全局感知信息、当前各所述车辆的驾驶决策、车群的联合奖励和原始的全局感知信息进行数据整合，得到所述车群决策控制模型的学习经历数据；将所述学习经历数据存储至回放缓冲区。4.根据权利要求3所述的方法，其特征在于，所述根据所述更新后的全局感知信息和各所述车辆的驾驶决策，优化所述车群决策控制模型，包括：从所述回放缓冲区中提取多条学习经历数据，并将所述多条学习经历数据作为模型训练样本；计算各所述模型训练样本的目标价值；根据各所述模型训练样本的目标价值，更新所述车群决策控制模型中的评价网络和策略网络的参数，以优化所述车群决策控制模型。5.根据权利要求4所述的方法，其特征在于，所述计算各所述模型训练样本的目标价值，包括：针对每个模型训练样本，基于预设的目标策略网络，根据所述模型训练样...

【专利技术属性】
技术研发人员：李茹杨，赵坤，李雪雷，邓琪，魏辉，卢丽华，
申请(专利权)人：苏州浪潮智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人