当前位置: 首页 > 专利查询>同济大学专利>正文

数据驱动的交叉口车辆复杂交互行为策略仿真方法和系统技术方案

技术编号:45836896 阅读:8 留言:0更新日期:2025-07-15 22:43
本发明专利技术涉及一种数据驱动的交叉口车辆复杂交互行为策略仿真方法和系统,方法包括:获取真实的交叉口车辆的交通轨迹数据,构建多个交互场景,提取各个时间步的观测信息,得到真实的车辆轨迹数据;以每个车辆作为智能体,基于预先按车辆类型构建的高斯策略网络,利用基于目标导向增益奖励以及来自判别器的奖励估计器计算奖励,生成模拟的车辆轨迹数据;基于所述真实的车辆轨迹数据和所述模拟的车辆轨迹数据,分别提取观察值‑动作对信息,以最大程度区分不同属性信息为目标更新智能体的判别器,同时,以最大程度混淆判别器为目标,更新生成器中的高斯策略网络和值估计器网络,实现基于多智能体对抗逆向强化学习的车辆复杂交互行为策略仿真。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其是涉及一种数据驱动的交叉口车辆复杂交互行为策略仿真方法和系统


技术介绍

1、近年来,自动驾驶汽车(autonomous vehicle,av)发展迅速,为应对自动驾驶测试公认的百亿里程实车道路测试难题,虚拟仿真测试已成为自动驾驶测试技术的核心手段,其有效性依赖于对实际交通流的高精度仿真。为更好地测试av与其他车辆的社会交互能力,需要生成能精细模拟实际交通流中复杂交互社会行为的背景交通流。策略是车辆执行加速、减速、转向等具体动作的上层指导,只有准确把握时变且多样的社会交互策略,才能精准模拟车辆的运动状态,进而精细刻画交通流的社会交互行为。因此,建立一种能够同时精准刻画车辆动态交互策略和运动状态的交通流仿真模型至关重要,以适应av社会交互能力测试需求。

2、现有研究对微观驾驶行为建模的方法主要分为机理驱动和数据驱动两类。机理驱动模型通常采用数学或物理模型来表征驾驶行为,然而受到模型表达能力的限制,需要简化交互规则,导致仿真结果较为单一,限制了在复杂交互环境下对策略和动作进行高精度仿真的可能性。数据驱动模型一定程度上弥补了本文档来自技高网...

【技术保护点】

1.一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,在所述的提取各个时间步的观察值过程中,观测空间包括:

3.根据权利要求1所述的一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,所述的智能体的动作空间建模为:

4.根据权利要求1所述的一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,所述的判别器包括与智能体数量相对应的二分类函数,用于区分观察值-动作对来自真实轨迹还是生成器,所述的判别器包括奖励估计器与势函数,所...

【技术特征摘要】

1.一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,在所述的提取各个时间步的观察值过程中,观测空间包括:

3.根据权利要求1所述的一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,所述的智能体的动作空间建模为:

4.根据权利要求1所述的一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,所述的判别器包括与智能体数量相对应的二分类函数,用于区分观察值-动作对来自真实轨迹还是生成器,所述的判别器包括奖励估计器与势函数,所述奖励估计器用于为生成器提供奖励。

5.根据权利要求1所述的一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,所述的生成器包括策略网络与值估计器网络,所述的策略网络为基于多层感知器构建的用于表征高维连续动作空间的高斯策略网络,所述的值估计器网络基于多层感知器构建,所述值估计器网络用于估计在智能体的状态为ot,其他智能体采取动作a-i,t的条件下,策略πi...

【专利技术属性】
技术研发人员:倪颖王诗菡孙杰孙剑
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1