【技术实现步骤摘要】
本专利技术涉及计算机,尤其是涉及一种数据驱动的交叉口车辆复杂交互行为策略仿真方法和系统。
技术介绍
1、近年来,自动驾驶汽车(autonomous vehicle,av)发展迅速,为应对自动驾驶测试公认的百亿里程实车道路测试难题,虚拟仿真测试已成为自动驾驶测试技术的核心手段,其有效性依赖于对实际交通流的高精度仿真。为更好地测试av与其他车辆的社会交互能力,需要生成能精细模拟实际交通流中复杂交互社会行为的背景交通流。策略是车辆执行加速、减速、转向等具体动作的上层指导,只有准确把握时变且多样的社会交互策略,才能精准模拟车辆的运动状态,进而精细刻画交通流的社会交互行为。因此,建立一种能够同时精准刻画车辆动态交互策略和运动状态的交通流仿真模型至关重要,以适应av社会交互能力测试需求。
2、现有研究对微观驾驶行为建模的方法主要分为机理驱动和数据驱动两类。机理驱动模型通常采用数学或物理模型来表征驾驶行为,然而受到模型表达能力的限制,需要简化交互规则,导致仿真结果较为单一,限制了在复杂交互环境下对策略和动作进行高精度仿真的可能性。数据驱动
...【技术保护点】
1.一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,在所述的提取各个时间步的观察值过程中,观测空间包括:
3.根据权利要求1所述的一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,所述的智能体的动作空间建模为:
4.根据权利要求1所述的一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,所述的判别器包括与智能体数量相对应的二分类函数,用于区分观察值-动作对来自真实轨迹还是生成器,所述的判别器包括奖
...【技术特征摘要】
1.一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,在所述的提取各个时间步的观察值过程中,观测空间包括:
3.根据权利要求1所述的一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,所述的智能体的动作空间建模为:
4.根据权利要求1所述的一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,所述的判别器包括与智能体数量相对应的二分类函数,用于区分观察值-动作对来自真实轨迹还是生成器,所述的判别器包括奖励估计器与势函数,所述奖励估计器用于为生成器提供奖励。
5.根据权利要求1所述的一种数据驱动的交叉口车辆复杂交互行为策略仿真方法,其特征在于,所述的生成器包括策略网络与值估计器网络,所述的策略网络为基于多层感知器构建的用于表征高维连续动作空间的高斯策略网络,所述的值估计器网络基于多层感知器构建,所述值估计器网络用于估计在智能体的状态为ot,其他智能体采取动作a-i,t的条件下,策略πi...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。