【技术实现步骤摘要】
本专利技术属于交通
,涉及。
技术介绍
人工智能是现代科学
的一个重要方向,是实现系统智能化、提高系统性能的重要手段。人工智能方法是一个横断技术,可以应用于各个学科领域。在道路交通信号控制领域,现有技术采用的是20世纪60年代至80年代的科学技术,这些技术在处理庞大的状态空间和解空间问题上具有很大的局限性。城市道路交叉口信号配时涉及庞大的状态空间和解空间,现有技术对交叉口信号配时问题作了诸多简化。城市路网交通拥堵是近些年国内外大中城市面临的一个难题,经常出现车辆排队至上游路口造成路网死锁的严重拥堵情况。以排队长度为优化目标应对我国机动车保有量井喷式增长具有重要的理论价值和现实意义。目前城市交叉口信号配时技术的智能化程度较低,不能够从经验中改善系统性能,对系统经历过的状态无记忆性。风险敏感的强化学习技术为交通信号控制的智能化提供了一个途径,适合交通信号控制的无导师学习、动态学习、在线学习的特点。交通信号控制的现有技术主要有三种=Transyt系统采用历史数据优化配时方案,SCOOT系统采用检测器数据优化配时方案,优化方法均为爬山法,SCOOT系统可称为 ...
【技术保护点】
一种优化信号交叉口排队长度的在线学习方法,其特征在于,包括以下步骤:(1)状态、行为、奖赏选取11)以各相位关键车流的排队长度组成的向量作为状态,为了提高计算效率,状态空间采用离散形式,离散步长为平均排队长度差的整数倍数;12)以各相位绿灯时间组成的向量作为行为,采用动态行为集技术:首先计算各相位关键车流的平均排队长度占交叉口总排队长度的比例,然后将这一比例乘以事先确定的周期长度,得到各相位的基准绿灯时间,以基准绿灯时间为原点,以周期的某一比例值作为半径,构成各相位绿灯时间的行为集;13)以各相位关键车流的加权排队长度差的绝对值之和作为奖赏,优化目标是等排队长度,通过权重系 ...
【技术特征摘要】
1.一种优化信号交叉口排队长度的在线学习方法,其特征在于,包括以下步骤: (1)状态、行为、奖赏选取 11)以各相位关键车流的排队长度组成的向量作为状态,为了提高计算效率,状态空间采用离散形式,离散步长为平均排队长度差的整数倍数; 12)以各相位绿灯时间组成的向量作为行为,采用动态行为集技术:首先计算各相位关键车流的平均排队长度占交叉口总排队长度的比例,然后将这一比例乘以事先确定的周期长度,得到各相位的基准绿灯时间,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。