当前位置: 首页 > 专利查询>北京市地铁运营有限公司技术创新研究院分公司专利>正文

基于强化学习的车站客流实时推演模型建立方法及系统技术方案

技术编号：39658944 阅读：9 留言：0更新日期：2023-12-09 11:28

本说明书实施例提供了一种基于强化学习的车站客流实时推演模型建立方法及系统，其中，方法包括：基于系统动力学对车站系统结构及各区域间乘客流动因果关系进行识别和判断，根据识别判断结果构建车站客流演化仿真模型；以实时监控视频数据为基础，以仿真误差最小为目标，利用强化学习算法对乘客选择行为参数值不断进行学习优化，构建乘客选择行为实时修正模型，其中，所述乘客选择行为实时修正模型用于对车站客流演化仿真模型中乘客选择行为参数进行动态调整；将乘客选择行为实时修正模型嵌入车站客流演化仿真模型，建立基于强化学习的车站客流实时推演模型

全部详细技术资料下载

【技术实现步骤摘要】
基于强化学习的车站客流实时推演模型建立方法及系统

[0001]本文件涉及计算机
，尤其涉及一种基于强化学习的车站客流实时推演模型建立方法及系统
。

技术介绍

[0002]随着我国城市经济的迅速发展和城市人口的不断增加，城市地面交通拥堵问题也更加严峻，不仅阻碍了城市的可持续发展也影响着城市居民的正常出行
。
轨道交通作为城市出行方式中的重要一环，由于其独特的地下运营方式，不易受其他城市交通方式和天气的干扰，运输量更大，效率更高，因而成为了缓解地面交通压力的首选
。
同时，由于其以电力为主的运行方式，具有能效高，排放低的特点，对推动交通强国和智慧城市建设，发展绿色交通，能够发挥巨大作用
。
城市轨道交通能够充分发挥促进我国经济发展
、
方便人民群众生活
、
保障社会安全稳定的重要作用
。
[0003]随着城市轨道交通车站空间不断扩大，功能不断增加，车站内部结构更加立体复杂
、
各设备设施相互衔接协同工作，客流流线复杂交织，形成了一个庞杂的网络系统
。
复杂的车站空间环境增大了车站运营管理的难度，对保障乘客安全和车站的正常运营提出了更高的要求
。
基于历史自动售检票系统
(Automatic Fare Collection
，
AFC)
数据的客流组织方法无法准确揭示和分析轨道交通车站内部网络系统中客流的流动需求和演化机理，拥挤状态传播...

【技术保护点】

【技术特征摘要】
1.
一种基于强化学习的车站客流实时推演模型建立方法，其特征在于，包括：基于系统动力学对车站系统结构及各区域间乘客流动因果关系进行识别和判断，根据识别判断结果构建车站客流演化仿真模型；以实时监控视频数据为基础，以仿真误差最小为目标，利用强化学习算法对乘客选择行为参数值不断进行学习优化，构建乘客选择行为实时修正模型，其中，所述乘客选择行为实时修正模型用于对车站客流演化仿真模型中乘客选择行为参数进行动态调整；将乘客选择行为实时修正模型嵌入车站客流演化仿真模型，建立基于强化学习的车站客流实时推演模型
。2.
根据权利要求1所述的方法，其特征在于，所述方法进一步包括：利用所述车站客流实时推演模型进行车站客流实时推演
。3.
根据权利要求1所述的方法，其特征在于，所述基于系统动力学对车站系统结构及各区域间乘客流动因果关系进行识别和判断，根据识别判断结果构建车站客流演化仿真模型具体包括：将所述车站划分为站台
、
站厅和换乘通道三个区域，对三个区域内的客流状态
、
设施以及客流因果关系进行逻辑分析，生成车站系统结构的乘客流动因果关系结构树，基于所述乘客流动因果关系结构树对乘客流动因果关系进行量化，并构建系统动力学方程，基于所述系统动力学方程构建所述车站客流演化仿真模型，其中，所述系统动力学方程具体包括：站厅客流存量变化方程
、
站台客流存量变化方程
、
一般通道客流存量变化方程
、
换乘通道客流存量变化方程
、
站厅内楼扶梯处客流存量变化方程
、
检票处客流变化方程
、
下车客流变化方程以及上车客流变化方程
。4.
根据权利要求1所述的方法，其特征在于，所述以实时监控视频数据为基础，以仿真误差最小为目标，利用强化学习算法对乘客选择行为参数值不断进行学习优化，构建乘客选择行为实时修正模型具体包括：以实时监控视频数据为基础，引入实时视频客流数据，将监控区域处真实客流与仿真客流进行对比验证，将对比验证结果作为乘客选择行为实时修正模型参数的输入，以仿真误差最小为目标，利用强化学习算法
Q
‑
learning
对乘客选择行为参数不断进行学习优化，保持乘客选择行为参数的动态变化，构建乘客选择行为实时修正模型，其中，所述乘客选择行为参数包括路径选择行为和设备设施选择行为
。5.
根据权利要求1所述的方法，其特征在于，所述将乘客选择行为实时修正模型嵌入车站客流演化仿真模型，建立基于强化学习的车站客流实时推演模型具体包括：步骤1：确定时刻
t
＝
T
s
，其中，
T
s
为仿真开始时刻，设置时间步长为
Δ
t
；步骤2：初始化仿真环境并加载数据
,
构建车站客流演化仿真模型，其中，所述加载数据包括：进站客流量
,
下车客流量
,
节点的长宽高
、
最大容量
、
最大安全容量
、
最大流入流出能力
,
节点内乘客最大速度
,
节点间的流入流出关系以及乘客的选择行为参数初始值；步骤3：判断当前时刻
t
是否到达仿真结束时刻
T
q
，如果
t<T
q
，则执行步骤4，否则仿真结束；步骤4：获取实时视频客流数据，嵌入乘客选择行为实时修正模型，计算车站监控节点处仿真客流数据与真实客流数据的误差值；步骤5：建立基于强化学习的车站客流实时推演模型，更新
Q
值和误差值达到终止条件，
其中，所述终止条件为监控节点处仿真客流数据与真实客流数据的误差值是否达到要求的精度或达到系统规定的迭代次数；步骤6：更新选择节点的乘客选择行为参数；步骤7：更新车站列车节点的流入客流量和流出客流量；步骤8：更新车站除列车节点外其他节点的流入客流量和流出客流量；步骤9：更新车站各节点的客流存量；步骤
10
：更新车站各节点在下一时间步长允许流出的客流量；步骤
11
：更新车站各节点的动态属性，其中，所述动态属性包括客流密度
、
客流速度和乘客通过各节点的行走时长；步骤
12
：更新时间步长，使
t
＝
t+
Δ
t
，返回步骤
3。6.
一种基于强化学习的车站...

【专利技术属性】
技术研发人员：王雅观，秦勇，豆飞，魏运，郭建媛，王艳辉，管洋，张惠茹，孙璇，刘宇然，只巍，
申请(专利权)人：北京市地铁运营有限公司技术创新研究院分公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人