一种基于深度强化学习的自反馈客流控制方法及装置制造方法及图纸

技术编号：29404441 阅读：19 留言：0更新日期：2021-07-23 22:42

本申请提供了一种基于深度强化学习的自反馈客流控制方法以及装置。所述基于深度强化学习的自反馈客流控制方法包括：获取车站的当前时间点的历史时序数据、仿真数据以及短时预测数据；根据所述历史时序数据、仿真数据以及短时预测数据获取客流特征；根据所述客流特征获取车站设施能力负荷度评价；获取客流控制策略，所述客流控制策略包括多种控制行为；根据所述车站设施能力负荷度评价以及所述客流控制策略更新当前的车站客流控制决策方案。本申请根据客流历史时序数据、仿真数据以及短时预测数据对当前时间点的车站设施能力负荷度进行评价，一方面能够了解当前车站关键设施设备能力利用情况，另一方面可以根据当前车站关键设施设备能力利用情况反馈更新智能调整车站客流控制决策方案。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度强化学习的自反馈客流控制方法及装置
本申请属于轨道交通
，特别涉及一种基于深度强化学习的自反馈客流控制方法、基于深度强化学习的自反馈客流控制装置。
技术介绍
我国轨道交通事业正处于快速发展期，既有线及高铁线网规模持续扩张，但轨道站点滞留拥挤现象突出，经常导致站内过度拥挤，导致设计能力不能发挥，也使车站安全和乘客满意度受到严重影响，引起政府、轨道车站公众的极大关注。.目前，运营管理中对于控流站点的选取、控流时间范围及控流强度的设定主要依托管理部门的现场工作经验，缺乏合理的科学解释及验证，当遇到大型活动、异常气候、突发事件引发的突发性大客流时，由于缺乏有效的客流监测手段、客流趋势预测及预警评估技术手段，也缺乏明确妥当的处置策略，容易错失最佳处置时间，增加拥堵和产生客流踩踏风险。因此，希望有一种技术方案来克服或至少减轻现有技术的至少一个上述缺陷。
技术实现思路
本申请的目的是提供了一种基于深度强化学习的自反馈客流控制方法，以解决上述至少一方面的问题。在本申请的第一方面，一种基于深度强化学习的自反馈客流控制方法，所述基于深度强化学习的自反馈客流控制方法包括：获取车站的当前时间点的历史时序数据、仿真数据以及短时预测数据；根据所述历史时序数据、仿真数据以及短时预测数据获取客流特征；根据所述客流特征获取车站客流评分；获取客流控制策略，所述客流控制策略包括多种控制行为；根据所述车站客流评分以及所述客流控制策略更新当前时间点的车站客流...

【技术保护点】
1.一种基于深度强化学习的自反馈客流控制方法，其特征在于，所述基于深度强化学习的自反馈客流控制方法包括：/n获取车站的当前时间点的客流历史时序数据、仿真数据以及短时预测数据；/n根据所述客流历史时序数据、仿真数据以及短时预测数据提取环境特征；/n根据所述环境特征获取车站设施能力负荷度综合评价；/n获取客流控制策略，所述客流控制策略包括多种控制行为；/n根据所述车站设施能力负荷度综合评价以及所述客流控制策略更新当前的车站客流控制决策方案。/n

【技术特征摘要】
1.一种基于深度强化学习的自反馈客流控制方法，其特征在于，所述基于深度强化学习的自反馈客流控制方法包括：
获取车站的当前时间点的客流历史时序数据、仿真数据以及短时预测数据；
根据所述客流历史时序数据、仿真数据以及短时预测数据提取环境特征；
根据所述环境特征获取车站设施能力负荷度综合评价；
获取客流控制策略，所述客流控制策略包括多种控制行为；
根据所述车站设施能力负荷度综合评价以及所述客流控制策略更新当前的车站客流控制决策方案。

2.如权利要求1所述的基于深度强化学习的自反馈客流控制方法，其特征在于，所述获取车站的当前时间点的客流历史时序数据、仿真数据以及短时预测数据包括：
获取车站的当前时间点的客流历史时序数据；
根据所述客流历史时序数据获取车站当前时间点客流仿真数据；
获取车站的当前时间点的前一时间点的客流反馈处理结果；
根据所述客流仿真数据以及所述客流反馈处理结果获取车站当前时间点的客流短时预测数据。

3.如权利要求2所述的基于深度强化学习的自反馈客流控制方法，其特征在于，所述获取车站的当前时间点的客流历史时序数据包括：
获取图像预处理信息；
根据图像预处理信息获取行人轨迹信息；
根据所述行人轨迹信息分析统计获取客流历史时序数据。

4.如权利要求3所述的基于深度强化学习的自反馈客流控制方法，其特征在于，所述根据所述客流历史时序数据获取车站的当前时间点的客流仿真数据包括：
生成车站仿真模型；
设计生成流程逻辑；
设置流程功能实现对象；
根据流程逻辑绘制逻辑流程图；
根据所述逻辑流程图生成仿真控制逻辑；
根据仿真结果设置数据采集与统计；
根据所述仿真控制逻辑以及所述客流历史时序数据对所述车站模型进行模拟客流仿真，从而获取当前时间点的客流仿真数据。

5.如权利要求4所述的基于深度强化学习的自反馈客流控制方法，其特征在于，所述根据所述客流仿真数据以及所述反馈处理结果获取车站的当前时间点的客流短时预测数据包括：
构建LSTM模型；
将所述客流仿真数据以及所述反馈处理结果输入至所述LSTM模型并获取所述LSTM模型的输出信息作为短时预测数据。

6.如权利要求5所述的基于深度强化学习的自反馈客流控制方法，其特征在于，所述根据所述客流历史时序数据、仿真数据以及短时预测数据获取...

【专利技术属性】
技术研发人员：陈琪，王爱丽，窦元辰，张婷婷，郑宣传，高国飞，王子腾，李璐，刘宇，郑汉，
申请(专利权)人：中铁信北京网络技术研究院有限公司，中铁信息工程集团有限公司，深圳市地铁集团有限公司，北京城建设计发展集团股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人