一种基于城市公共交通资源联合调度方法技术

技术编号：27498052 阅读：17 留言：0更新日期：2021-03-02 18:20

本发明专利技术提供一种基于城市公共交通资源联合调度方法，聚焦于公交车系统和共享单车系统，在时空预测的基础上使用强化学习长期的最优调度以及协同调度策略，能够实现两者之间的协同调度，解决可能会出现的局部贪心问题，当某种交通服务临时不可用或不适用时，能够及时调度其他交通资源满足用户的出行需求。该方法依据已记录的不同时间地点下人群流动的数据和各类交通工具承载的人流变化，预先构造出一个随时间变化的人群乘坐交通工具的需求流量图；然后，将当前车站状态和未来预测的流量图当作当前系统的状态，利用强化学习技术来对当前多种交通系统进行协同高效的调度。前多种交通系统进行协同高效的调度。前多种交通系统进行协同高效的调度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于城市公共交通资源联合调度方法

[0001]本专利技术涉及人工智能领域，尤其涉及一种具有人流预测方法以及交通资源联合调度的强化学习方法。

技术介绍

[0002]近年来，现代城市的交通拥堵问题日益成为居民的心病。如百度交通报告所示，北京上下班高峰时段的通勤压力指数达到惊人的1.973，导致出行时间延长，车辆排队增多。以往的研究表明，通过合理的调度，例如重新调度自行车共享系统和优化公交运输系统，可以在不消耗多余资源的情况下显著提高交通效率。
[0003]经本专利技术人研究发现，仍有两个缺点限制了调度系统的性能：(1)只考虑短时间内的单一调度，而忽略了首次交通调度后交通资源重分布现象；(2)当前调度系统只关注一类交通调度。城市公共交通的多模式特性在很大程度上还没有得到充分的利用。因此，如何基于实时的交通状况，联合多类交通系统进行联合调度优化，从而为市民提供一体化的更好的出行体验，以及缓解交通拥堵至关重要。

技术实现思路

[0004]本专利技术所要解决的技术问题是提供一种基于城市公共交通资源联合调度方法，其特征在于，包括：
[0005]步骤1、依据已记录的不同时间地点下人群流动的数据和各类交通工具，承载的人流流动数据，预先构造出一个随时间变化的人群乘坐交通工具的交通流量图，对于公交车和共享单车的每个站点，记录其每个时间段的流入和流出量；
[0006]步骤2、在构建的交通流量图中，为每个地点生成一个时序的流量变化序列，使用机器学习技术，并针对不同交通构建出人流预测模型，然后将该流量...

【技术保护点】

【技术特征摘要】
1.一种基于城市公共交通资源联合调度方法，其特征在于，包括：步骤1、依据已记录的不同时间地点下人群流动的数据和各类交通工具，承载的人流流动数据，预先构造出一个随时间变化的人群乘坐交通工具的交通流量图，对于公交车和共享单车的每个站点，记录其每个时间段的流入和流出量；步骤2、在构建的交通流量图中，为每个地点生成一个时序的流量变化序列，使用机器学习技术，并针对不同交通构建出人流预测模型，然后将该流量变化序列和相应的流量流动相关的数据输入到构建的人流预测模型中，从而预先训练得到一个具有预测人流去向能力的预测模型；最后将实时统计的流量变化序列输入到人流预测模型中，得到未来时刻不同地点的流量流动图；步骤3、获取当前各个地点的交通资源状态，将其和预测的未来时刻的流量流动图一同输入到基于强化学习的联合调度系统中，为每个地点构造相关的调度状态和全局的流量状态输入到强化学习调度系统中得到相应的交通工具的调度动作，不断优化调度动作直至最优。2.根据权利要求1所述的一种基于城市公共交通资源联合调度方法，其特征在于，步骤2中预先构建的人群乘坐交通流量的人流预测模型，包括：对获取的各个地点的各类交通工具的流量变化序列进行预处理；根据各类交通流量的特点选取对应的流量预测模型，流量变化稳定，即每日交通流量变化相对总流量小于第一预定阈值，这些稳定的交通类采用分层预测模型；对于流动变化具有时序性的交通类，采用具有时序敏感性的预测模型；同时考虑不同交通流量预测系统之间的协同关系，将不同系统的预测信息嵌入到不同类预测系统中协同预测。3.根据权利要求2所述的一种基于城市公共交通资源联合调度方法，其特征在于，具体包括：对于公交车系统采用分层预测模型；对于共享单车的流量变化代入带有长短期记忆LSTM的预测模型；在共享单车的调度系统中引入周围公交车调度的状态信息。4.根据权利要求1所述的一种基于城市公共交通资源联合调度方法，其特征在于，所述步骤3中基于强化学习的联合交通调度系统是预先构建的，包括步骤：对公交车系统进行强化学习调度建模，定义公交车的状态包括四部分：a)对于公交站点的观测,其中b1，b2分别表示上一班次公交车从两个方向经过此车站的时间间隔，和表示所预测未来交通流入量和流出量；t＝1
……
L，t表示L表示未来时刻；b)对于同一班线其他公交车的状态信息(d
j
，e
j
，f
j
，v
j
)和当前公交车的状态信息(d1，e1，f1，v1)；其中d
j
表示当前第j个公交车位置，e
j
，f
j
分别表示第j个公交车当前载客量和剩余可承载多少客量；v
j
表示第j个公交车当前的操作类型；c)系统的信息H，包括天气,温度,相邻两站之间的时间距离和地理距离；d)当前路线公交车车站在其他公交车路线的状态O。5.根据权利要求4所述的一种基于城市公共交通资源联合调度方法，其特征在于，还定
义公交车系统的公交车动作、奖励和停止条件如下：动作：一辆公交车的动作有两个，向终点方向开，向起点方向开，在终点或者起点停；奖励：对于公交车强化学习，定义奖励机制如下：a)公交车每次从A到B行程，奖励为减少的等待时间，惩罚为到A的行驶时间，车行驶数目；b)公交车调转方向，转向操作惩罚为一个常数C，以及l*当前乘客数量，l为惩罚系数；c)公交车不开车，没有奖励和惩罚；停止条件：某一用户等了p个时间片段未等到公交车或者完成一个完整的周期。6.根据权利要求1所述的一种基于城市公共交通资源联合调度方法，其特征在于，对共享单车系统进行强化学习调度建模，定义共享单车的状态包括四部分：共享单车调度a)共享单车车站的状态其中b1，b2分别表示当前单车可用单车量和可停放单车量，和表示...

【专利技术属性】
技术研发人员：陈恩红，刘淇，梁先锋，吴李康，陈卓，刘杨，于润龙，侯旻，武晗，叶雨扬，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人