The invention discloses a prediction method based on machine learning through the subway subway short-term passenger flow, making the card data based on the assumption that all the passengers were in accordance with the shortest path travel, all statistical interval, all sites in the unit within the time window of flow. The passenger flow of subway station in the unit time window is taken as the node, and the subway passenger flow network is built with the weight of the subway passenger flow within the unit time window as the edge. For the single target interval, the most important features are selected to be included in the subsequent regression prediction model. In this method, the recursive feature elimination algorithm is used to complete feature selection, and the important features of the target interval in the target time window are selected. A regression prediction model based on gradient lifting regression tree is used to predict the short-term passenger flow of subway. This method can achieve higher prediction accuracy under the condition of single data source. Using historical data to establish regression prediction model, combined with real-time data to predict the short-term passenger flow of subway, and provide help for the optimization of urban rail transit operation marshalling design.
【技术实现步骤摘要】
一种基于机器学习的地铁短时客流预测方法
本专利技术属于交通
,具体涉及基于机器学习的地铁短时客流预测方法。
技术介绍
随着我国城市化进程的加快,城市交通问题日益突出,而城市轨道交通系统是解决大中城市公共交通的根本途径,较为封闭且人群聚集量大。实时、准确的轨道交通客流预测对城市轨道交通运营编组设计优化至关重要。本研究提出将地铁历史客流数据与实时信息相结合,借助机器学习预测地铁短时突发客流的方法。研究发现,基于历史客流与实时信息相结合的预测,能够精确稳定地预测地铁短时客流。但是,现有的方法存在如下问题:1、传统的预测方法,预测结果精度不高。2、现有预测精度较高的模型较为复杂,而且数据质量要求高,甚至需要融合多源数据。
技术实现思路
本专利技术提供了一种基于机器学习的地铁短时客流预测方法,其目的在于能够在数据来源单一的条件下,借助机器学习方法建立较为简单的预测模型来预测地铁短时客流,并且达到较高的预测精度。一种基于机器学习的地铁短时客流预测方法,包括以下步骤:步骤一:获取待统计的地点区间内的所有地铁刷卡记录;步骤二:根据步骤一的地铁刷卡记录,以乘客连续两次的进出站刷卡 ...
【技术保护点】
一种基于机器学习的地铁短时客流预测方法,其特征在于,包括以下步骤:步骤一:获取待统计的地点区间内的所有地铁刷卡记录;步骤二:根据步骤一的地铁刷卡记录,以乘客连续两次的进出站刷卡记录分别为一次出行的O和D,统计每日的乘客的出行OD,求出每日的地铁客流的OD分布;步骤三:按照步骤二求出的OD分布,统计每日待统计的地点区间内所有地铁区间在单位时间窗内的客流;同时,由步骤一中的地铁刷卡记录直接统计得到每日地铁所有站点在单位时间窗内的客流;步骤四:构建地铁客流网络G,以单位时间窗内的地铁站点客流为节点,以单位时间窗内的地铁区间客流为边的权重,建立地铁客流网络G;步骤五:对于待统计的地 ...
【技术特征摘要】
1.一种基于机器学习的地铁短时客流预测方法,其特征在于,包括以下步骤:步骤一:获取待统计的地点区间内的所有地铁刷卡记录;步骤二:根据步骤一的地铁刷卡记录,以乘客连续两次的进出站刷卡记录分别为一次出行的O和D,统计每日的乘客的出行OD,求出每日的地铁客流的OD分布;步骤三:按照步骤二求出的OD分布,统计每日待统计的地点区间内所有地铁区间在单位时间窗内的客流;同时,由步骤一中的地铁刷卡记录直接统计得到每日地铁所有站点在单位时间窗内的客流;步骤四:构建地铁客流网络G,以单位时间窗内的地铁站点客流为节点,以单位时间窗内的地铁区间客流为边的权重,建立地铁客流网络G;步骤五:对于待统计的地点区间内的每一个目标地铁区间,以步骤四中所建立的地铁客流网络G中的所有节点和边作为其备选特征,取特征训练数据集D={(x1,y1),(x2,y2),…,(xn,yn)},xi∈Rd,y∈R,矩阵X=(x1,x2,…,xn)T表示训练集样本的x输入,xi∈Rd,其中R表示实数,d表示维数,矩阵y=(y1,y2,..,yn)T表示训练集样本的y输入,yn与xn对应,构成一个样本,n为样本数,利用递归特征消除算法作为特征选择方法,找出目标时间窗内对每一目标地铁区间影响最大的前K个特征;步骤六:利用梯度提升回归树方法建立回归预测模型,将步骤五中挑选出的对目标区间影响最大的前K个特征,作为回归模型的输入,纳入后续的回归预测,此时输入的样本xi的维数是K维,目标值列矩阵y=(y1,y2,..,yn)T与特征选择方法中的目标值一致。2.根据权利要求1所述的一种基于机器学习的地铁短时客流预测方法,其特征在于,所述的步骤一中,地铁刷卡记录只选择所有包括完整出行OD的地铁刷卡记录。3.根据权利要求1所述的一种基于机器学习的地铁短时客流预测方法,其特征在于,所述的步骤二中,以乘客的出行OD为最短路径出行OD。4.根据权利要求1所述的一种基于机器学习的地铁短时客流预测方法,其特征在于,所述的步骤五中,所述的递归特征...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。