一种基于XGBOOST机场客流量时空分布预测方法技术

技术编号:20119681 阅读:22 留言:0更新日期:2019-01-16 12:24
本发明专利技术公开了一种基于XGBOOST机场客流量时空分布预测方法,包括:将机场内部分隔为多个区域,每个区域设置多个WIFI硬件,将各WiFi硬件发送的信息存入大数据平台中;统计分析大数据平台中各WiFi硬件发送的信息,并得到各区域每个时间段连接终端的数量;提取待预测时间的影响客流量分布的特征,提取待预测时间的过往同时间段的连接终端的数量作为历史特征;将影响客流量分布的特征和历史特征作为XGBOOST的训练数据集,利用XGBOOST对训练数据集进行训练学习,得到预测模型;用预测模型对预测时间各区域连接终端的数量进行预测,得到各区域连接终端的数量预测值;根据各区域连接终端的数量预测值与真实人数的比例映射得到预测时间各区域的人数。

A Prediction Method of Spatial and Temporal Distribution of Airport Passenger Flow Based on XGBOOST

The invention discloses a method for predicting the spatial and temporal distribution of airport passenger flow based on XGBOOST, which includes: dividing the interior of the airport into several regions, setting up multiple WIFI hardware in each region, storing the information sent by each WiFi hardware into a large data platform, statistically analyzing the information sent by each WiFi hardware in the large data platform, and obtaining the number of connecting terminals in each region in each time period; The characteristics of predicting time affecting passenger flow distribution are extracted, and the number of connecting terminals in the same time period is taken as historical characteristics; the characteristics and historical characteristics affecting passenger flow distribution are taken as the training data set of XGBOOST, and the training data set is trained by XGBOOST to obtain the prediction model; and the number of connecting terminals in each area of predicting time is predicted by the prediction model. Quantity prediction is carried out to get the predicted value of the number of regional connection terminals, and the number of regions in the predicted time is obtained by mapping the predicted value of the number of regional connection terminals to the proportion of the real number.

【技术实现步骤摘要】
一种基于XGBOOST机场客流量时空分布预测方法
本专利技术涉及民航数据预测领域,特别是涉及一种基于XGBOOST机场客流量时空分布预测方法。
技术介绍
随着民航需求的日益增长,机场及时有效的服务也面临着一定压力,而机场运行产生的大量信息数据目前未被利用,导致管理资源浪费。机场拥有巨大的旅客吞吐量,与巨大的人员流动相对应的则是巨大的服务压力。安防、安检、突发事件应急、值机、行李追踪等机场服务都希望能够预测未来的旅客吞吐量,并据此提前调配人力物力,更好的为旅客服务。另外,当前机场一线员工在分配物力和人力资源时,都基于以前工作中积累的经验进行分配和调度,缺乏科学的数据参考和指导。
技术实现思路
基于此,本专利技术的目的在于,提供一种基于XGBOOST机场客流量时空分布预测方法。一种基于XGBOOST机场客流量时空分布预测方法,包括:将机场内部分隔为多个区域,每个区域设置多个WIFI硬件,将各WiFi硬件发送的信息存入大数据平台中;统计分析大数据平台中各WiFi硬件发送的信息,并得到各区域每个时间段连接终端的数量;提取待预测时间的影响客流量分布的特征,提取待预测时间的过往同时间段的连接终端的数量作为历史特征;将影响客流量分布的特征和历史特征作为XGBOOST的训练数据集,利用XGBOOST对训练数据集进行训练学习,得到预测模型;用预测模型对预测时间各区域连接终端的数量进行预测,得到各区域连接终端的数量预测值;根据各区域连接终端的数量预测值与真实人数的比例映射得到预测时间各区域的人数。进一步优选地,所述大数据平台为Hadoop;所述统计分析大数据平台中各WiFi硬件发送的信息为利用MapReduce统计分析大数据平台中各WiFi硬件发送的信息。进一步优选地,所述影响客流量分布的特征包括天气情况和航班起降数量。进一步优选地,所述天气情况包括多种天气;所述航班起降数量为预测时间前后一段时间内的航班起降数量。进一步优选地,所述提取待预测时间的过往同时间段的连接终端的数量作为历史特征,包括:提取预测时间的过往同时间段的连接终端的数量的均值、最小值、最大值、极差和标准差。进一步优选地,所述提取待预测时间的过往同时间段的连接终端的数量作为历史特征,还包括:提取待预测时间的过往1-7天同时间段的连接终端的数量作为历史特征。进一步优选地,所述将影响客流量分布的特征和历史特征作为XGBOOST的训练数据集,利用XGBOOST对训练数据集进行训练,得到预测模型,包括:对影响客流量分布的特征中的天气情况进行One-Hot编码。进一步优选地,所述对影响客流量分布的特征中的天气情况进行One-Hot编码,包括:对天气情况的多种天气构造一个多维向量,其中,每一维向量表示一种天气。进一步优选地,所述将影响客流量分布的特征和历史特征作为XGBOOST的训练数据集,利用XGBOOST对训练数据集进行训练学习,得到预测模型,包括:构建提升树模型其中,T(x;θm)表示决策树,θm为决策树参数,M为树的个数;XGBOOST算法采用前向分布算法,确定初始提升树F0(x)=0,第m步模型是Fm(x)=Fm-1(x)+T(x;θm),其中,Fm-1(x)为当前模型,通过经验风险极小化和结构风险最小化确定下一棵决策树的参数θm,已知一个训练数据集x是输入空间,y为输出空间,如果将输入空间x划分为J个不互相交的区域R1,R2,...,Rj,并且每个区域上确定输出的常量cj,那么树可以表示为同时,记T(x;θm)为f(x;θm),其中,参数θm={(R1,c1),(R2,c2),...,(Rn,cn)}表示树的区域划分和各区域上的常树,J是回归树的复杂度即叶子节点个数;回归问题的XGBOOST使用以下前向分步算法:F0(x)=0,Fm(x)=Fm-1(x)+fm(x;θm),在前向分布算法的第m步,给定模型fm-1(x),需要求解,得到θm,即第m棵树的参数;需要优化的目标函数即是利用泰勒展开,可展开为如下形式:定义目标函数其中,最小化目标函数;重新定义树的结构,将回归树以叶子节点的形式进行表达;将每个样本都最终落到叶子节点上,所以ft(x)=cq(x),c为叶子节点的值,q(x)为样本到哪个叶子节点的映射函数,并且结构风险Ω(ft)记为定义集合映射Ij={i|q(xi)=j},那么此时目标函数变为假定q(x)已经确定,即树的结构已经确定,那么每个叶子的最优节点和最小目标函数都会确定,即求目标函数最小值定义XGBOOST树模型在一个叶子节点分裂的时候的增益为:Gain值越大,分裂后的Obj就减少越多,所以当一个节点分裂时,计算所有候选分裂点对应的gain,选取gain最大的进行分割;所述计算所有候选分裂点对应的gain,选取gain最大的进行分割,包括:输入:I,当前节点的样本集,输入:m,特征维度,Output:以最高增益的分裂节点进行分裂。进一步优选地,所述将影响客流量分布的特征和历史特征作为XGBOOST的训练数据集,利用XGBOOST对训练数据集进行训练学习,得到预测模型,包括:XGBOOST算法即得到预测模型的过程:输入:训练数据集损失函数是L(y,f(x)),输出:XGBOOST回归树即为预测模型。本专利技术的基于XGBOOST机场客流量时空分布预测方法的有益效果:本专利技术的基于XGBOOST机场客流量时空分布预测方法基于影响客流量分布的特征,并将连接终端的数量作为历史特征,采用XGBOOST集成回归树模型进行预测,更加准确地得到预测时间各区域的人数,其改进了传统的预测方法,大大提高了预测的准确率,业务人员可以根据预测结果优化机场的资源分配,提高工作效率。本专利技术的基于XGBOOST机场客流量时空分布预测方法利用信息化手段,结合机场的信息资源,解放了机场的人力资源,在一定程度上优化了机场资源的分配。为了更好地理解和实施,下面结合附图详细说明本专利技术。附图说明图1是本专利技术的基于XGBOOST机场客流量时空分布预测方法的流程框图。具体实施方式以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的方法的例子。在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。请参阅图1,图1是本专利技术的基于XGBOOST机场客流量时空分布预测方法的流程框图。本实施例的的基于XGBOOST机场客流量时空分布预测方法,包括:步骤101,将机场内部分隔为多个区域,每个区域设置多个WIFI硬件,将各WiFi硬件发送的信息存入大数据平台中;步骤102,统计分析大数据平台中各WiFi硬件发送的信息,并得到各区域每个时间段连接终端的数量;步骤103,提取待预测时间的影响客流量分布的特征,提取待预测时间的过往同时间段的连接终端的数量作为历史特征;步骤104,将影响客流量分布的特征和历史特征作为XGBOOST的训练数据集,利用XGBOOST对训练数据集进行训练学习,得到预测模型;步本文档来自技高网...

【技术保护点】
1.一种基于XGBOOST机场客流量时空分布预测方法,其特征在于,包括:将机场内部分隔为多个区域,每个区域设置多个WIFI硬件,将各WiFi硬件发送的信息存入大数据平台中;统计分析大数据平台中各WiFi硬件发送的信息,并得到各区域每个时间段连接终端的数量;提取待预测时间的影响客流量分布的特征,提取待预测时间的过往同时间段的连接终端的数量作为历史特征;将影响客流量分布的特征和历史特征作为XGBOOST的训练数据集,利用XGBOOST对训练数据集进行训练学习,得到预测模型;用预测模型对预测时间各区域连接终端的数量进行预测,得到各区域连接终端的数量预测值;根据各区域连接终端的数量预测值与真实人数的比例映射得到预测时间各区域的人数。

【技术特征摘要】
1.一种基于XGBOOST机场客流量时空分布预测方法,其特征在于,包括:将机场内部分隔为多个区域,每个区域设置多个WIFI硬件,将各WiFi硬件发送的信息存入大数据平台中;统计分析大数据平台中各WiFi硬件发送的信息,并得到各区域每个时间段连接终端的数量;提取待预测时间的影响客流量分布的特征,提取待预测时间的过往同时间段的连接终端的数量作为历史特征;将影响客流量分布的特征和历史特征作为XGBOOST的训练数据集,利用XGBOOST对训练数据集进行训练学习,得到预测模型;用预测模型对预测时间各区域连接终端的数量进行预测,得到各区域连接终端的数量预测值;根据各区域连接终端的数量预测值与真实人数的比例映射得到预测时间各区域的人数。2.根据权利要求1所述的基于XGBOOST机场客流量时空分布预测方法,其特征在于,所述大数据平台为Hadoop;所述统计分析大数据平台中各WiFi硬件发送的信息为利用MapReduce统计分析大数据平台中各WiFi硬件发送的信息。3.根据权利要求1所述的基于XGBOOST机场客流量时空分布预测方法,其特征在于,所述影响客流量分布的特征包括天气情况和航班起降数量。4.根据权利要求3所述的基于XGBOOST机场客流量时空分布预测方法,其特征在于,所述天气情况包括多种天气;所述航班起降数量为预测时间前后一段时间内的航班起降数量。5.根据权利要求1所述的基于XGBOOST机场客流量时空分布预测方法,其特征在于,所述提取待预测时间的过往同时间段的连接终端的数量作为历史特征,包括:提取预测时间的过往同时间段的连接终端的数量的均值、最小值、最大值、极差和标准差。6.根据权利要求5所述的基于XGBOOST机场客流量时空分布预测方法,其特征在于,所述提取待预测时间的过往同时间段的连接终端的数量作为历史特征,还包括:提取待预测时间的过往1-7天同时间段的连接终端的数量作为历史特征。7.根据权利要求4所述的基于XGBOOST机场客流量时空分布预测方法,其特征在于,所述将影响客流量分布的特征和历史特征作为XGBOOST的训练数据集,利用XGBOOST对训练数据集进行训练,得到预测模型,包括:对影响客流量分布的特征中的天气情况进行One-Hot编码。8.根据权利要求7所述的基于XGBOOST机场客流量时空分布预测方法,其特征在于,所述对影响客流量分布的特征中的天气情况进行One-Hot编码,包括:对天气情况的多种天气构造一个多维向量,其中,每一维向量表示一种天气。9.根据权利要求1-8任一项所述的基于XGBOOST机场客流量时空分布预测方法,其特征在于,所述将影响客流量分布的特征和历史特征作为XGBOOST的训练数据集,利用XGBOOST对训练数据集进行训练学习,得到预测模型,包括:构建提...

【专利技术属性】
技术研发人员:关华夏侯康黄剑文罗军
申请(专利权)人:广东机场白云信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1