一种基于乘客出行多维特征的共享巴士站点客流预测方法技术

技术编号:17347635 阅读:25 留言:0更新日期:2018-02-25 13:54
本发明专利技术公开了一种基于共享巴士数据的站点乘客流预测方法,首先对共享巴士数据进行预处理,然后基于共享巴士行车规律对数据进行时间划分,之后根据预测目标的特点,从时间划分后的数据中提取出预测的多维特征,包括时间特征、周次特征、位置特征、历史流量特征和时间间隔特征,随后利用上述特征对机器学习模型XGBoost进行训练,得到预测模型,最后基于预测模型,得到站点乘客流预测结果,并对预测结果进行展示和评估。本发明专利技术能够利用机器学习算法对共享巴士站点客流量进行精准地预测,特别针对于“最后一公里”问题中从居民区到其附近地铁站的细分场景,为优化共享巴士运营提供建设性意见,具有可行性强、准确率高、稳定性强的特点。

A passenger flow prediction method of shared bus station based on multidimensional characteristics of passenger travel

The invention discloses a method of sharing data bus passenger flow prediction method based on the shared bus, data pretreatment, and then share the data bus traffic laws based on time division, based on characteristics of forecast target, extract the multidimensional prediction from the time division data, including the features of time and week time characteristic and location characteristic and historical traffic characteristics and the characteristics of the time interval, then the characteristics of the training of machine learning model XGBoost, prediction model, the prediction model based on the obtained Station passenger flow forecast results, and display and evaluation of prediction results. The invention can use machine learning algorithm to accurately predict the shared bus site traffic, especially for the \last mile\ problem from the residential area to the subway station near the scene segmentation, provide constructive suggestions for the optimization of shared bus operation, with strong feasibility, high accuracy and strong stability characteristics.

【技术实现步骤摘要】
一种基于乘客出行多维特征的共享巴士站点客流预测方法
本专利技术涉及交通流量预测
,尤其涉及一种基于乘客出行多维特征的共享巴士站点客流预测方法。
技术介绍
近10年来,随着全球经济的快速发展,资源短缺问题日益严重。共享经济的出现为缓解这个问题提供了很好的解决思路。由于近年来各种网络社区的出现,基于互联网平台新的共享经济模式正在迅速发展,如Airbnb和Uber等。这也推进了共享经济在多个领域的应用推广。共享巴士、共享单车、共享汽车正是共享经济在交通领域的不同应用形式。其中,共享巴士致力于提供一种灵活实惠的公交服务。但是由于其客流波动大,不稳定,共享巴士站点客流预测成为了共享巴士发展的瓶颈。因此本专利技术基于共享巴士的特点,提取站点客流预测的多维特征,并提出一种基于机器学习算法的站点乘客流预测方法。作为智能城市发展的关键技术之一,交通流预测始终吸引着大量学者进行深入研究。但是在现有预测技术中,针对共享巴士运营特点的专门化的站点客流预测方法尚是空白。
技术实现思路
本专利技术的目的主要针对上述现有研究的一些不足之处,提出一种基于乘客出行多维特征的共享巴士站点客流预测方法,通过对共享巴士运营特点和乘客出行行为的分析,提取预测相关的多维特征,并基于机器学习算法对站点乘客流进行精准地预测。“最后一公里”问题是共享巴士的主要应用场景之一。特别地,这里我们针对在居民区和其附近地铁站运营的共享巴士客流进行预测。本专利技术的技术方案:一种基于乘客出行多维特征的共享巴士站点客流预测方法,步骤如下:S1,对共享巴士数据进行预处理S1.1,数据清洗:共享巴士数据包括订单数据和站点时间数据,数据清洗包括清除订单数据的错误记录、缺失值、噪声数据和异常值;S1.2,数据筛选:根据预测目标,剔除现金乘客的订单记录,并提取出预测相关的字段;S2,对步骤S1预处理得到的共享巴士数据进行时间划分;S2.1,根据预测目标,选定研究时间范围,并筛选出研究时间范围内的订单数据;S2.1,时间划分,根据共享巴士的行车规律,对研究时间范围进行时间划分,时间划分公式如下:Tk=α+(kθ,(k+1)θ)k=1,2,…,19其中,Tk代表时间段,α代表起始时间,θ代表时间间隔,k代表时间序号;S3,从步骤S2得到的时间划分后的数据中,提取出乘客出行多维特征;S3.1,时间特征提取:时间是影响交通流量的关键因素,考虑到共享巴士的运行规律,基于时间划分结果,将时间序号作为时间特征的输入;S3.2,周次特征提取:工作日和节假日中,共享巴士的客流变化规律有着很大的区别,为了体现流量预测中的周期性变化规律,将周一到周日映射为0到6七个数值作为周次特征的输入;S3.3,位置特征提取:共享巴士所处不同位置的站点交通流量变化有明显的差异,将不同站点到达最终目的站点的时间作为衡量地理位置特征的参照,地理位置特征同时也在时间层面上反映站点客流变化;S3.4,历史流量特征提取:对于流量预测而言,历史流量数据规律从本质上决定和影响着未来数据的变化趋势,对于历史流量特征,使用该站点前一天、前两天、前三天对应时间片的历史客流作为历史流量特征的输入;S3.5,时间间隔特征提取:共享巴士的车辆数在研究时间范围内的某一时间点发生了变化,基于对各站点客流情况的分析,发现该时间点前后各站点客流规律出现明显变化,用预测目标日与该时间点的距离作为时间间隔特征的输入来衡量车辆数变化因素;S4,利用步骤S3提取得到的多维特征对机器学习模型XGBoost进行训练,得到预测模型;S4.1,特征处理:为过滤掉特征数据中的不稳定因素,对提取的特征进行以下处理:S4.1.1,特征标准化:为将各个特征值处理在同一范围内,避免特征值之间差异过大影响预测效果,利用以下公式对特征进行标准化处理:其中,x′代表标准化处理后的特征值,x代表未经处理的特征值,代表特征的平均值,S代表特征向量的标准差;S4.1.2,离散特征处理:机器学习模型XGBoost默认其输入特征均为连续值,因此需对提取的离散特征进行处理,利用one-hotencoding编码将具有n个状态的变量转换为n维状态;S4.1.3,多项式特征构建:多项式特征构建可扩展特征来适应特征的高维空间,不仅可增加特征数量,也可构建出在特征提取过程中忽略的特征,利用多项式函数进行数据转换,4个特征,度为2的多项式转换公式如下:其中,x1、x2、x3、x4为原特征,x′p,p=1,2,…,15为转换后的特征;S4.2,机器学习模型XGBoost训练:将步骤S4.1处理过的特征输入到机器学习模型XGBoost中,并根据预测效果对机器学习模型XGBoost进行训练调参,得到共享巴士站点客流预测模型;S5:基于步骤S4共享巴士站点客流预测模型得到站点乘客流预测结果,并对预测结果进行展示和评估;S5.1:站点客流预测结果:基于步骤S4共享巴士站点客流预测模型得到共享巴士各个站点的预测结果;S5.2:预测效果评估:基于S5.1得到的预测结果,利用客流预测准确率衡量指标,包括相关系数CC、均方根误差RMSE和平均绝对误差MAE,评估模型预测效果。本专利技术的有益效果:本专利技术能够利用机器学习算法对共享巴士站点客流量进行精准地预测,特别针对于“最后一公里”问题中从居民区到其附近地铁站的细分场景,为优化共享巴士运营提供建设性意见,具有可行性强、准确率高、稳定性强的特点。附图说明图1为一种基于乘客出行多维特征的共享巴士站点客流预测方法流程图。图2为6号站点客流预测数据与真实数据对比图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面将对本专利技术的具体实施方式作进一步的详细描述。本专利技术实施例提供了一种基于乘客出行多维特征的共享巴士站点客流预测方法,流程如图1所示,该方法包括:S1:对记录了上海市永康城共享巴士在4月1号到9月6号的订单数据进行预处理,步骤如下:S1.1:数据清洗:共享巴士数据包括订单数据和站点时间数据,数据清洗包括清除订单数据的错误记录、缺失值、噪声数据和异常值,本方法研究上午从居民区到地铁站间运营的共享巴士站点客流预测,而在该限定条件下从地铁站(目的地站点)到永康城居民区(始发地站点)的订单记录属于异常数据,应删除;S1.2:数据筛选:根据预测目标,剔除现金乘客的订单记录,并提取出预测相关的字段;S2:对S1所述共享巴士数据进行时间划分,步骤如下:S2.1:根据预测目标,选定研究时间范围为上午6:00-12:00,并筛选出研究时间范围内的订单数据;S2.2:时间划分,根据共享巴士的行车规律,对研究时间范围进行时间划分,对于客流较为密集的时间范围,我们将10分钟作为时间段的长度,而在时间范围中刚开始的一段时间和快结束的一段时间,客流稀疏,我们将这两段作为单独的两个时间段,时间划分公式如下:Tk=α+(kθ,(k+1)θ)k=1,2,…,19其中,Tk代表时间段,α代表起始时间,θ代表时间间隔,这里为10分钟,k代表时间序号;S3:从S2所述时间划分后的数据提取出乘客出行多维特征,步骤如下;S3.1:时间特征提取:时间是影响交通流量的关键因素,考虑到共享巴士的运行规律,基于时间划分结果,将时间片序号作为时间特征的输入;S3.2:周次特征提取:工作日和节假日中,共享巴士的客流本文档来自技高网...
一种基于乘客出行多维特征的共享巴士站点客流预测方法

【技术保护点】
一种基于乘客出行多维特征的共享巴士站点客流预测方法,其特征在于,步骤如下:S1,对共享巴士数据进行预处理S1.1,数据清洗:共享巴士数据包括订单数据和站点时间数据,数据清洗包括清除订单数据的错误记录、缺失值、噪声数据和异常值;S1.2,数据筛选:根据预测目标,剔除现金乘客的订单记录,并提取出预测相关的字段;S2,对步骤S1预处理得到的共享巴士数据进行时间划分;S2.1,根据预测目标,选定研究时间范围,并筛选出研究时间范围内的订单数据;S2.1,时间划分,根据共享巴士的行车规律,对研究时间范围进行时间划分,时间划分公式如下:Tk=α+(kθ,(k+1)θ)k=1,2,…,19其中,Tk代表时间段,α代表起始时间,θ代表时间间隔,k代表时间序号;S3,从步骤S2得到的时间划分后的数据中,提取出乘客出行多维特征;S3.1,时间特征提取:时间是影响交通流量的关键因素,考虑到共享巴士的运行规律,基于时间划分结果,将时间序号作为时间特征的输入;S3.2,周次特征提取:工作日和节假日中,共享巴士的客流变化规律有着很大的区别,为了体现流量预测中的周期性变化规律,将周一到周日映射为0到6七个数值作为周次特征的输入;S3.3,位置特征提取:共享巴士所处不同位置的站点交通流量变化有明显的差异,将不同站点到达最终目的站点的时间作为衡量地理位置特征的参照,地理位置特征同时也在时间层面上反映站点客流变化;S3.4,历史流量特征提取:对于流量预测而言,历史流量数据规律从本质上决定和影响着未来数据的变化趋势,对于历史流量特征,使用该站点前一天、前两天、前三天对应时间片的历史客流作为历史流量特征的输入;S3.5,时间间隔特征提取:共享巴士的车辆数在研究时间范围内的某一时间点发生了变化,基于对各站点客流情况的分析,发现该时间点前后各站点客流规律出现明显变化,用预测目标日与该时间点的距离作为时间间隔特征的输入来衡量车辆数变化因素;S4,利用步骤S3提取得到的多维特征对机器学习模型XGBoost进行训练,得到预测模型;S4.1,特征处理:为过滤掉特征数据中的不稳定因素,对提取的特征进行以下处理:S4.1.1,特征标准化:为将各个特征值处理在同一范围内,避免特征值之间差异过大影响预测效果,利用以下公式对特征进行标准化处理:...

【技术特征摘要】
1.一种基于乘客出行多维特征的共享巴士站点客流预测方法,其特征在于,步骤如下:S1,对共享巴士数据进行预处理S1.1,数据清洗:共享巴士数据包括订单数据和站点时间数据,数据清洗包括清除订单数据的错误记录、缺失值、噪声数据和异常值;S1.2,数据筛选:根据预测目标,剔除现金乘客的订单记录,并提取出预测相关的字段;S2,对步骤S1预处理得到的共享巴士数据进行时间划分;S2.1,根据预测目标,选定研究时间范围,并筛选出研究时间范围内的订单数据;S2.1,时间划分,根据共享巴士的行车规律,对研究时间范围进行时间划分,时间划分公式如下:Tk=α+(kθ,(k+1)θ)k=1,2,…,19其中,Tk代表时间段,α代表起始时间,θ代表时间间隔,k代表时间序号;S3,从步骤S2得到的时间划分后的数据中,提取出乘客出行多维特征;S3.1,时间特征提取:时间是影响交通流量的关键因素,考虑到共享巴士的运行规律,基于时间划分结果,将时间序号作为时间特征的输入;S3.2,周次特征提取:工作日和节假日中,共享巴士的客流变化规律有着很大的区别,为了体现流量预测中的周期性变化规律,将周一到周日映射为0到6七个数值作为周次特征的输入;S3.3,位置特征提取:共享巴士所处不同位置的站点交通流量变化有明显的差异,将不同站点到达最终目的站点的时间作为衡量地理位置特征的参照,地理位置特征同时也在时间层面上反映站点客流变化;S3.4,历史流量特征提取:对于流量预测而言,历史流量数据规律从本质上决定和影响着未来数据的变化趋势,对于历史流量特征,使用该站点前一天、前两天、前三天对应时间片的历史客流作为历史流量特征的输入;S3.5,时间间隔特征提取:共享巴士的车辆数在研究时间范围内的某一时间点发生了变化,基于对各站点客流情况的分析,发现该时间点前后各站点客流规律出现明显变化,用预测目标日与该时间点的距离作为时间间隔特征的输入来衡量车辆数变化因素;S4,利用步骤S3提取得到的多维特征对机器学习模型XGBoost进行训练,得到预测模型;S4.1,特征处理:为过滤掉特征数据中的不稳定因素,对提取的特征进行以下处理:S4.1.1,特征标准化:为将各个特征值处理在同一范围内,避...

【专利技术属性】
技术研发人员:孔祥杰李梦琳付振寰郑超凡惠煌夏锋
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1