The invention discloses a method of sharing data bus passenger flow prediction method based on the shared bus, data pretreatment, and then share the data bus traffic laws based on time division, based on characteristics of forecast target, extract the multidimensional prediction from the time division data, including the features of time and week time characteristic and location characteristic and historical traffic characteristics and the characteristics of the time interval, then the characteristics of the training of machine learning model XGBoost, prediction model, the prediction model based on the obtained Station passenger flow forecast results, and display and evaluation of prediction results. The invention can use machine learning algorithm to accurately predict the shared bus site traffic, especially for the \last mile\ problem from the residential area to the subway station near the scene segmentation, provide constructive suggestions for the optimization of shared bus operation, with strong feasibility, high accuracy and strong stability characteristics.
【技术实现步骤摘要】
一种基于乘客出行多维特征的共享巴士站点客流预测方法
本专利技术涉及交通流量预测
,尤其涉及一种基于乘客出行多维特征的共享巴士站点客流预测方法。
技术介绍
近10年来,随着全球经济的快速发展,资源短缺问题日益严重。共享经济的出现为缓解这个问题提供了很好的解决思路。由于近年来各种网络社区的出现,基于互联网平台新的共享经济模式正在迅速发展,如Airbnb和Uber等。这也推进了共享经济在多个领域的应用推广。共享巴士、共享单车、共享汽车正是共享经济在交通领域的不同应用形式。其中,共享巴士致力于提供一种灵活实惠的公交服务。但是由于其客流波动大,不稳定,共享巴士站点客流预测成为了共享巴士发展的瓶颈。因此本专利技术基于共享巴士的特点,提取站点客流预测的多维特征,并提出一种基于机器学习算法的站点乘客流预测方法。作为智能城市发展的关键技术之一,交通流预测始终吸引着大量学者进行深入研究。但是在现有预测技术中,针对共享巴士运营特点的专门化的站点客流预测方法尚是空白。
技术实现思路
本专利技术的目的主要针对上述现有研究的一些不足之处,提出一种基于乘客出行多维特征的共享巴士站点客流预测方法,通过对共享巴士运营特点和乘客出行行为的分析,提取预测相关的多维特征,并基于机器学习算法对站点乘客流进行精准地预测。“最后一公里”问题是共享巴士的主要应用场景之一。特别地,这里我们针对在居民区和其附近地铁站运营的共享巴士客流进行预测。本专利技术的技术方案:一种基于乘客出行多维特征的共享巴士站点客流预测方法,步骤如下:S1,对共享巴士数据进行预处理S1.1,数据清洗:共享巴士数据包括订单数据和站点 ...
【技术保护点】
一种基于乘客出行多维特征的共享巴士站点客流预测方法,其特征在于,步骤如下:S1,对共享巴士数据进行预处理S1.1,数据清洗:共享巴士数据包括订单数据和站点时间数据,数据清洗包括清除订单数据的错误记录、缺失值、噪声数据和异常值;S1.2,数据筛选:根据预测目标,剔除现金乘客的订单记录,并提取出预测相关的字段;S2,对步骤S1预处理得到的共享巴士数据进行时间划分;S2.1,根据预测目标,选定研究时间范围,并筛选出研究时间范围内的订单数据;S2.1,时间划分,根据共享巴士的行车规律,对研究时间范围进行时间划分,时间划分公式如下:Tk=α+(kθ,(k+1)θ)k=1,2,…,19其中,Tk代表时间段,α代表起始时间,θ代表时间间隔,k代表时间序号;S3,从步骤S2得到的时间划分后的数据中,提取出乘客出行多维特征;S3.1,时间特征提取:时间是影响交通流量的关键因素,考虑到共享巴士的运行规律,基于时间划分结果,将时间序号作为时间特征的输入;S3.2,周次特征提取:工作日和节假日中,共享巴士的客流变化规律有着很大的区别,为了体现流量预测中的周期性变化规律,将周一到周日映射为0到6七个数值作为周次 ...
【技术特征摘要】
1.一种基于乘客出行多维特征的共享巴士站点客流预测方法,其特征在于,步骤如下:S1,对共享巴士数据进行预处理S1.1,数据清洗:共享巴士数据包括订单数据和站点时间数据,数据清洗包括清除订单数据的错误记录、缺失值、噪声数据和异常值;S1.2,数据筛选:根据预测目标,剔除现金乘客的订单记录,并提取出预测相关的字段;S2,对步骤S1预处理得到的共享巴士数据进行时间划分;S2.1,根据预测目标,选定研究时间范围,并筛选出研究时间范围内的订单数据;S2.1,时间划分,根据共享巴士的行车规律,对研究时间范围进行时间划分,时间划分公式如下:Tk=α+(kθ,(k+1)θ)k=1,2,…,19其中,Tk代表时间段,α代表起始时间,θ代表时间间隔,k代表时间序号;S3,从步骤S2得到的时间划分后的数据中,提取出乘客出行多维特征;S3.1,时间特征提取:时间是影响交通流量的关键因素,考虑到共享巴士的运行规律,基于时间划分结果,将时间序号作为时间特征的输入;S3.2,周次特征提取:工作日和节假日中,共享巴士的客流变化规律有着很大的区别,为了体现流量预测中的周期性变化规律,将周一到周日映射为0到6七个数值作为周次特征的输入;S3.3,位置特征提取:共享巴士所处不同位置的站点交通流量变化有明显的差异,将不同站点到达最终目的站点的时间作为衡量地理位置特征的参照,地理位置特征同时也在时间层面上反映站点客流变化;S3.4,历史流量特征提取:对于流量预测而言,历史流量数据规律从本质上决定和影响着未来数据的变化趋势,对于历史流量特征,使用该站点前一天、前两天、前三天对应时间片的历史客流作为历史流量特征的输入;S3.5,时间间隔特征提取:共享巴士的车辆数在研究时间范围内的某一时间点发生了变化,基于对各站点客流情况的分析,发现该时间点前后各站点客流规律出现明显变化,用预测目标日与该时间点的距离作为时间间隔特征的输入来衡量车辆数变化因素;S4,利用步骤S3提取得到的多维特征对机器学习模型XGBoost进行训练,得到预测模型;S4.1,特征处理:为过滤掉特征数据中的不稳定因素,对提取的特征进行以下处理:S4.1.1,特征标准化:为将各个特征值处理在同一范围内,避...
【专利技术属性】
技术研发人员:孔祥杰,李梦琳,付振寰,郑超凡,惠煌,夏锋,
申请(专利权)人:大连理工大学,
类型:发明
国别省市:辽宁,21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。