一种考虑时空非平稳性的网约车出行需求预测方法技术

技术编号:32856631 阅读:13 留言:0更新日期:2022-03-30 19:28
本专利属于智能交通技术领域,公开了一种考虑时空非平稳性的网约车出行需求预测方法,包括:步骤一、交通小区划分,步骤二、网约车需求和建成环境数据提取;步骤三、因子分析法提取公共因子;步骤四:时空地理加权回归模型计算。本方法可以从原有建成环境因素中提取数量更少的主因子,再基于时空地理加权回归对网约车出行需求进行预测,既考虑了网约车需求的时空非平稳性,又尽可能多地保留了原始变量的信息,同时使主因子之间不相关,从而避免原有自变量之间共线性的影响,提升模型计算效率,为城市交通管理者和网约车公司提前制定更具针对性的策略提供参考依据。对性的策略提供参考依据。对性的策略提供参考依据。

【技术实现步骤摘要】
一种考虑时空非平稳性的网约车出行需求预测方法


[0001]本专利技术属于智能交通领域,具体涉及一种考虑时空非平稳性的网约车出行需求预测方法。

技术介绍

[0002]得益于智能手机的普及,网约车作为一种新兴的出行方式在中国快速发展。截至2021年6月,中国网约车的用户规模达3.97亿,已覆盖全国400多个城市,总订单量超43.1亿,网约车已经成为中国城市居民的主要出行方式之一。但同时,网约车出行需求的时空非平稳性也导致了大量网约车司机空载巡游、乘客附近无车等现象,严重影响网约车运营效率,造成社会资源浪费。而准确的网约车出行需求预测可以帮助网约车公司提前对司机进行调度,降低车辆空载距离,减少尾气排放,节省乘客等待时间,有效提升网约车出行运营效率。
[0003]目前,对网约车出行需求的预测以研究城市建成环境、天气等因素为主。传统的需求预测模型包括最小二乘法、地理加权回归等。其中部分模型考虑了空间非平稳性,例如地理加权回归模型在最小二乘法的基础上加入变量的空间位置坐标,使不同地理位置的影响得以反映在模型中。尽管有模型考虑到空间非平稳性,但网约车出行同样有明显的时间非平稳性,在高峰时间网约车出行集中,而在平峰时间则网约车出行需求较少。为了同时考虑时空非平稳性,时空地理加权回归模型近年来被应用于交通需求预测领域,相比于传统的最小二乘法和地理加权回归,时空地理加权回归的预测精度更高,更适合时空非平稳性明显的交通需求预测。尽管当前基于时空地理加权回归模型的研究同时考虑了时空属性,但仍然存在未充分考虑不同自变量之间的影响关联、自变量过多时降低模型计算效率等问题。
[0004]针对上述问题,本专利首先采用因子分析,对影响网约车出行需求的建成环境等因素进行公共因子提取,再根据累计贡献率高于80%的原则选择主因子作为自变量,实现自变量降维,最后基于时空地理加权回归模型对网约车出行需求进行预测。该方法既考虑了网约车出行的时空非平稳性,又可以提升模型计算效率,避免原有自变量之间共线性的影响,为城市交通管理者和网约车公司提前制定更具针对性的策略提供参考依据。

技术实现思路

[0005]本专利技术要解决的技术问题是:克服上述现有技术的不足,提出一种网约车出行需求预测方法。
[0006]本专利技术的技术方案为:一种考虑时空非平稳性的网约车出行需求预测方法,包括以下步骤:
[0007]步骤一:交通小区划分
[0008]首先将研究区域划分为若干个交通小区,划分方式可以分为街道乡镇划分和栅格划分。
[0009]步骤二:网约车需求和建成环境数据提取
[0010]本步骤中的网约车数据来自于网约车平台订单数据,数据包括:订单编号、出发时间、经纬度等信息。然后利用网约车数据计算不同时段每个交通小区的网约车需求,时段长度通常为一小时或一天。
[0011]建成环境数据基于城市兴趣点(POI)数据计算得到,通过计算得到每个交通小区的建成环境密度。
[0012]步骤三:因子分析法提取公共因子
[0013]利用因子分析法提取交通小区内原有建成环境变量的公共因子。假设有N个交通小区,每个交通小区有M个建成环境变量。
[0014]1)数据标准化
[0015]使用z

score标准化方法,将原有各个建成环境变量的数据转化为无量纲数据,标准化的公式如下:
[0016][0017]式中,x
ij
为第j个交通小区的第i个变量值,为第i个变量的平均值,σ
i
为第i个变量的标准差,z
ij
为第j个交通小区的第i个变量标准化之后的值。
[0018]平均值和标准差σ
i
的公式如下:
[0019][0020][0021]2)计算相关系数矩阵并检验
[0022]在数据标准化后,对计算各个变量之间的相关系数,用于检验变量间的相关性。第i个变量和第p个变量之间的相关系数r
ip
计算公式如下:
[0023][0024]式中,z
ij
为第j个交通小区的第i个变量标准化之后的值,为第i个变量标准化之后的平均值。
[0025]由于共有M个变量,计算每个变量之间的相关系数后,可以得到全部变量的相关系数矩阵R:
[0026][0027]提取公共因子,需要变量之间存在一定的相关性,若相关性太弱,则无法提取公共因子。因此需要对变量间的相关性进行检验,若相关矩阵中的大部分系数都大于0.3时,并能通过巴特利球体检验,则说明因子分析适用于这些变量。
[0028]3)计算相关系数矩阵的特征值以及公共因子的贡献率
[0029]通过相关系数矩阵的特征方程,可以得到矩阵的特征值。特征方程如下:
[0030]|λI

R|=0
[0031]式中,λ为特征值,I为单位矩阵
[0032]通过特征方程,可得M个特征值λ1,λ2,


M
,以及M个特征向量Y1,Y2,

,Y
M
。Y即变量中的公共因子,是变量的线性组合,且互相之间无关。
[0033]由于λ
q
是公共因子Y
q
的方差,则第q个公共因子Y
q
对原始数据的贡献率为:
[0034][0035]式中,d
q
为第q个公共因子对原始数据的贡献率,λ
q
为第q个公共因子的特征值。
[0036]在计算得到所有公共因子的贡献率后,根据累计贡献率高于80%的原则,选择贡献率较大的前m个公共因子作为主因子。
[0037]4)因子载荷矩阵计算
[0038]由于公共因子Y是变量的线性组合,因此,可以将公共因子用M个标准化后的变量Z1,Z2,

,Z
M
表示:
[0039]Y1=a
11
Z1+a
21
Z2+

+a
M1
Z
M
[0040][0041]Y
q
=a
1q
Z1+a
2q
Z2+

+a
Mq
Z
M
[0042][0043]Y
M
=a
1M
Z1+a
2M
Z2+

+a
MM
Z
M
[0044]式中,a
Mq
为第q个公共因子在第M个变量时对应的向量分量,Y1,Y2,

,Y
M
根据贡献率由大到小排列,Y1贡献率最大,Y
M
贡献率最小。
[0045]由于特征根互相正交,则Y和Z之间是可逆的,因此关系式可转换为:
[0046]Z1=a
11
Y1+
...

【技术保护点】

【技术特征摘要】
1.一种考虑时空非平稳性的网约车出行需求预测方法,其特征在于,包括如下步骤:步骤一、交通小区划分,将目标区域划分为若干个交通小区;步骤二、网约车需求和建成环境数据提取;提取历史网约车数据中的订单编号、出发时间、经纬度等信息;然后利用网约车数据计算不同时段每个交通小区的网约车需求;基于城市兴趣点数据计算建成环境数据;步骤三、因子分析法提取公共因子利用因子分析法提取交通小区内原有建成环境变量的公共因子;假设有N个交通小区,每个交通小区有M个建成环境变量。S3.1数据标准化,将原有各个建成环境变量的数据转化为无量纲数据,S3.2计算相关系数矩阵并检验计算数据标准化后的各个变量之间的相关系数,用于检验变量间的相关性。第i个变量和第p个变量之间的相关系数r
ip
计算公式为计算公式为式中,z
ij
为第j个交通小区的第i个变量标准化之后的值,为第i个变量标准化之后的平均值;计算每个变量之间的相关系数后,可以得到全部变量的相关系数矩阵其中M为变量个数;然后检验对变量间的相关性进行检验;S3.3计算相关系数矩阵的特征值以及公共因子的贡献率通过相关系数矩阵的特征方程|λI

R|=0式中,λ为特征值,I为单位矩阵,得到矩阵的特征值λ1,λ2,


M
以及M个特征向量Y1,Y2,

,Y
M
;Y即为变量中的公共因子;第q个公共因子Y
q
对原始数据的贡献率式中,d
q
为第q个公共因子对原始数据的贡献率,λ
q
为第q个公共因子的特征值;在计算得到所有公共因子的贡献率后,选择贡献率前m个公共因子作为主因子;步骤四、时空地理加权回归模型计算将数据的空间位置、时间信息和主因子数据输入时空地理加权回归模型,对网约车出行需求进行预测。2.根据权利要求1所述的一种考虑时空非平稳性的网约车出行需求预测方法,其特征在于,所述步骤三还包括:S3.4子载荷矩阵计算将公共因子用M个标准化后的变量Z1,Z2,

,Z
M
表示为关系式:
式中,a
Mq
为第q个公共因子在第M个变量时对应的向量分量,Y1,Y2,

,Y
M
根据贡献率由大到小排列,Y1贡献率最大,Y
M
贡献率最小...

【专利技术属性】
技术研发人员:于海洋陈咨霖任毅龙刘润坤方婧
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1