【技术实现步骤摘要】
基于多模态信息融合的城市轨道交通客流预测方法
[0001]本专利技术属于城市轨道交通客流
,更为具体地讲,涉及一种基于多模态信息融合的城市轨道交通客流预测方法
。
技术介绍
[0002]交通流量预测是交通运输领域中的一个重要问题,它可以帮助交通管理部门更好地规划和调度交通资源,提高交通效率,改进交通系统的服务水平
。
随着经济实力的快速提升和城市发展的迫切需求,众多城市开展了大规模的城市轨道交通建设,对城市轨道交通的客流进行准确预测成为轨道交通管理的重要问题
。
预测能够帮助交通管理者预测未来的客流量,从而调整运力
、
优化列车班次,以满足乘客出行需求,同时也能够为未来轨道交通线路和站点布局提供依据,不断提高交通系统的服务水平
。
[0003]现有主流的轨道交通流量预测方法大多是基于历史交通流量数据,通过时间序列分析
、
机器学习和深度学习方法,再结合其他相关时空数据,如天气
、
时间
、
节假日等,
【技术保护点】
【技术特征摘要】
1.
一种基于多模态信息融合的城市轨道交通客流预测方法,其特征在于,包括以下步骤:
S1
:获取城市兴趣点数据,包括兴趣点的名称
、
类别
、
坐标和面积,对兴趣点的名称和类别分别进行编码,得到名称向量和类别向量,对兴趣点的坐标向量和面积进行归一化,然后将兴趣点的名称向量
、
类别向量
、
归一化坐标向量
、
归一化面积进行拼接得到兴趣点的特征向量;记城市中兴趣点数量为
D
,第
d
个兴趣点的特征向量为
s
d
,
d
=
1,2,
…
,D
;
S2
:获取轨道交通站点特征向量,包括以下步骤:
S2.1
:获取每个轨道交通站点
Station
n
的位置数据,包括站点编号
、
地理坐标
、
所属线路编码
、
上一站距离和下一站距离,
n
=
1,2,
…
,N
,
N
表示轨道交通站点的数量;然后根据每个站点的位置数据建立轨道交通无向图,具体方法为:将每个站点作为节点,根据站点之间的连接关系确定站点之间的边,相邻站点之间边的权重为这两个相邻站点之间列车的行驶时间;
S2.2
:对于每个兴趣点
POI
d
,计算其与各个轨道交通站点的地理位置距离,然后筛选出距离最近的
K1个地理最近邻站点,
K1的值根据实际情况设置;获取公众从每个地理最近邻站点到兴趣点
POI
d
所需的行程时长
time(n
k
,d)
,
n
k
表示第
k
个地理最近邻站点的原始序号,
k
=
1,2,
…
,K1;对于其他每个站点
Station
n
′
,
n
′
=
1,2,
…
,N
,
n
′
≠n
k
,计算其在轨道交通无向图与每个地理最近邻站点之间每条路径上边的权重和作为该条路径的行程时长,如果某个站点与某个地理最近邻站点之间不存在路径,则行程时长为无穷大;然后对于站点筛选出所有行程时长中的最小值,对应地理最近邻站点的序号记为对应行程时长记为计算得到站点
Station
n
′
到兴趣点
POI
d
的行程时长关联度
r(n
′
,d)
=
1/time(n
′
,d)
;
S2.3
:对于每个兴趣点
POI
d
,筛选与其行程时长最小的前
K2个轨道交通站点,作为兴趣点
POI
d
的行程最近邻站点,
K2的值根据实际情况设置;
S2.4
:对于每个轨道交通站点
Station
n
,获取将站点
Station
n
作为行程最近邻站点的兴趣点集合
ω
n
,将兴趣点集合
ω
n
中各个兴趣点的特征向量拼接后再将拼接特征向量通过正交映射对齐至预设维度
γ1得到特征向量
S
n
,将兴趣点集合
ω
n
中各个兴趣点与站点
Station
n
的关联度构成关联度向量后再将关联度向量通过正交映射对齐至预设维度
γ2得到特征向量
R
n
,从而构成站点
Station
n
的特征向量
G
n
=
[Line
n
,Num
n
,S
n
,R
n
]
,其中,
Line
n
表示轨道交通站点
Station
n
所属线路编号,
Num
n
表示轨道交通站点
Station
n
的站点编号;
S3
:从社交媒体的文本中提取公众出行城市兴趣点特征,包括以下步骤:
S3.1
:根据实际需要设置关键词和时间段的时长,从社交媒体上爬取若干组文本信息,每组文本信息中包含
T
个连续时间段的文本信息,文本信息包括用户发布内容
、
评论和标签,采用预设的预处理方法对每个文本信息进行预处理得到文本数据;
S3.2
:对于步骤
S3.1
收集到的每个文本数据分别提取主题,筛选出交通出行类主题的文本数据,将其余主题的文本数据删除;
S3.3
:对于每组经过交通出行类主题筛选的文本数据,按照时间段将文本数据整合为一个合并文本数据,将
T
个时间段的合并文本数据构成文本数据序列;
S3.4
:从每个合并文本数据中挖掘出行兴趣内容特征并进行情感特征分析,然后构建出行兴趣特征矩阵,包括以下步骤:
S3.4.1
:对于每个文本数据序列中的每个合并文本数据,采用
CBoW
模型提取出该合并文本数据中若干个中心词
w
i
的词向量
f(w
i
)
=
[t
i,1 t
i,2
ꢀ…ꢀ
t
i,H
]
,
i
=
1,2,
…
,M
,
M
表示文本数据中中心词的数量,
H...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。