【技术实现步骤摘要】
一种基于综合交通大数据的融合型旅客关系网络构建方法
[0001]本专利技术涉及大数据领域,具体涉及一种基于综合交通大数据的融合型旅客 关系网络构建方法。
技术介绍
[0002]不同的交通工具,如火车、飞机、汽车等,每年都会承载大量旅客出行, 随着信息技术的发展,各类交通方式的管理部门以及相关企业均通过其业务信 息系统收集了大量旅客出行记录。经统计,约三分之一的铁路旅客选择与其他 旅客共同出行,而该数据是通过识别旅客是否在同一订单订票得到,实际中可 能存在分开买票等情况,故实际上存在超过三分之一的铁路旅客选择与他人结 伴出行。
[0003]了解旅客以及其出行特征对相关管理部门制定城市规划、管理政策、防控 疫情以及对相关企业优化旅客分类方法、识别重要旅客、开展精准营销、提升 服务水平十分重要。目前对于旅客的分析方法,关注旅客个体而忽略了旅客之 间的关系,然而,旅客出行团体的大小、团体成员间的社会关系对于旅客出行 的目的、出行方式的选择、以及对旅游产品和服务的偏好等都有很大的影响。 因此,需要一种可以描述旅客之间关系的方法 ...
【技术保护点】
【技术特征摘要】
1.一种基于综合交通大数据的融合型旅客关系网络构建方法,其特征在于,包括如下步骤:S1、获取旅客出行历史记录并进行预处理;S2、根据步骤S1与处理后的旅客出行历史记录获取其中多人同行的订票记录,并根据该订票记录抽取旅客关系;S3、基于步骤S2获取的旅客关系构建各类单一交通方式的旅客关系网络;S4、将步骤S3构建的单一交通方式的旅客关系网络进行集成,获取跨交通方式的旅客关系并构建融合型旅客关系网络;S5、利用新收集的数据作为融合型旅客关系网络的增量数据,得到融合性旅客关系网的动态增长模型。2.根据权利要求1所述的基于综合交通大数据的融合型旅客关系网络构建方法,其特征在于,所述步骤S1预处理方法具体包括:S11、对获取的旅客出行历史记录进行重构,将其中与旅客出行无关的数据缺失以空值填充,对旅客出行相关的数据异常和缺失进行剔除;S12、将进行了重构后的旅客出行历史记录中不同交通方式的数据进行统一编码,其中的统一标准为旅客历史出行记录中数据量最多的交通方式的数据为标准;S13、将经过步骤S12统一编码之后的旅客出行历史记录存储为旅客出行历史数据表,并以旅客个人身份信息为旅客的识别标识。3.根据权利要求2所述的基于综合交通大数据的融合型旅客关系网络构建方法,其特征在于,所述步骤S2具体为:S21、从数据库中读取步骤S13得到的旅客出行历史数据表,并以订单号为键值Key,订单本身为真值Value通过哈希表进行存储,其中,哈希表中的每一个键值对应一组通行关系,真值中包含n条出行订单,产生n*(n
‑
1)/2两两之间旅客关系;S22、以哈希表中每一条旅客出行关系出行信息为一行记录,转存为旅客关系记录表。4.根据权利要求3所述的基于综合交通大数据的融合型旅客关系网络构建方法,其特征在于,所述步骤S3具体为:S31、获取单一交通方式中任意旅客关系网络的节点集合;S32、计算步骤S31获取的旅客关系网络的超边集合与节点集合形成完整的旅客关系网络。5.根据权利要求4所述的基于综合交通大数据的融合型旅客关系网络构建方法,其特征在于,所述步骤S31具体为:S311、从数据库中读取旅客个人信息记录并存储到哈希表,其中以旅客的编号为键值,个人信息及其出行信息作为真值;S312、遍历哈希表,获取旅客编号中节点出现最早日期t1及最晚日期t
n
,通过日期函数创建日期集合T={t1,t2,...,t
n
),再以该日期集合为键值创建新的集合V
i,t
,其中t∈T,i为第i个旅客关系网络;S313、根据旅客个人信息记录中的出现最早日期,将其对应的旅客编号加入到集合V
i,t
对应的位置中,得到的V
i,t
,表示t时刻新加入到第i个旅客关系网络中的节点集合,表示第i个旅客关系网络的节点集合,n表示节点个数。
6.根据权利要求5所述的基于综合交通大数据的融合型旅客关系网络构建方法,其特征在于,所述步骤S32具体为:S321、提取旅客关系记录中的旅客编号,构成超边e
i,j,t
,其中,e
i,j,t
表示第i个旅客关系网络在t时刻新加入的第j条超边,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。