当前位置: 首页 > 专利查询>四川大学专利>正文

乘客航线预测算法制造技术

技术编号:13927959 阅读:79 留言:0更新日期:2016-10-28 10:51
本发明专利技术是一个乘客个人航线预测算法,可以对乘客下一航线选择进行预测。在基础研究中提出了吸引力模型中,考虑了基础设施网络对出行所带来的影响。通过实验论文了人们出行的行程分布特性是由基础设施网络所导致的。在对乘客的下一航线进行预测,通过比较当前航线的出发机场,目的机场与Home之间的关系,分别进行预测,并充分考虑了乘客的飞行特性。当前航线的目的机场等于Home时,考虑乘客的当前状态,上一次出发的星期,时间段,城市的吸引以及时间的距离远近,并分别用公式进行表示。在乘客选择新的航线时考虑了群集特性,机场与机场之间的距离,通过选择下一最有可能的距离来选择机场。通过实验发现,模型的平均预测精度可以达到68%,并通过改变实验的环境,改变预测的长度和预测人数,发现预测相对比较稳定。

【技术实现步骤摘要】
所属
本专利技术涉及乘客航线预测系统,是对乘客的下一航线选择进行预测。
技术介绍
近年来,信息技术广泛应用在各行各业,数据增长速度越来越快,庞大的数据量对海量数据处理技术提出来挑战。在民航运输业,随着各机场、航空公司信息化建设的深入,电子设备产生的大量旅客出行数字痕迹得以保留,其数据规模达到了PB级,具备大数据的规模性、多样性和高速性三个特点。民航交通分布与乘客出行密切相关,民航业大数据隐含了大量旅客出行的模式信息。现有的交通分布模型并未考虑旅客出行的规律性和可预测性。人类空间移动行为表现出的无标度特性是由基础设施网络本身无标度特性决定,但是该结论缺少足够的证据。在地面交通网络上,对乘客的下一地点的预测已有一些研究,但是在空中交通网络上对乘客的航线进行预测还未有相关研究。航空公司对乘客的个性化服务,所以了解乘客的下一去向是很有必要。
技术实现思路
在乘客的群集特性上提出了吸引力模型,实证了乘客的出行特性,发现具有拉伸指数分布,而并不是之前认为的幂率分布或指数分布。数据上让人类空间行程分布特性增加了丰富性的同时对人类行程分布的特性提出了新的结果。通过数据预处理,提取了航空基础设施网络,利用Netlogo在基础设施网络上进行模拟出行。首先利用了RM随机游走模型进行模拟人的出行,模拟数据得到的旅客的行程分布是对数正态,与实际的拉伸指数并不一致。在此基础上,对模型进行修改,考虑了不同的乘客具有不同的吸引力,一级城市(比如北京)对乘客的吸引力更强。吸引力计算公式:其中di表示机场节点的连通度,k是一个自由参数。该模型为吸引力模型,利用模型得到的乘客行程分布特性与实际数据特性一致,且参数值吻合,模型再现了人们出行的行程分布特性。人们的出行既有返回已经去过的特性,同时会探索新的地点。利用乘客的历史航线轨迹,当前的航线及时间特性等,提出了排行榜模型,对乘客的下一航线的选择进行预测。通过实验验证,本方法的预测效果最好可以达到68%的预测精度。本专利技术的核心思想是通过数据分析,利用参数估计和假设检验对乘客的出行距离进行分布实证得到其分布,进而用数学表达式进行刻画。该思想使得可以脱离以前研究的假设,具有重要意义。针对乘客的飞行特性,分情况进行预测,既能对预测出乘客中已经去过的地点同时可以预测出乘客没有去过的地点,获得了良好的预测精度。本专利技术的有益效果是,研究乘客行程分布的内在机制,可以使得我们更加了解基础设施网络对出行所产生的影响。通过对乘客的下一航线进行预测,了解了乘客下一航线选择的影响因素,以便可以对乘客进行个性化服务。附图说明下面结合附图对本专利技术进行进一步说明。图1技术路线。图2预测算法流程图。图3乘客航线预测结果。具体实施方式图1中,为乘客航线预测的路线,利用旅客的出行数据,通过大数据预处理,将数据一部分用来分析建模,另一部分用来验证模型的有效性。采用了假设检验,多Agent技术仿真探求乘客的行程分布特性以及出行影响因素。在个体特性研究方面,利用了信息熵、统计学习方法挖掘乘客的飞行模式以及计算了理论的可预测值。最后利用了机器学习和人类动力学的方法,提出了航线预测模型。图2中,为乘客航线预测算法的流程图。根据乘客当前航线的出发机场与目的机场与乘客的Home之间的关系,分别进行预测。如果当前航线的出发机场等于Home,那么,构建改进的1阶马尔科夫状态转移矩阵,用转移的次数代替转移的比例。根据当前的状态找出可能性最大的两个值,并计算二者之差,如果大于给定的阈值,那么选择最大值所对应的航线,否则认为乘客下一航线会回家。当出发机场和目的机场均不为Home时,同上计算最大的两个值的差值,并与阈值比较,如果大于阈值,选择最大值所对应的航线,否则判断最大值所对应的航线如果是在空中进行往返或者是回家,那么选择最大值所对应的航线,否则认为乘客的下一次出行为回家。当乘客的目的机场为Home时,此时乘客有两种选择,一种是选择已经去过的地点,另外一种是选择没有去过的地点。利用朴素贝叶斯的思想,计算公式为:基于以下特征独立性假设,选取的乘客的四个特征为:乘客的历史航线总数,乘客不同的航线数,乘客不同航线数\\乘客的历史航线总数,乘客探索新航线的次数。如果乘客选择已经去过的地点的话,那么乘客下一地点的选择因素主要有X(n),Hs(n),Ws(n),Att,T_short,决定,计算公式如下所示:其中,X(n)为当前的状态,为一阶马尔科夫链F(X(n+1)|X(n))=F(X(n+1)=sn+1|X(n)=sn)表示出发的星期和出发的时段,将一天分成了四个时段,0代表的时间段为0:00:00~6:00:00,1表示的时间段为6:00:00~12:00:00,2表示的时间段为12:00:00~18:00:00,3表示的时间段为18:00:00~24:00:00,计算公式表示为:Atti表示不同城市的吸引,公式表达为,为了表示时间的最近相关性,引入了T_short,用次数来代替时间,可由以下公式表达:当乘客返回之前去过的地点时,考虑乘客的群集特性,以及机场之间的距离,首先选择下一最有可能的距离,并在符合距离的机场中选择吸引力最高的机场。P(Xk+1=j|Xk=i)=fd(dij)图3,为乘客航线的预测结果,可以看出效果还不错。本文档来自技高网...

【技术保护点】
乘客的个体出行距离具有差异性,在群集上乘客的行程分布具有拉伸指数的分布特性。对行程分布的特性的内在机制是什么?人类动力学的一些研究从人的角度出发,考虑了周期性、阵发性等特性,但很少考虑基础设施网络的影响。通过建模发现人们出行的行程分布特性是由基础实施网络影响。乘客飞行具有以某一个地点为中心,向四周进行辐射,经常在某几个地点活跃,偶尔会去探索新的地点。针对乘客的飞行特性,采用机器学习和人类动力学的方法,对乘客的下一航线的选择进行预测。预测精度达到68%。

【技术特征摘要】
1.乘客的个体出行距离具有差异性,在群集上乘客的行程分布具有拉伸指数的分布特性。对行程分布的特性的内在机制是什么?人类动力学的一些研究从人的角度出发,考虑了周期性、阵发性等特性,但很少考虑基础设施网络的影响。通过建模发现人们出行的行程分布特性是由基础实施网络影响。乘客飞行具有以某一个地点为中心,向四周进行辐射,经常在某几个地点活跃,偶尔会去探索新的地点。针对乘客的飞行特性,采用机器学习和人类动力学的方法,对乘客的下一航线的选择进行预...

【专利技术属性】
技术研发人员:彭舰陈继德宁黎苗陈瑜李梦诗黄飞虎徐文政刘唐黎红友
申请(专利权)人:四川大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1