基于手机信令数据的机场航空旅客分类识别方法技术

技术编号:25598912 阅读:34 留言:0更新日期:2020-09-11 23:56
本发明专利技术公开了一种基于手机信令数据的机场航空旅客分类识别方法。本发明专利技术的步骤为:首先提取目标机场周边基站的手机信令数据,生成机场用户手机表,然后对表中的手机用户的当日信令进行追溯,得到综合数据集,对此数据集进行预处理之后,再划分为三类数据集,参照这三类数据集和预设的航空旅客识别规则,将机场手机用户表中的移动设备识别码进行归类,最后统计各类别手机用户的数量,得到目标机场航空旅客客源地分布特征。本方法可实现利用手机信令数据自动识别机场内各类航空旅客,如进港旅客、出港旅客、中转旅客等,并统计各类航空旅客客源地分布信息,为后续研究各类航空旅客的出行行为特征、刻画机场腹地时空格局奠定基础。

【技术实现步骤摘要】
基于手机信令数据的机场航空旅客分类识别方法
本专利技术涉及大数据计算领域,具体为一种基于手机信令数据的机场航空旅客分类识别方法。
技术介绍
当前航空运输需求快速增长,全球机场吞吐量不断增加。2018年全球定期航班总计运送旅客44亿人次,比2017年增加6.9%,新增旅客2.84亿人次。2013-2018年,我国民航旅客由3.54亿人次增加到6.12亿人次,五年来年均增长率为11.56%。航空客运快速增长导致机场地面交通量快速增长,给机场周边地面交通管制带来巨大挑战。为不断优化航空旅客出行体验,国内外学者非常关注航空旅客出行行为研究。主要通过电话访问、邮件咨询、现场调查等方式,获取航空旅客的社会、经济属性,以及出发时间、出行耗时、出行频率等出行信息,实证探讨航空旅客出行行为的驱动因素。但以上方法获取的航空旅客出行行为信息存在样本少、时效性差、行为轨迹不连续等缺点。手机信令数据具有时空信息丰富、时间分辨率高、获取成本低等优势,为研究航空旅客出行行为提供了丰富的数据来源。本申请就是依据手机信令数据对机场航空旅客的出行行为进行研究。
技术实现思路
本专利技术要解决的技术问题是提供一种基于手机信令数据的机场航空旅客分类识别方法,该方法可实现利用手机信令数据自动识别机场内各类航空旅客,如进港旅客、出港旅客、中转旅客等,并统计各类航空旅客客源地分布信息,为后续研究各类航空旅客的出行行为特征、刻画机场腹地时空格局奠定基础。为解决上述技术问题,本专利技术采用的技术方案是:一种基于手机信令数据的机场航空旅客分类识别方法,包括如下步骤:步骤1、选定目标机场附近的基站,以“日”为单位,提取至少七日内各基站0-24小时所捕捉到的全部手机信令数据,将信令数据中的移动设备识别码无重复的保存生成机场手机用户表。提取的时间越长,提取的数据越多,所包含的信息就越全面可靠。本申请将时间的提取宽度设定为七天,在实际应用中,可根据需要和精确度自由调整时间宽度。为了最大限度的降低冗余,将同日内多次出现的相同的移动设备识别码仅保留一条,按照同一用户进行保存。步骤2、对上述机场手机用户表中每个移动设备识别码对应的手机用户进行回溯追踪,提取各手机用户出现当日在省内的所有信令数据,这些信令数据皆为公知格式,除了移动设备识别码外,还含有信令的发生时间、经度、纬度等字段;每个移动设备识别码对应唯一的手机用户,该用户下的所有信令数据构成用户记录,机场手机用户表中所有移动设备识别码对应的手机用户的用户记录形成综合数据集,亦即,综合数据集是由一组组用户记录组成,用户记录中包含一日当中某手机用户的所有信令;步骤3、对上述综合数据集进行数据预处理,删除用户记录中的重复信令数据和无效信令数据,降低数据冗余,提高处理效率;步骤4、将步骤3中得到的综合数据集拆分为目标机场数据集A、其他机场数据集B和外围数据集O;所述目标机场数据集A指的是目标机场附近各基站内手机用户的用户记录组成的数据集;此数据集中有信令数据的手机用户,被识别为在目标机场活动过的旅客,该用户的信令在此数据集中出现的时间,是本申请类别判定的关键节点;其他机场数据集B指的是省域范围内、目标机场以外的其他机场附近基站内手机用户的用户记录组成的数据集,在本申请中,此数据集中有信令数据的手机用户,被识别为从省内其他机场出发或到达该机场的航空旅客;外围数据集O指综合数据集中除去目标机场数据集A、其他机场数据集B以外的所有信令组成的数据集;此数据集中有信令数据的手机用户,被识别为省内机场以外所有地区的用户,即市区、郊区、农村等地的用户。步骤5、参照上述数据集和预设的航空旅客识别规则,对步骤1中机场手机用户表内的移动设备识别码逐一分类,归到预定的八类旅客中;步骤6、根据步骤5中的分类结果,统计各类航空旅客含有的手机用户的数量,将其作为所选目标机场航空旅客中各类旅客的数量,得到目标机场航空旅客客源地分布特征。上述步骤1中手机信令基站位于所选机场周边2公里范围内,即,以机场为中心,半径为2公里的圆形地域范围内;此范围为本申请所用范围之一,根据实际需要,可调整此范围。上述步骤3中所述重复信令指用户记录中发生时间、经度、纬度完全一致的信令,所述无效信令指用户记录中发生时间、经度、纬度字段为空的信令。这些信令的存在会增加数据冗余,降低信息处理效率,因此要将其删除。上述步骤5中八类旅客具体为:从省外进港旅客、从省内进港旅客、出港去省外旅客、出港去省内旅客、由省外进港飞往省外的中转旅客、由省外进港飞往省内的中转旅客、由省内进港飞往省外的中转旅客和其他。步骤5中,八类旅客识别规则具体为:确定手机用户1在目标机场数据集A中第一条信令的出现时间tA1和最后一条信令出现的时间tA2,将手机用户1在tA1之前的最后一条信令命名为前信令,将手机用户1在tA2之后的第一条信令命名为后信令:(1)其他机场数据集B和外围数据集O中不存在前信令,并且也不存在后信令,那么判定手机用户1对应的航空旅客为“从省外进港且飞往省外的中转旅客”;(2)其他机场数据集B和外围数据集O中不存在前信令,但后信令出现于其他机场数据集B中,那么判定手机用户1对应的航空旅客为“从省外进港且飞往省内的中转旅客”;(3)其他机场数据集B和外围数据集O中不存在前信令,但后信令出现于外围数据集O中,那么判定手机用户1对应的航空旅客为“从省外进港的旅客”;(4)前信令出现于外围数据集O中,但其他机场数据集B和外围数据集O中不存在后信令,那么判定手机用户1对应的航空旅客为“出港到省外的旅客”;(5)前信令出现于外围数据集O中,且后信令出现于其他机场数据集B中,那么判定手机用户1对应的航空旅客为“出港到省内的旅客”;(6)前信令出现在其他机场数据集B中,但后信令未出现于其他机场数据集B和外围数据集O中,那么判定手机用户1对应的航空旅客为“从省内进港且飞往省外的中转旅客”;(7)前信令出现在其他机场数据集B中,且后信令出现在外围数据集O中,那么判定手机用户1对应的航空旅客为“从省内进港的旅客”;(8)除上述七类航空旅客之外的旅客,判定为“其他旅客”。在步骤1和步骤2之间还设有优选步骤:在步骤1得到的机场手机用户表中,将7日之内连续3天及以上出现的移动设备识别码删除。采用上述技术方案所取得的技术效果在于:明确各类航空旅客数量及客源地分布特征有利于机场、航空公司定位潜在市场、优化资源配置。由于航空旅客数量及客源地信息属于各航空公司的私有数据,其数据可获得性存在局限。随着航空客运快速增长,机场地面交通量增长迅速,给机场周边地面交通管制带来巨大挑战。为不断优化航空旅客出行体验,国内外学者非常关注航空旅客出行行为研究。而传统的电话访问、邮件咨询、现场调查等方式,获取的航空旅客出行行为信息存在样本少、时效性差、行为轨迹不连续等缺点。基于手机信令数据,构建了航空旅客分类识别规则,分类识别机场航空旅客,为本文档来自技高网...

【技术保护点】
1.一种基于手机信令数据的机场航空旅客分类识别方法,其特征在于,包括如下步骤:/n步骤1:选定目标机场附近的基站,以“日”为单位,提取至少七日内各基站0-24小时所捕捉到的全部手机信令数据,将信令数据中的移动设备识别码无重复的保存生成机场手机用户表;/n步骤2:对上述机场手机用户表中每个移动设备识别码对应的手机用户进行回溯追踪,提取各手机用户出现当日在省内的所有信令数据,每个手机用户下的所有信令数据构成该用户的用户记录,所有手机用户的用户记录形成综合数据集;/n步骤3:对上述综合数据集进行数据预处理,删除用户记录中的重复信令数据和无效信令数据;/n步骤4:将步骤3中得到的综合数据集拆分为目标机场数据集A、其他机场数据集B和外围数据集O;所述目标机场数据集A指的是目标机场附近各基站内手机用户的用户记录组成的数据集;其他机场数据集B指的是省域范围内、目标机场以外的其他机场附近基站内手机用户的用户记录组成的数据集;外围数据集O指综合数据集中除去目标机场数据集A、其他机场数据集B以外的所有用户记录组成的数据集;/n步骤5:参照上述数据集和预设的航空旅客识别规则,对步骤1中机场手机用户表内的移动设备识别码逐一分类,归到预定的八类旅客中;/n步骤6:根据步骤5中的分类结果,统计各类航空旅客含有的手机用户的数量,将其作为所选目标机场航空旅客中各类旅客的数量,得到目标机场客源地分布特征。/n...

【技术特征摘要】
1.一种基于手机信令数据的机场航空旅客分类识别方法,其特征在于,包括如下步骤:
步骤1:选定目标机场附近的基站,以“日”为单位,提取至少七日内各基站0-24小时所捕捉到的全部手机信令数据,将信令数据中的移动设备识别码无重复的保存生成机场手机用户表;
步骤2:对上述机场手机用户表中每个移动设备识别码对应的手机用户进行回溯追踪,提取各手机用户出现当日在省内的所有信令数据,每个手机用户下的所有信令数据构成该用户的用户记录,所有手机用户的用户记录形成综合数据集;
步骤3:对上述综合数据集进行数据预处理,删除用户记录中的重复信令数据和无效信令数据;
步骤4:将步骤3中得到的综合数据集拆分为目标机场数据集A、其他机场数据集B和外围数据集O;所述目标机场数据集A指的是目标机场附近各基站内手机用户的用户记录组成的数据集;其他机场数据集B指的是省域范围内、目标机场以外的其他机场附近基站内手机用户的用户记录组成的数据集;外围数据集O指综合数据集中除去目标机场数据集A、其他机场数据集B以外的所有用户记录组成的数据集;
步骤5:参照上述数据集和预设的航空旅客识别规则,对步骤1中机场手机用户表内的移动设备识别码逐一分类,归到预定的八类旅客中;
步骤6:根据步骤5中的分类结果,统计各类航空旅客含有的手机用户的数量,将其作为所选目标机场航空旅客中各类旅客的数量,得到目标机场客源地分布特征。


2.根据权利要求1所述的基于手机信令数据的机场航空旅客分类识别方法,其特征在于,上述步骤1中目标机场附近的基站位于所选机场周边2公里范围内。


3.根据权利要求1所述的基于手机信令数据的机场航空旅客分类识别方法,其特征在于,上述步骤3中所述重复信令数据指用户记录中发生时间、经度、纬度完全一致的信令,所述无效信令数据指用户记录中发生时间、经度、纬度字段为空的信令。


4.根据权利要求1所述的基于手机信令数据的机场航空旅客分类识别方法,其特征在于,上述步骤5中八类旅客具体为:从省外进港旅客、从省内进港旅客、出港去省外旅客、出港去省内旅客、由省外进港飞往...

【专利技术属性】
技术研发人员:刘劲松姚海芳
申请(专利权)人:河北师范大学
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1