【技术实现步骤摘要】
一种乘车信息映射关系获取方法
本专利技术涉及数据处理
,具体涉及一种乘车信息映射关系获取方法。
技术介绍
目前,铁路售票已经使用手机进行,但是,由于往往存在用某一手机号为他人订票或手机号开号人并非手机使用者的情况,因此,这些情况会导致通过手机定位查找旅客的结果不准确。并且,由于存在高铁通勤的情况,因此数据冗余严重,导致运算效率低下。
技术实现思路
为解决前述问题,本专利技术提供了一种乘车信息映射关系获取方法,使得乘客的手机号、身份证号和所乘火车车次之间的关系更加准确。为了达到上述目的,本专利技术采用如下技术方案:一种乘车信息映射关系获取方法,包括如下步骤:获取铁路检票数据,基于手机信令信号获取对应的位置数据;基于位置数据对某一时间段内所有手机信令信号进行筛选;根据检票数据确定筛选后的手机信令信号所对应的机主的乘坐列车,获取所述乘坐列车的轨迹并计算所述乘坐列车的列车轨迹指纹;获取该时间段内出现在省级行政单位区域中至少一个火车站范围内的手机信令信号以及所述手机信令信号所对应的选定机主,计算所述选定机主的轨迹指纹,将轨迹指纹与列车轨迹指纹进行比较,判断所述选定机主可能乘坐的待预测列车;查找所述待预测列车的停靠站,筛选出出现过所述选定机主的手机信令信号的待选停靠站,进一步查找出所述待预测列车在所述待选停靠站所停靠的第一时间范围,获取所述选定机主的手机信令信号在所述待选停靠站出现的第二时间范围,若所述第二时间范围在所述第一时间范围内,则获取第 ...
【技术保护点】
1.一种乘车信息映射关系获取方法,其特征在于:所述乘车信息映射关系获取方法包括如下步骤:/n获取铁路检票数据,基于手机信令信号获取对应的位置数据;/n基于位置数据对某一时间段内所有手机信令信号进行筛选;根据检票数据确定筛选后的手机信令信号所对应的机主的乘坐列车,获取所述乘坐列车的轨迹并计算所述乘坐列车的列车轨迹指纹;/n获取该时间段内出现在省级行政单位区域中至少一个火车站范围内的手机信令信号以及所述手机信令信号所对应的选定机主,计算所述选定机主的轨迹指纹,将轨迹指纹与列车轨迹指纹进行比较,判断所述选定机主可能乘坐的待预测列车;/n查找所述待预测列车的停靠站,筛选出出现过所述选定机主的手机信令信号的待选停靠站,进一步查找出所述待预测列车在所述待选停靠站所停靠的第一时间范围,获取所述选定机主的手机信令信号在所述待选停靠站出现的第二时间范围,若所述第二时间范围在所述第一时间范围内,则获取第一时间范围所对应的待预测列车的发车时间和到达时间;/n对所述选定机主在所述发车时间和到达时间内的位置数据所形成的轨迹进行特征提取,并对提取的特征通过随机森林模型进行分类,其中,分类结果为[0.5,1]所对应 ...
【技术特征摘要】
1.一种乘车信息映射关系获取方法,其特征在于:所述乘车信息映射关系获取方法包括如下步骤:
获取铁路检票数据,基于手机信令信号获取对应的位置数据;
基于位置数据对某一时间段内所有手机信令信号进行筛选;根据检票数据确定筛选后的手机信令信号所对应的机主的乘坐列车,获取所述乘坐列车的轨迹并计算所述乘坐列车的列车轨迹指纹;
获取该时间段内出现在省级行政单位区域中至少一个火车站范围内的手机信令信号以及所述手机信令信号所对应的选定机主,计算所述选定机主的轨迹指纹,将轨迹指纹与列车轨迹指纹进行比较,判断所述选定机主可能乘坐的待预测列车;
查找所述待预测列车的停靠站,筛选出出现过所述选定机主的手机信令信号的待选停靠站,进一步查找出所述待预测列车在所述待选停靠站所停靠的第一时间范围,获取所述选定机主的手机信令信号在所述待选停靠站出现的第二时间范围,若所述第二时间范围在所述第一时间范围内,则获取第一时间范围所对应的待预测列车的发车时间和到达时间;
对所述选定机主在所述发车时间和到达时间内的位置数据所形成的轨迹进行特征提取,并对提取的特征通过随机森林模型进行分类,其中,分类结果为[0.5,1]所对应的待预测列车作为所述选定机主的预测乘坐列车;
根据所述铁路检票数据获取所述选定机主的身份证号以及该身份证号对应的比较乘坐列车,对比较乘坐列车和预测乘坐列车进行数据碰撞,对得到的碰撞数据进行置信度计算,得到选定机主的手机号、身份证号以及实际乘坐的列车三者间的映射关系。
2.根据权利要求1所述的乘车信息映射关系获取方法,其特征在于:筛选手机信令信号的条件包括:
手机信令信号所对应的机主在应乘车日当天,该机主的手机信令信号至少在两个火车站出现过;
手机信令信号所对应的机主的无效记录小于等于3条,所述无效记录为手机信令信号所对应的机主在应乘车所对应的时间内,发车后30分钟还在出发站的上个火车站,或到站前30分钟就到到达站的下个火车站。
3.根据权利要求2所述的乘车信息映射关系获取方法,其特征在于:所述乘坐列车具有geohash6数据,所述geohash6数据中至少出现3个筛选后的手机信令信号所对应的机主。
4.根据权利要求1所述的乘车信息映射关系获取方法,其特征在于:计算所述乘坐列车的列车轨迹指纹具体包括:
对筛选后的手机信令信号所对应的机主的轨迹进行切割,切割的幅度为每间隔固定时间进行相同时长的切割,
对切割后的数据使用simhash算法计算得到列车轨迹指纹。
5.根据权利要求1所述的乘车信息映射关系获取方法,其特征在于:计算...
【专利技术属性】
技术研发人员:张静,丁敬安,宣鑫乐,
申请(专利权)人:杭州三汇数字信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。