基于运动轨迹的高铁用户识别方法技术

技术编号:15696382 阅读:140 留言:0更新日期:2017-06-24 12:04
本发明专利技术公开了基于运动轨迹的高铁用户识别方法,属于移动用户特殊场景识别技术领域,包括数据获取、名称定义,名称定义包括车站小区、高铁小区、公网小区、占用第一个小区时间、占用最后一个小区时间、总时长、单小区占用时长;车站小区:候车大厅/站台/高铁进站前后,出站前后的占用小区;高铁小区:高铁小区+市区内非高铁小区;公网小区:非市区的第一层小区;占用第一个小区时间:取该小区下最后一条XDR的结束时间;占用最后一个小区时间:取该小区下第一条XDR的开始时间。本发明专利技术通过结合车站小区、高铁专网小区、高铁附近公网小区、小区占用时长、路段速度筛选,简化识别算法,提高识别精度。

【技术实现步骤摘要】
基于运动轨迹的高铁用户识别方法
本专利技术涉及移动用户特殊场景识别
,具体地说是基于运动轨迹的高铁用户识别方法。
技术介绍
现有的高铁用户识别算法受限于高铁车速动态性、切换序列不稳定等因素,识别效果较差。现有高铁用户识别算法如下:通过采集S1-MME接口的信令消息,将同一用户占用的小区按照时间顺序先后排序,当该用户占用高铁专网小区个数超过3个,再依据用户在高铁专网小区间移动速率,综合识别为高铁用户。具体步骤如下:第一步:全量用户筛选法,统计一个时间粒度内(60分钟),同一用户出现了3个以上不同高铁专网小区下的用户,将这批用户定义为高铁基础用户。第二步:序列递增分析法,对高铁沿路的覆盖小区进行依次编号,例如京沪高铁济南地市段有24个高铁小区依据方向性依次编号,建议从省/地市边界为编号起始点,按照序列号递增(减)关系,找出用户所占的专网小区是否与编号匹配,提升识别精度。第三步:移动速率验证法,在序列递增(减)识别的用户基础上,按照用户所占的小区(建议为独立信源小区)距离,和在各小区出现的时间差,能够计算出用户的移动速率,通过判断移动速率是否>150km/小时,提升识别精度。第四步:输出满足以上条件的用户,定义为高铁用户。现有技术存在的问题和缺点:步骤三中的移动速率验证法,“通过判断移动速率是否>150km/小时,提升识别精度”该门限过于严格,例如列车在进站和出站,列车速度一般都低于100km/小时,另外算各小区间的时间差来求速度,实现的算法逻辑过于复杂,实现难度较大。步骤二中序列递增分析法,“按照序列号递增(减)关系,找出用户所占的专网小区是否与编号匹配,提升识别精度”实现难度角度,因为通信系统中的无线环境无法预测,手机在小区间的切换如频繁切换、乒乓切换等带有无序性、随机性,不会按照特定的顺序进行切换,因此序列递增分析法实现难度角度。
技术实现思路
本专利技术的技术任务是针对以上不足之处,提供基于运动轨迹的高铁用户识别方法,通过结合车站小区、高铁专网小区、高铁附近公网小区、小区占用时长、路段速度筛选,简化识别算法,提高识别精度。本专利技术解决其技术问题所采用的技术方案是:基于运动轨迹的高铁用户识别方法,包括数据获取、名称定义,名称定义包括车站小区、高铁小区、公网小区、占用第一个小区时间、占用最后一个小区时间、总时长、单小区占用时长;车站小区:候车大厅/站台/高铁进站前后,出站前后的占用小区;高铁小区:高铁小区+市区内非高铁小区,如太原-晋中等特殊情况;公网小区:非市区的第一层小区;占用第一个小区时间:取该小区下最后一条XDR的结束时间(情景:用户上车,在候车大厅,等待时间较长);占用最后一个小区时间:取该小区下第一条XDR的开始时间(情景:用户下车,出站时间较长);总时长:占用最后一个小区时间-占用第一个小区时间;境内运行时间<N小时单小区占用时长:结束时间-开始时间;列车行驶状态占用同一高铁小区<2分钟;列车停站时间>=2分钟;控制面:切换间隔大于>=2分钟(情景:同一车站一段时间内,有些列车不停靠驶过,有些列车停靠)单小区占用时长<2分钟。优选的,候车大厅/站台/高铁进站前后,出站前后的占用小区,同一个车站可以多个。优选的,结束时间-开始时间,集团规范一个XDR切割时间为5分钟。高铁用户识别步骤包括筛选小区集(高铁小区+公网小区+车站小区),统称小区集;统计一天时间内小区集的所有用户(可包含所有场景:用户在不同车站、不同时间的上下车行为,以及使用手机的不同状态,只要占用即可统计到);统计单用户(每个)占用小区集的情况:车站小区个数、高铁小区个数、总时长、单小区占用时长、移动速度等,将这些用户经过的小区按开始时间进行排序。算法如下:车站小区数>=2and高铁小区数>=2and总时长<N,定义为高铁用户(车站小区数越多,高铁用户可能性越大);车站小区数<2and同一路段的最后一个高铁小区和第一个高铁小区算速度(注意:非车站小区)。本专利技术的基于运动轨迹的高铁用户识别方法和现有技术相比,具有以下有益效果:利用大数据挖掘技术,对高铁用户快速移动中的关键数据如附着、TAU、PAGING等事件,以及HTTP、即时通信等话单进行分析;通过对车站小区、高铁小区、公网小区等名称的定义,实现快速、高效、准确的高铁用户识别,进而对高铁网络质量、高铁用户行为特征分析提供有效支撑。简化高铁用户识别算法,相对于现有算法“移动速率验证法”更加简单有效,仅对于车站小区数<2的用户,利用最后一个高铁小区和第一个高铁小区的时间差来求速度更加容易实现。忽略了通信系统中的无线环境导致的无序切换,对于不满足现有算法中的“序列递增分析法”的用户,能够更大程度的识别高铁用户,减少遗漏。可帮助商家对高铁特殊场景的用户精准营销;可借助高铁移动用户,实现对高铁网络信号的模拟路测,节约专业高铁网络测试成本;高铁商旅VIP用户业务感知重点保障。具体实施方式下面结合具体实施例对本专利技术作进一步说明。基于运动轨迹的高铁用户识别方法,包括数据获取、名称定义,名称定义包括车站小区、高铁小区、公网小区、占用第一个小区时间、占用最后一个小区时间、总时长、单小区占用时长;车站小区:候车大厅/站台/高铁进站前后,出站前后的占用小区;高铁小区:高铁小区+市区内非高铁小区,如太原-晋中等特殊情况;公网小区:非市区的第一层小区;占用第一个小区时间:取该小区下最后一条XDR的结束时间(情景:用户上车,在候车大厅,等待时间较长);占用最后一个小区时间:取该小区下第一条XDR的开始时间(情景:用户下车,出站时间较长);总时长:占用最后一个小区时间-占用第一个小区时间;境内运行时间<N小时单小区占用时长:结束时间-开始时间;列车行驶状态占用同一高铁小区<2分钟;列车停站时间>=2分钟;控制面:切换间隔大于>=2分钟(情景:同一车站一段时间内,有些列车不停靠驶过,有些列车停靠)单小区占用时长<2分钟。优选的,候车大厅/站台/高铁进站前后,出站前后的占用小区,同一个车站可以多个。优选的,结束时间-开始时间,集团规范一个XDR切割时间为5分钟。高铁用户识别步骤包括筛选小区集(高铁小区+公网小区+车站小区),统称小区集;统计一天时间内小区集的所有用户(可包含所有场景:用户在不同车站、不同时间的上下车行为,以及使用手机的不同状态,只要占用即可统计到);统计单用户(每个)占用小区集的情况:车站小区个数、高铁小区个数、总时长、单小区占用时长、移动速度等,将这些用户经过的小区按开始时间进行排序。算法如下:车站小区数>=2and高铁小区数>=2and总时长<N,定义为高铁用户(车站小区数越多,高铁用户可能性越大);车站小区数<2and同一路段的最后一个高铁小区和第一个高铁小区算速度(注意:非车站小区)。利用大数据挖掘技术,对高铁用户快速移动中的关键数据如附着、TAU、PAGING等事件,以及HTTP、即时通信等话单进行分析;通过对车站小区、高铁小区、公网小区等名称的定义,实现快速、高效、准确的高铁用户识别,进而对高铁网络质量、高铁用户行为特征分析提供有效支撑。通过上面具体实施方式本文档来自技高网
...

【技术保护点】
基于运动轨迹的高铁用户识别方法,其特征在于包括数据获取、名称定义,名称定义包括车站小区、高铁小区、公网小区、占用第一个小区时间、占用最后一个小区时间、总时长、单小区占用时长;车站小区:候车大厅/站台/高铁进站前后,出站前后的占用小区;高铁小区:高铁小区+市区内非高铁小区;公网小区:非市区的第一层小区;占用第一个小区时间:取该小区下最后一条XDR的结束时间;占用最后一个小区时间:取该小区下第一条XDR的开始时间;总时长:占用最后一个小区时间‑占用第一个小区时间;境内运行时间<N小时;单小区占用时长:结束时间‑开始时间;列车行驶状态占用同一高铁小区<2分钟;列车停站时间>=2分钟;控制面:切换间隔大于>=2分钟。

【技术特征摘要】
1.基于运动轨迹的高铁用户识别方法,其特征在于包括数据获取、名称定义,名称定义包括车站小区、高铁小区、公网小区、占用第一个小区时间、占用最后一个小区时间、总时长、单小区占用时长;车站小区:候车大厅/站台/高铁进站前后,出站前后的占用小区;高铁小区:高铁小区+市区内非高铁小区;公网小区:非市区的第一层小区;占用第一个小区时间:取该小区下最后一条XDR的结束时间;占用最后一个小区时间:取该小区下第一条XDR的开始时间;总时长:占用最后一个小区时间-占用第一个小区时间;境内运行时间<N小时;单小区占用时长:结束时间-开始时间...

【专利技术属性】
技术研发人员:苗慧生
申请(专利权)人:山东浪潮商用系统有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1