一种基于数据挖掘的时空伴随关系分析方法和系统技术方案

技术编号:23610522 阅读:138 留言:0更新日期:2020-03-28 09:40
本申请公开了一种基于数据挖掘的时空伴随关系分析方法和系统。基于同一双卡移动设备的IMEI识别码规则获得各个双卡移动设备IMEI信号数据库;当两个或者两个以上的基站捕获到多组在较短时间区间内上报的归属同一双卡移动设备的IMEI信号数据时,将该两个或者两个以上的基站认定为具有相邻关系的基站,从而构建具有相邻关系的相邻基站组;遍历目标基站及相邻基站组中的属于目标基站的相邻基站的IMEI信号数据,查找与目标对象IMEI识别码存在时间交互差值的交互对象IMEI识别码,进一步获得目标对象的伴随对象。该方案通过提取IMEI信号数据库和相邻基站组,利用目标基站和目标基站的伴随基站获取目标对象的伴随对象。

A spatiotemporal adjoint relationship analysis method and system based on Data Mining

【技术实现步骤摘要】
一种基于数据挖掘的时空伴随关系分析方法和系统
本申请涉及通信领域中的数据挖掘分析
,具体涉及一种基于数据挖掘的时空伴随关系分析方法和系统。
技术介绍
当两个以上对象表现出相同或者相似的运动模式,并且该模式维持了较长的时间,则该模式被认为是伴随模式。在一起逛街的一群朋友可以形成伴随模式,乘坐同一辆公交车的乘客也可以是一种伴随模式。单目标伴随是伴随模式的一种特殊情况,就是在已知一个目标的时空轨迹后计算和已知目标轨迹相似的其他目标,这种伴随模式的发掘在特定领域有着重要的意义。通常情况下不管伴随的对象是人或者是车辆,由于车辆是人驾驶的,也可以认为是对象是人的伴随。时空伴随需要综合时间维度和空间维度,依靠运营商的移动电话基站信号数据,可以比较全面且精确的定位对象的运动模式。基于基站数据的伴随一般有两种思路,一种是基于经纬度的伴随,是在明确知道每个基站精确经纬度的前提下,使用GEOHASH算法的方式处理,但是在实际的使用情况下,基站的经纬度数据经常存在不全或者误报,因此对伴随精准度造成较大的影响。另一种无需依靠经纬度,只需根据基站的信号数据挖掘伴随对象,这种方法依靠运营商的lacci(大小区编号)数据,伴随结果也相对精确,但是存在较大的问题是跨运营商伴随的痛点,也就是移动用户只能伴随其他的移动用户,移动用户是伴随不到联通用户或者电信用户的。因此迫切需要一种方法,分析出同一个小区域内(比如1公里范围内)不同运营商基站的汇聚情况,从而解决跨运营商伴随的问题。
技术实现思路
本申请的目的在于提出了一种基于数据挖掘的时空伴随关系分析方法和系统,通过各个同一双卡移动设备的IMEI识别码,获取归属不同的移动通信运营商的相邻基站信息,解决跨运营商基站获取伴随关系的问题。第一方面,本申请实施例提供了一种基于数据挖掘的时空伴随关系分析方法,该方法包括:S1:基于同一双卡移动设备的IMEI识别码规则,从各移动通信运营商中获取包括各个双卡移动设备的IMEI识别码的双卡移动设备IMEI信号数据库;S2:响应于当两个或者两个以上的基站捕获到多组在较短时间区间内上报的归属同一双卡移动设备的IMEI信号数据时,将该两个或者两个以上的基站认定为具有相邻关系的基站,从而构建具有相邻关系的相邻基站组;S3:遍历全部基站的IMEI信号数据,查找目标对象IMEI识别码,获取出现目标对象IMEI识别码对应的目标基站;S4:遍历目标基站及相邻基站组中的属于目标基站的相邻基站的IMEI信号数据,查找与目标对象IMEI识别码存在时间交互差值的交互对象IMEI识别码,选定交互对象IMEI识别码出现次数大于第一阈值的交互对象为目标对象的伴随对象。在该方法中,先通过具有双SIM卡的移动设备的IMEI数据获取IMEI数据库,利用同一双卡移动设备开机时,分别向所属运营商的基站上报数据的特性,获取各个基站的具有相邻关系的移动通信运营商的相邻基站信息,在获取目标对象的各个目标基站的前提下,遍历全部目标基站和目标基站的相邻基站,获得在时间交互差值内的交互对象的IMEI识别码,并选定IMEI识别码出现次数大于第一阈值的IMEI识别码的对应交互对象作为伴随对象。在一些具体实施例中,在S2步骤中的较短时间区间的长度为[5s-10s]范围内。时间区间的设置可以避免,由于双卡移动设备对不同运营商的SIM卡的识别时间差异或者由于障碍物的存在延长所属基站的接收上报信号等造成的时间误差。在一些具体实施例中,在S2步骤中的多组为超过3组。通过对多组同一双卡移动设备的验证,使得获取的相邻基站组数据更精准。在一些具体实施例中,在S4步骤中的时间交互差值取自[0s-5s]范围内。时间交互差值的设置可以有效避免由于不同运营商的基站捕获IMEI信号数据能力的差异而造成捕获时间上的差值情况。在一些具体实施例中,在S4步骤中的第一阈值取自[3次-8次]范围内。第一阈值的设置,有效避免因为偶然时间的概率,而影响伴随号码的提取准确性。在一些具体实施例中,S4步骤后将目标对象的移动轨迹转化为带有时间单位的捕获到目标对象IMEI识别码的目标基站集合序列Tr具体表示为:Tr={<cr1,t1>,<cr2,t2>,…,<crn,tn>}其中,crn表示为在时间单位tn中捕获目标对象IMEI识别码的目标基站集合,n为自然数。目标基站集合序列的设置,可以直观且准确地分析目标对象的移动轨迹,便于后续分析目标对象的社交关系。在一些具体实施例中,其特征在于,在S4步骤后还包括将伴随对象的移动轨迹转化为带有相同时间单位的捕获到伴随对象IMEI识别码的伴随基站集合序列To,具体表示为:To={<co1,t1>,<co2,t2>,…,<con,tn>}其中,n表示为在时间单位tn中捕获伴随对象的IMEI识别码的伴随基站集合,n为自然数。伴随基站集合序列的设置,便于与目标基站集合序列进行相似度比对,进一步获得伴随对象与目标对象可能存在的社交关系中的亲密程度。在一些具体实施例中,在时间单位tn中目标基站集合和伴随基站集合应当满足大于第二阈值的条件,具体第二阈值表示如下:在一些具体实施例中,第二阈值取自[0.3-1.0]范围内。第二阈值的设置,便于精准获得目标基站集合序列和伴随基站集合序列中的目标基站集合和伴随基站集合。第二方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述实施例的方法。第三方面,本申请实施例提供了一种用于话单分析通联特征的系统,该系统包括:IMEI数据库单元:配置用于基于同一双卡移动设备的IMEI识别码规则,从各移动通信运营商中获取包括各个双卡移动设备的IMEI识别码的双卡移动设备IMEI信号数据库;相邻基站单元:配置用于响应于当两个或者两个以上的基站捕获到多组在较短时间区间内上报的归属同一双卡移动设备的IMEI信号数据时,将该两个或者两个以上的基站认定为具有相邻关系的基站,从而构建具有相邻关系的相邻基站组;目标对象单元:配置用于遍历全部基站的IMEI信号数据,查找目标对象IMEI识别码,获取出现目标对象IMEI识别码对应的目标基站;伴随对象单元:配置用于遍历目标基站及相邻基站组中的属于目标基站的相邻基站的IMEI信号数据,查找与目标对象IMEI识别码存在时间交互差值的交互对象IMEI识别码,选定交互对象IMEI识别码出现次数大于第一阈值的交互对象为目标对象的伴随对象。本申请提供的一种基于数据挖掘的时空伴随关系分析方法和系统。其中,先通过具有双SIM卡的移动设备的IMEI数据获取IMEI数据库,利用同一双卡移动设备开机时,分别向区域范围内的所属运营商基站上报数据的特性,获取具有相邻关系且归属于不同移动通信运营商的相邻基站信息,在获取目标基站的前提下,遍历目标基站和目标基站的相邻基站,获取交互对象IMEI识别本文档来自技高网...

【技术保护点】
1.一种基于数据挖掘的时空伴随关系分析方法,其特征在于,所述方法包括:/nS1:基于同一双卡移动设备的IMEI识别码规则,从各移动通信运营商中获取包括各个双卡移动设备的IMEI识别码的双卡移动设备IMEI信号数据库;/nS2:响应于当两个或者两个以上的基站捕获到多组在较短时间区间内上报的归属同一双卡移动设备的IMEI信号数据时,将该两个或者两个以上的基站认定为具有相邻关系的基站,从而构建具有相邻关系的相邻基站组;/nS3:遍历全部所述基站的IMEI信号数据,查找目标对象IMEI识别码,获取出现所述目标对象IMEI识别码对应的目标基站;/nS4:遍历所述目标基站及所述相邻基站组中的属于所述目标基站的相邻基站的IMEI信号数据,查找与所述目标对象IMEI识别码存在时间交互差值的交互对象IMEI识别码,选定所述交互对象IMEI识别码出现次数大于第一阈值的所述交互对象为目标对象的伴随对象。/n

【技术特征摘要】
1.一种基于数据挖掘的时空伴随关系分析方法,其特征在于,所述方法包括:
S1:基于同一双卡移动设备的IMEI识别码规则,从各移动通信运营商中获取包括各个双卡移动设备的IMEI识别码的双卡移动设备IMEI信号数据库;
S2:响应于当两个或者两个以上的基站捕获到多组在较短时间区间内上报的归属同一双卡移动设备的IMEI信号数据时,将该两个或者两个以上的基站认定为具有相邻关系的基站,从而构建具有相邻关系的相邻基站组;
S3:遍历全部所述基站的IMEI信号数据,查找目标对象IMEI识别码,获取出现所述目标对象IMEI识别码对应的目标基站;
S4:遍历所述目标基站及所述相邻基站组中的属于所述目标基站的相邻基站的IMEI信号数据,查找与所述目标对象IMEI识别码存在时间交互差值的交互对象IMEI识别码,选定所述交互对象IMEI识别码出现次数大于第一阈值的所述交互对象为目标对象的伴随对象。


2.根据权利要求1所述的一种基于数据挖掘的时空伴随关系分析方法,其特征在于,在所述S2步骤中的所述较短时间区间的长度为[5s-10s]。


3.根据权利要求1所述的一种基于数据挖掘的时空伴随关系分析方法,其特征在于,在所述S2步骤中的所述多组为超过3组。


4.根据权利要求1所述的一种基于数据挖掘的时空伴随关系分析方法,其特征在于,在所述S4步骤中的所述时间交互差值取自[0s-5s]范围内。


5.根据权利要求1所述的一种基于数据挖掘的时空伴随关系分析方法,其特征在于,在所述S4步骤中的所述第一阈值取自[3次-8次]范围内。


6.根据权利要求1所述的一种基于数据挖掘的时空伴随关系分析方法,其特征在于,所述S4步骤后将目标对象的移动轨迹转化为带有时间单位的捕获到所述目标对象IMEI识别码的目标基站集合序列Tr具体表示为:
Tr={<cr1,t1>,<cr2,t2>,…,<crn,tn>}
其中,crn表示为在时间单位tn中捕获目标对象IMEI识别码的目标基站集合,n为自然数。
...

【专利技术属性】
技术研发人员:邢磊黄剑姚志强张磊张辉极
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1