【技术实现步骤摘要】
基于手机信令数据分析目标新手机号码的方法及系统
本专利技术属于数据挖掘
,具体涉及一种在海量数据中确定目标新手机号码的方法及系统。
技术介绍
目前移动通信已经成为人与人沟通交流的重要手段,随之手机号码也成为个人身份的标识。然而,出于各种目的,一个人可能拥有两个或多个的手机号码。这时,一个人的电子数据信息就会分散到多个手机账户下,为了数据分析的完整性,需要通过已知手机账号,挖掘与该账号归属相同的其他手机账号。文献1:利用关系人手机号码分析嫌疑人新手机号码的基本技法[J].毛庆华.四川警察学院学报.2011(05),公开了一种从关系人手机号码中分析目标人员新手机号码的方法,是在目标更换了手机号后进行事后分析新号码,无法发现目标同时使用的多个号码。文献2:手机话单分析信息碰撞技战法的应用研究[J].斯进.信息网络安全.2011(07),通过对传统话单分析与其它相关信息应用相结合,利用信息分析、碰撞、交叉提炼等手段对话单数据进行再加工、再求证,从而获取非常规机主号码真实持有人身份。由于其是利用话单进行分析,没有利用通信中的位置信息,效果不够理想。
技术实现思路
专利技术目的:针对现有技术中存在的问题,本专利技术提供了一种深度挖掘时空关联,进而得到目标新手机号码的方法,该方法覆盖范围广,准确率高。技术方案:本专利技术一方面公开了一种基于手机信令数据分析目标新手机号码的方法,包括:(1)获取时间范围T内全网的手机信令数据,所述手机信令数据中包括手机号码、基站、通信时间;( ...
【技术保护点】
1.基于手机信令数据分析目标新手机号码的方法,其特征在于,包括:/n(1)获取时间范围T内全网的手机信令数据,所述手机信令数据中包括手机号码、基站、通信时间;/n(2)计算每个手机号码的停留点和停留时间段,所述手机号码在连续时长τ内都挂靠在相同基站或相同基站的邻域内的基站,则所挂靠的基站位置为所述手机号码的停留点,手机号码挂靠在停留点的时间段为停留时间;时长τ小于T的时长;手机号码、停留时间、停留点组成停留信息;/n(3)针对每个手机号码p
【技术特征摘要】
1.基于手机信令数据分析目标新手机号码的方法,其特征在于,包括:
(1)获取时间范围T内全网的手机信令数据,所述手机信令数据中包括手机号码、基站、通信时间;
(2)计算每个手机号码的停留点和停留时间段,所述手机号码在连续时长τ内都挂靠在相同基站或相同基站的邻域内的基站,则所挂靠的基站位置为所述手机号码的停留点,手机号码挂靠在停留点的时间段为停留时间;时长τ小于T的时长;手机号码、停留时间、停留点组成停留信息;
(3)针对每个手机号码pn找到满足停留点伴随条件的所有手机号码作为pn对应的候选号码集Spn;
所述停留点伴随条件为:与手机号码pn在相同或相近的停留时间内停留点距离小于D的停留信息条数大于阈值M;D和M分别为预先设定的距离阈值和数量阈值;
(4)根据手机信令数据确定时间范围T内手机号码pn的信令集合及候选号码集Spn中每个号码的信令集合,计算pn与Spn中每个手机号码的信令集合匹配度s(pn,psm),其中psm为候选号码集Spn中第m个手机号,m=1,2,…,Mn,Mn为Spn中元素的总数;
遍历Spn,将s(pn,psm)>sth的号码psm作为pn的新手机号码;sth为预设的信令集合匹配度阈值;
所述手机号码pn的信令集合为步骤1获取的手机信令数据中通信方为pn的所有信令数据;
依次处理每一个手机号码及其候选号码集,分析每一个手机号码的新手机号码。
2.根据权利要求1所述的分析目标新手机号码的方法,其特征在于,所述基站的邻域为距离所述基站距离小于D的范围;D为预先设定的距离阈值。
3.根据权利要求1所述的分析目标新手机号码的方法,其特征在于,所述步骤4中计算手机号码pn与psm的信令集合匹配度s(pn,psm)包括:
(4.1)设pn和psm的信令集合分别为Cn和Csm,将Cn中满足与Csm匹配的信令组成匹配信令集合,统计匹配信令集合中的信令条数n1;
所述满足与Csm匹配的信令的条件为:Csm中存在与所述信令通信时间间隔小于60秒,且基站距离小于D的信令;
(4.2)手机号码pn与psm的信令集合匹配度s(pn,psm):
其中,s1为信令集合Csm中手机信令数据按通信时间顺序两两...
【专利技术属性】
技术研发人员:汪婷婷,郭际川,余泓江,李沣庭,
申请(专利权)人:南京中新赛克科技有限责任公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。