基于手机信令数据分析目标新手机号码的方法及系统技术方案

技术编号:24216942 阅读:41 留言:0更新日期:2020-05-20 19:37
本发明专利技术公开了一种基于手机信令数据分析目标新手机号码的方法和系统,其中分析目标新手机号码的方法包括:1、获取时间范围T内全网的手机信令数据;2、计算每个手机号码的停留点和停留时间段;3、针对每个手机号p

The method and system of target new mobile phone number analysis based on mobile signaling data

【技术实现步骤摘要】
基于手机信令数据分析目标新手机号码的方法及系统
本专利技术属于数据挖掘
,具体涉及一种在海量数据中确定目标新手机号码的方法及系统。
技术介绍
目前移动通信已经成为人与人沟通交流的重要手段,随之手机号码也成为个人身份的标识。然而,出于各种目的,一个人可能拥有两个或多个的手机号码。这时,一个人的电子数据信息就会分散到多个手机账户下,为了数据分析的完整性,需要通过已知手机账号,挖掘与该账号归属相同的其他手机账号。文献1:利用关系人手机号码分析嫌疑人新手机号码的基本技法[J].毛庆华.四川警察学院学报.2011(05),公开了一种从关系人手机号码中分析目标人员新手机号码的方法,是在目标更换了手机号后进行事后分析新号码,无法发现目标同时使用的多个号码。文献2:手机话单分析信息碰撞技战法的应用研究[J].斯进.信息网络安全.2011(07),通过对传统话单分析与其它相关信息应用相结合,利用信息分析、碰撞、交叉提炼等手段对话单数据进行再加工、再求证,从而获取非常规机主号码真实持有人身份。由于其是利用话单进行分析,没有利用通信中的位置信息,效果不够理想。
技术实现思路
专利技术目的:针对现有技术中存在的问题,本专利技术提供了一种深度挖掘时空关联,进而得到目标新手机号码的方法,该方法覆盖范围广,准确率高。技术方案:本专利技术一方面公开了一种基于手机信令数据分析目标新手机号码的方法,包括:(1)获取时间范围T内全网的手机信令数据,所述手机信令数据中包括手机号码、基站、通信时间;(2)计算每个手机号码的停留点和停留时间段,所述手机号码在连续时长τ内都挂靠在相同基站或相同基站的邻域内的基站,则所挂靠的基站位置为所述手机号码的停留点,手机号码挂靠在停留点的时间段为停留时间;时长τ小于T的时长;手机号码、停留时间、停留点组成停留信息;(3)针对每个手机号码pn找到满足停留点伴随条件的所有手机号码作为pn对应的候选号码集Spn;所述停留点伴随条件为:与手机号码pn在相同或相近的停留时间内停留点距离小于D的停留信息条数大于阈值M;D和M分别为预先设定的距离阈值和数量阈值;(4)根据手机信令数据确定时间范围T内手机号码pn的信令集合及候选号码集Spn中每个号码的信令集合,计算pn与Spn中每个手机号码的信令集合匹配度s(pn,psm),其中psm为候选号码集Spn中第m个手机号,m=1,2,…,Mn,Mn为Spn中元素的总数;遍历Spn,将s(pn,psm)>sth的号码psm作为pn的新手机号码;sth为预设的信令集合匹配度阈值;所述手机号码pn的信令集合为步骤1获取的手机信令数据中通信方为pn的所有信令数据;依次处理每一个手机号码及其候选号码集,分析每一个手机号码的新手机号码。另一方面,本专利技术还公开了实现上述方法的分析目标新手机号码的系统,包括:手机信令数据获取模块,用于获取时间范围T内全网的手机信令数据,所述手机信令数据中包括手机号码、基站、通信时间;停留信息计算模块,用于计算每个手机号码的停留信息;所述停留信息包括手机号码、停留时间、停留点;所述手机号码在连续时长τ内都挂靠在相同基站或相同基站的邻域内的基站,则所挂靠的基站位置为所述手机号码的停留点,手机号码挂靠在停留点的时间段为停留时间;时长τ小于T的时长;候选号码集获取模块,用于获取候选号码集;所述候选号码集为满足停留点伴随条件的所有手机号码;所述停留点伴随条件为:与目标原有手机号码在相同或相近的停留时间内停留点距离小于D的停留信息条数大于阈值M;D和M分别为预先设定的距离阈值和数量阈值;目标新手机号码确定模块,用于根据手机信令数据确定时间范围T内每个手机号码及其对应候选号码集中每个号码的信令集合,并计算每个手机号码与其候选号码的信令集合匹配度,将信令集合匹配度大于阈值的号码确定为此手机号码的新手机号码。有益效果:与现有技术相比,本专利技术公开的基于手机信令数据分析目标新手机号码的方法,充分利用手机信令数据中的时空信息,挖掘出与原手机号码在时间维度和空间维度关联性高的号码,确定为目标的新手机号码,该方法能够得到更为准确的结果。附图说明图1为实施例中基于手机信令数据分析目标新手机号码的方法的流程图;图2为实施例中基于手机信令数据分析目标新手机号码的系统的组成图。具体实施方式下面结合附图和具体实施方式,进一步阐明本专利技术。如图1所示,本专利技术公开了一种基于手机信令数据分析目标新手机号码的方法,包括:步骤1、获取时间范围T内全网的手机信令数据,所述手机信令数据中包括手机号码、基站、通信时间;本实施例中,获取到一天内包括目标原有手机号码在内的手机信令数据100亿条,涉及到的手机号码为3千万个;步骤2、计算每个手机号码的停留点和停留时间段,所述手机号码在连续时长τ内都挂靠在相同基站或相同基站的邻域内的基站,则所挂靠的基站位置为所述手机号码的停留点,手机号码挂靠在停留点的时间段为停留时间;时长τ小于T的时长;手机号码、停留时间、停留点组成停留信息;基站的邻域为距离所述基站距离小于D的范围;D为预先设定的距离阈值;步骤1获取的手机信令数据中,有部分手机号码的信令数据在相同基站或相同基站的邻域内的基站连续挂靠时长均小于τ,则将这些信令数据删除;最终得到2千万个号码的停留信息,每个号码有多条停留信息,构成与号码对应的停留信息集合,每条停留信息包括了手机号码、停留时间以及停留点;步骤3、针对每个手机号码pn找到满足停留点伴随条件的所有手机号码作为pn对应的候选号码集Spn;所述停留点伴随条件为:与手机号码在相同或相近的停留时间内停留点距离小于D的停留信息条数大于阈值M;D和M分别为预先设定的距离阈值和数量阈值;为了充分利用能够获取到的其他信息,本实施例中还将与目标原有手机号码采用相同身份信息登记的手机号码和采用相同通信终端设备号的手机号码加入到候选号码集中,并获取这两种手机号码的停留信息,以此来扩大查找目标新手机号码的范围。对步骤2得到的2千万个号码的停留信息,分别对每个号码与所有号码停留信息做对比,选取其中满足停留点伴随条件的集合所对应的手机号码,作为此号码对应的候选号码集;经过筛选,得到5百万个号码及其对应的候选号码集,其中每个号码对应的候选号码集中号码个数不均等、平均在10个左右;步骤4、根据手机信令数据确定时间范围T内手机号码pn的信令集合及候选号码集Spn中每个号码的信令集合,计算pn与Spn中每个手机号码的信令集合匹配度s(pn,psm),其中psm为候选号码集Spn中第m个手机号,m=1,2,…,Mn,Mn为Spn中元素的总数;遍历Spn,将s(pn,psm)>sth的号码psm作为pn的新手机号码;sth为预设的信令集合匹配度阈值;所述手机号码pn的信令集合为步骤1获取的手机信令数据中通信方为pn的所有信令数据;计算手机本文档来自技高网...

【技术保护点】
1.基于手机信令数据分析目标新手机号码的方法,其特征在于,包括:/n(1)获取时间范围T内全网的手机信令数据,所述手机信令数据中包括手机号码、基站、通信时间;/n(2)计算每个手机号码的停留点和停留时间段,所述手机号码在连续时长τ内都挂靠在相同基站或相同基站的邻域内的基站,则所挂靠的基站位置为所述手机号码的停留点,手机号码挂靠在停留点的时间段为停留时间;时长τ小于T的时长;手机号码、停留时间、停留点组成停留信息;/n(3)针对每个手机号码p

【技术特征摘要】
1.基于手机信令数据分析目标新手机号码的方法,其特征在于,包括:
(1)获取时间范围T内全网的手机信令数据,所述手机信令数据中包括手机号码、基站、通信时间;
(2)计算每个手机号码的停留点和停留时间段,所述手机号码在连续时长τ内都挂靠在相同基站或相同基站的邻域内的基站,则所挂靠的基站位置为所述手机号码的停留点,手机号码挂靠在停留点的时间段为停留时间;时长τ小于T的时长;手机号码、停留时间、停留点组成停留信息;
(3)针对每个手机号码pn找到满足停留点伴随条件的所有手机号码作为pn对应的候选号码集Spn;
所述停留点伴随条件为:与手机号码pn在相同或相近的停留时间内停留点距离小于D的停留信息条数大于阈值M;D和M分别为预先设定的距离阈值和数量阈值;
(4)根据手机信令数据确定时间范围T内手机号码pn的信令集合及候选号码集Spn中每个号码的信令集合,计算pn与Spn中每个手机号码的信令集合匹配度s(pn,psm),其中psm为候选号码集Spn中第m个手机号,m=1,2,…,Mn,Mn为Spn中元素的总数;
遍历Spn,将s(pn,psm)>sth的号码psm作为pn的新手机号码;sth为预设的信令集合匹配度阈值;
所述手机号码pn的信令集合为步骤1获取的手机信令数据中通信方为pn的所有信令数据;
依次处理每一个手机号码及其候选号码集,分析每一个手机号码的新手机号码。


2.根据权利要求1所述的分析目标新手机号码的方法,其特征在于,所述基站的邻域为距离所述基站距离小于D的范围;D为预先设定的距离阈值。


3.根据权利要求1所述的分析目标新手机号码的方法,其特征在于,所述步骤4中计算手机号码pn与psm的信令集合匹配度s(pn,psm)包括:
(4.1)设pn和psm的信令集合分别为Cn和Csm,将Cn中满足与Csm匹配的信令组成匹配信令集合,统计匹配信令集合中的信令条数n1;
所述满足与Csm匹配的信令的条件为:Csm中存在与所述信令通信时间间隔小于60秒,且基站距离小于D的信令;
(4.2)手机号码pn与psm的信令集合匹配度s(pn,psm):



其中,s1为信令集合Csm中手机信令数据按通信时间顺序两两...

【专利技术属性】
技术研发人员:汪婷婷郭际川余泓江李沣庭
申请(专利权)人:南京中新赛克科技有限责任公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1