【技术实现步骤摘要】
基于话单的伪基站轨迹追踪方法及装置
本专利技术涉及信息
,特别涉及到数据处理在移动通信领域的安全应用。
技术介绍
随着手机等移动终端的普及,移动互联网的快速发展,人们时时刻刻都在使用移动终端进行通话、发短信等行为。然而移动终端在给人们带来便利的同时,伴随而来的是日益猖獗的骚扰电话、广告、诈骗短信等违法信息,严重影响了人们的正常工作和生活,甚至给用户带来了经济损失。其中骚扰严重以及安全风险较大的是伪基站。伪基站:当前实施电信诈骗手段中常用到的一种高科技设备。伪基站能够搜取以其为中心、一定半径范围内的手机卡信息,并任意冒用他人手机号码强行向用户手机发送诈骗、广告推销等短信息,从而达到发送者想达到的目的。伪基站的主要特点包括:伪基站设备启动:首先通过加大发射功率等手段,干扰和屏蔽一定范围内的运营商信号;手机用户的信号被伪基站屏蔽后,手机会发送自动搜索周围基站的信号,此信号被伪基站的信令监测系统获取后,伪基站能够根据获取的号码的IMSI等信息并根据这些信息向目标用户下发想要发送的短信。伪基站设备 ...
【技术保护点】
1.基于话单的伪基站轨迹追踪装置,其特征在于由数据采集分类模块集合和伪基站实时追踪模块集合两部分组成;数据采集分类模块集合由话单清洗器、特征数据提取器、受伪基站影响的正规基站信息存储器、密度聚类算法模块、受伪基站影响的正规基站分区模块和伪基站轨迹模型库组成;伪基站实时追踪模块集合由时间片段聚类器、伪基站位置计算器和伪基站轨迹点去噪引擎组成;/n话单清洗器负责读取CDR话单并过滤并删除CDR话单中格式内容出错的话单,判断格式内容出错的标准包括:CDR话单中时间格式不对为格式内容出错的CDR话单,CDR话单中有不该存在的字符为格式内容出错的CDR话单,CDR话单中出现与字段应有 ...
【技术特征摘要】
1.基于话单的伪基站轨迹追踪装置,其特征在于由数据采集分类模块集合和伪基站实时追踪模块集合两部分组成;数据采集分类模块集合由话单清洗器、特征数据提取器、受伪基站影响的正规基站信息存储器、密度聚类算法模块、受伪基站影响的正规基站分区模块和伪基站轨迹模型库组成;伪基站实时追踪模块集合由时间片段聚类器、伪基站位置计算器和伪基站轨迹点去噪引擎组成;
话单清洗器负责读取CDR话单并过滤并删除CDR话单中格式内容出错的话单,判断格式内容出错的标准包括:CDR话单中时间格式不对为格式内容出错的CDR话单,CDR话单中有不该存在的字符为格式内容出错的CDR话单,CDR话单中出现与字段应有内容不符的字段内容时为格式内容出错的CDR话单,CDR话单中核心字段值为空的CDR话单为格式内容出错的CDR话单,CDR话单中特殊字段中只含数字却出现中英文编码的CDR话单为格式内容出错的CDR话单;话单清洗器负责去除重复的CDR话单;话单清洗器负责去除地域值出错的CDR话单;经过话单清洗器处理过的话单传送给特征数据提取器;
特征数据提取器负责提取受到伪基站影响的话单,通过受到伪基站影响的话单确定受到伪基站影响的正常基站;提取受到伪基站影响的话单的方法包括:
当CDR话单中的号码在已经掌握的伪基站异常号码库中时,判断该CDR话单为受伪基站影响的话单,提取受伪基站影响的话单的内容发送给受伪基站影响的正规基站信息存储器进行存储;伪基站异常号码库为本发明的装置长期积累的伪基站异常号码的集合;
当CDR话单中的网络类型为正常网络类型之外的类型时,判断该CDR话单为受伪基站影响的话单,提取受伪基站影响的话单的内容发送给受伪基站影响的正规基站信息存储器进行存储;
正常网络类型包括:移动GSM:0x1;联通GSM:0x2;电信CDMA1x:0x3;移动TD-SCDMA:0x4;联通WCDMA:0x5;电信CDMA2000:0x6;电信CDMA2000分组域:0x07;移动LTE:0x08;联通LTE:0x09;电信LTE:0x0a;
当CDR话单中小区位置信息不合规时,判断该CDR话单为受伪基站影响的话单,提取受伪基站影响的话单的内容发送给受伪基站影响的正规基站信息存储器进行存储;小区位置信息不合规的判断规则包括:规则1,源LAC与目标LAC值一样,则正常位置更新异常,判断小区位置信息不合规;规则2,源LAC值不是当地LAC,判断小区位置信息不合规;规则3,源LAC不是相邻区域的LAC值,判断小区位置信息不合规;规则4,源LAC值为65534,判断小区位置信息不合规;
当CDR话单中位置更新不合规时,判断该CDR话单为受伪基站影响的话单,提取受伪基站影响的话单的内容发送给受伪基站影响的正规基站信息存储器进行存储;判断位置更新不合规的方法包括:计算第一个5分钟内,单基站出现了N次以上的位置更新话单数据,监测第二个5分钟内到第四个5分钟内单基站共出现的位置更新话单数据为M次,当M小于等于N的20分之1时,则认为该位置的基站信息受到了伪基站的干扰,则判断单基站第一个5分钟内的CDR话单为受伪基站影响的话单,提取受伪基站影响的话单的内容发送给受伪基站影响的正规基站信息存储器进行存储;
受伪基站影响的正规基站信息存储器负责存储所有正规基站的位置信息和编码,受伪基站影响的正规基站信息存储器将收到的受伪基站影响的话单与正规基站的位置信息和编码进行基站信息匹配,对基站编码匹配正规基站的受伪基站影响的话单进行基站位置信息的矫正,生成矫正后的受伪基站影响的话单;受伪基站影响的正规基站信息存储器对基站编码不能匹配正规基站的受伪基站影响的话单进行舍弃;受伪基站影响的正规基站信息存储器将矫正后的受伪基站影响的话单发送给密度聚类算法模块;
密度聚类算法模块负责将收到的矫正后的受伪基站影响的话单中的基站编码和位置信息输入DBSCAN密度聚类算法,生成聚类簇;DBSCAN密度聚类算法具体为:输入样本集D=(x1,x2,...,xm)(x1,x2,...,xm),邻域参数(∈,MinPts)(∈,MinPts),样本距离度量方式,输出:簇划分C;
步骤1,初始化核心对象集合初始化聚类簇数k=0,初始化未访问样本集合ΓΓ=D,簇划分
步骤2,对于j=1,2,...m,按下面的步骤找出所有的核心对象:
1)通过距离度量方式,找到样本xjxj的∈∈-邻域子样本集N∈(xj)N∈(xj);
2)如果子样本集样本个数满足|N∈(xj)|≥MinPts|N∈(xj)|≥MinPts,将样本xjxj加入核心对象样本集合:Ω=Ω∪{xj}Ω=Ω∪{xj};
步骤3,如果核心对象集合则算法结束,否则转入步骤4;
步骤4,在核心对象集合ΩΩ中,随机选择一个核心对象oo,初始化当前簇核心对象队列Ωcur={o}Ωcur={o},初始化类别序号k=k+...
【专利技术属性】
技术研发人员:林飞,谢小超,易永波,成海,王林汝,古元,
申请(专利权)人:北京亚鸿世纪科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。