【技术实现步骤摘要】
一种基于实时话单大数据的诈骗号码识别方法和装置
[0001]本申请涉及网络通信的
,尤其是涉及一种基于实时话单大数据的诈骗号码识别方法和装置。
技术介绍
[0002]在电信网络诈骗中,通过大量的打电话推广某种诱人的产品、服务,如:信用贷款、购物退款等等,初步确定受害人目标,然后再进一步进行诱导以达到其诈骗目的。电话推广是一种常见的方式或者是电信诈骗犯罪的重要一环。打击诈骗推广号码,是遏制依赖于此的一系列诈骗的有效措施。最常见的做法是通过话单分析,挖掘发现可疑号码,再进一步研判确认,线下根据位置进行蹲点抓人。经过全国各级执法部门长期的打击,这些从业人员变得更加狡猾,转移到国外逃避打击,或者隐藏在深山老林中加大反打击难度。所以当下最直接有效的做法是快速发现号码,马上予以限制通话,停止其对外通联。而如何更快发现这些号码就是最为紧要的工作。现有的话单数据分析技术一般通过分析一段时间内的数据,分析某类通信号码的规律。这部分虽然是离线计算,但每天亿级的数据量需要按不同维度不断统计,耗费的资源非常大。
[0003]现实中为了避免被发现,诈骗推广人员基本上一两天就会换号码。那么即使以天为单位的分析,时效性就已经明显滞后。待分析出结果,有可能诈骗已经得手,或者为了规避打击主动放弃使用号码。另外,这种诈骗号码和正常广告推销号码的特征极为相似,如何排除这部分的干扰也是一项困难的工作。
技术实现思路
[0004]针对上述技术问题,本申请提出了一种基于实时话单大数据的诈骗号码识别方法和装置,以争取更快发现诈骗号码 ...
【技术保护点】
【技术特征摘要】
1.一种基于实时话单大数据的诈骗号码识别方法,其特征在于:所述方法包括以下步骤:S1:建立话单大数据知识库;S2:接入话单数据,利用话单大数据知识库对接入的话单数据进行判断是否为白名单,若是则执行S8,否则执行S3;S3:对话单数据进行时段分割预统计;S4:过滤超过边界的数据;S5:计算出当前接入号码各行为指标的可疑权重值:Q(x)=P(x)/G(x);对于常量化的指标:P(x)=(Mp/Np);G(x)=(Ma/Na);其中,Mp代表满足条件诈骗号码人数,Np代表诈骗号码数,Ma代表满足条件所有号码人数,Na代表所有号码数;对于非常量指标:对于非常量指标:其中,x1代表指标项值
‑
1,x2代表指标项值+1,μ1代表诈骗号码中指标项的数学期望值,σ1代表诈骗号码中指标项的方差,μ2代表全部号码中指标项的数学期望值,σ2代表全部号码中指标项的方差;S6:累加各指标权重得到总的可疑度:S7:利用总的可疑度对可疑号码进行识别验证,并根据识别验证结果对大数据知识库进行数据迭代更新;S8:结束识别。2.根据权利要求1所述的一种基于实时话单大数据的诈骗号码识别方法,其特征在于:所述S1中的话单大数据知识库包括:历史诈骗号码库,存储已确定的诈骗号码集合S;可疑基站库,存储已确定诈骗号码出现过的基站集合为ST;可疑IMEI库,存储已确定诈骗号码关联的IMEI集合R;正常营销推广号码库,存储已确定的正常营销推广号码,汇总形成可信号码集合为W;正常营销推广基站库,存储已确定的正常营销推广号码出现过的基站,汇总形成可信基站集合为WT。3.根据权利要求1所述的一种基于实时话单大数据的诈骗号码识别方法,其特征在于:所述S3具体包括:存储每个号码每天首次通话时间T0,利用T0计算该号码的T时段记录:Ts=(Math.floor(Tx
–
T0)/T)*T+T0;
Te=Ts+T;其中,Ts代表T时段开始时间,Te代表T时段结束时间。4.根据权利要求3所述的一种基于实时话单大数据的诈骗号码识别方法,其特征在于:所述S4中的超过边界的数据具体包括:通话次数<MIN(已知诈骗号码通话次数)/2;被叫次数>MAX(已知诈骗号码被叫次数)*2。5.根据权利要求1所述的一种基于实时话单大数据的诈骗号码识别方法,其特征在于:所述S...
【专利技术属性】
技术研发人员:王德良,温若辉,陈云,曾超,黄雅如,刘明洪,姚政勇,李婉婷,林成斌,吴僖子,汤增荣,王泽,纪艺能,
申请(专利权)人:厦门市美亚柏科信息股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。