一种基于实时话单大数据的诈骗号码识别方法和装置制造方法及图纸

技术编号:36211343 阅读:11 留言:0更新日期:2023-01-04 12:07
本申请涉及一种基于实时话单大数据的诈骗号码识别方法,其通过对话单数据按时间段T进行切割,符合样本抽取,缩短计算范围,减少计算资源投入;通过增加各类可疑、可信知识库的计算,提高指标的全面性,减少正常推广号码的干扰;通过使用指标项在诈骗号码的概率分布/在所有号码的概率分布,更能量化的分析各指标的权重和总的可疑度。从而提高了诈骗号码的识别效率和实时性,以较小的计算资源达到及时预警的目的。能够降低发案率,避免更多的人被诈骗。骗。骗。

【技术实现步骤摘要】
一种基于实时话单大数据的诈骗号码识别方法和装置


[0001]本申请涉及网络通信的
,尤其是涉及一种基于实时话单大数据的诈骗号码识别方法和装置。

技术介绍

[0002]在电信网络诈骗中,通过大量的打电话推广某种诱人的产品、服务,如:信用贷款、购物退款等等,初步确定受害人目标,然后再进一步进行诱导以达到其诈骗目的。电话推广是一种常见的方式或者是电信诈骗犯罪的重要一环。打击诈骗推广号码,是遏制依赖于此的一系列诈骗的有效措施。最常见的做法是通过话单分析,挖掘发现可疑号码,再进一步研判确认,线下根据位置进行蹲点抓人。经过全国各级执法部门长期的打击,这些从业人员变得更加狡猾,转移到国外逃避打击,或者隐藏在深山老林中加大反打击难度。所以当下最直接有效的做法是快速发现号码,马上予以限制通话,停止其对外通联。而如何更快发现这些号码就是最为紧要的工作。现有的话单数据分析技术一般通过分析一段时间内的数据,分析某类通信号码的规律。这部分虽然是离线计算,但每天亿级的数据量需要按不同维度不断统计,耗费的资源非常大。
[0003]现实中为了避免被发现,诈骗推广人员基本上一两天就会换号码。那么即使以天为单位的分析,时效性就已经明显滞后。待分析出结果,有可能诈骗已经得手,或者为了规避打击主动放弃使用号码。另外,这种诈骗号码和正常广告推销号码的特征极为相似,如何排除这部分的干扰也是一项困难的工作。

技术实现思路

[0004]针对上述技术问题,本申请提出了一种基于实时话单大数据的诈骗号码识别方法和装置,以争取更快发现诈骗号码,并保证提高识别效率,从而达到降低发案率,避免更多的人被诈骗。
[0005]第一方面,本申请提出了一种基于实时话单大数据的诈骗号码识别方法,包括以下步骤:
[0006]S1:建立话单大数据知识库;
[0007]S2:接入话单数据,利用话单大数据知识库对接入的话单数据进行判断是否为白名单,若是则执行S8,否则执行S3;
[0008]S3:对话单数据进行时段分割预统计;
[0009]S4:过滤超过边界的数据;
[0010]S5:计算出当前接入号码各行为指标的可疑权重值:Q(x)=P(x)/G(x);
[0011]对于常量化的指标:
[0012]P(x)=(Mp/Np);
[0013]G(x)=(Ma/Na);
[0014]其中,Mp代表满足条件诈骗号码人数,Np代表诈骗号码数,Ma代表满足条件所有号
码人数,Na代表所有号码数;
[0015]对于非常量指标:
[0016][0017][0018]其中,x1代表指标项值

1,x2代表指标项值+1,μ1代表诈骗号码中指标项的数学期望值,σ1代表诈骗号码中指标项的方差,μ2代表全部号码中指标项的数学期望值,σ2代表全部号码中指标项的方差;
[0019]S6:累加各指标权重得到总的可疑度:
[0020]S7:利用总的可疑度对可疑号码进行识别验证,并根据识别验证结果对大数据知识库进行数据迭代更新;
[0021]S8:结束识别。
[0022]通过采用上述技术方案,本申请一种基于实时话单大数据的诈骗号码识别方法,通过对话单数据按时间段T进行切割,符合样本抽取,缩短计算范围,减少计算资源投入;通过增加各类可疑、可信知识库的计算,提高指标的全面性,减少正常推广号码的干扰;通过使用指标项在诈骗号码的概率分布/在所有号码的概率分布,更能量化的分析各指标的权重和总的可疑度。从而提高了诈骗号码的识别效率和实时性,以较小的计算资源达到及时预警的目的。能够降低发案率,避免更多的人被诈骗。
[0023]优选的,所述S1中的话单大数据知识库包括:
[0024]历史诈骗号码库,存储已确定的诈骗号码集合S;
[0025]可疑基站库,存储已确定诈骗号码出现过的基站集合为ST;
[0026]可疑IMEI库,存储已确定诈骗号码关联的IMEI集合R;
[0027]正常营销推广号码库,存储已确定的正常营销推广号码,汇总形成可信号码集合为W;
[0028]正常营销推广基站库,存储已确定的正常营销推广号码出现过的基站,
[0029]汇总形成可信基站集合为WT。
[0030]优选的,所述S3具体包括:
[0031]存储每个号码每天首次通话时间T0,利用T0计算该号码的T时段记录:
[0032]Ts=(Math.floor(Tx

T0)/T)*T+T0;
[0033]Te=Ts+T;
[0034]其中,Ts代表T时段开始时间,Te代表T时段结束时间。
[0035]优选的,所述S4中的超过边界的数据具体包括:
[0036]通话次数<MIN(已知诈骗号码通话次数)/2;
[0037]被叫次数>MAX(已知诈骗号码被叫次数)*2。
[0038]优选的,所述S5中的常量化的指标包括共用IMEI、位于可疑基站以及位于可信基站。
[0039]优选的,所述S5中的非常量指标包括通联总数、主叫频繁、呼叫对象分散度、呼叫号码归属地分散度、基站位置不变以及近期活跃度。
[0040]优选的,所述S7具体包括:通过总的可疑度从高到低进行排序,对可疑号码拨打电话,以验证可疑号码是否为诈骗号码,若确认为诈骗号码,则对历史诈骗号码库、可疑基站库以及可疑IMEI库的数据进行迭代更新,若确认为正常推广号码,则对正常营销推广号码库和正常营销推广基站库的数据进行迭代更新。
[0041]第二方面,本申请还提出了一种基于实时话单大数据的诈骗号码识别装置,其特征在于:所述装置包括:
[0042]话单大数据知识库模块,配置用于建立话单大数据知识库;
[0043]话单数据数据接入模块,配置用于接入话单数据,利用话单大数据知识库对接入的话单数据进行判断是否为白名单;
[0044]时段分割预统计模块,配置用于对话单数据进行时段分割预统计;
[0045]边界数据过滤模块,配置用于过滤超过边界的数据;
[0046]可疑度计算模块,配置用于计算出当前接入号码各行为指标的可疑权重值:Q(x)=P(x)/G(x);
[0047]对于常量化的指标:
[0048]P(x)=(Mp/Np);
[0049]G(x)=(Ma/Na);
[0050]其中,Mp代表满足条件诈骗号码人数,Np代表诈骗号码数,Ma代表满足条件所有号码人数,Na代表所有号码数;
[0051]对于非常量指标:
[0052][0053][0054]其中,x1代表指标项值

1,x2代表指标项值+1,μ1代表诈骗号码中指标项的数学期望值,σ1代表诈骗号码中指标项的方差,μ2代表全部号码中指标项的数学期望值,σ2代表全部号码中指标项的方差;
[0055]可疑度计算模块还用于累加各指标权重得本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于实时话单大数据的诈骗号码识别方法,其特征在于:所述方法包括以下步骤:S1:建立话单大数据知识库;S2:接入话单数据,利用话单大数据知识库对接入的话单数据进行判断是否为白名单,若是则执行S8,否则执行S3;S3:对话单数据进行时段分割预统计;S4:过滤超过边界的数据;S5:计算出当前接入号码各行为指标的可疑权重值:Q(x)=P(x)/G(x);对于常量化的指标:P(x)=(Mp/Np);G(x)=(Ma/Na);其中,Mp代表满足条件诈骗号码人数,Np代表诈骗号码数,Ma代表满足条件所有号码人数,Na代表所有号码数;对于非常量指标:对于非常量指标:其中,x1代表指标项值

1,x2代表指标项值+1,μ1代表诈骗号码中指标项的数学期望值,σ1代表诈骗号码中指标项的方差,μ2代表全部号码中指标项的数学期望值,σ2代表全部号码中指标项的方差;S6:累加各指标权重得到总的可疑度:S7:利用总的可疑度对可疑号码进行识别验证,并根据识别验证结果对大数据知识库进行数据迭代更新;S8:结束识别。2.根据权利要求1所述的一种基于实时话单大数据的诈骗号码识别方法,其特征在于:所述S1中的话单大数据知识库包括:历史诈骗号码库,存储已确定的诈骗号码集合S;可疑基站库,存储已确定诈骗号码出现过的基站集合为ST;可疑IMEI库,存储已确定诈骗号码关联的IMEI集合R;正常营销推广号码库,存储已确定的正常营销推广号码,汇总形成可信号码集合为W;正常营销推广基站库,存储已确定的正常营销推广号码出现过的基站,汇总形成可信基站集合为WT。3.根据权利要求1所述的一种基于实时话单大数据的诈骗号码识别方法,其特征在于:所述S3具体包括:存储每个号码每天首次通话时间T0,利用T0计算该号码的T时段记录:Ts=(Math.floor(Tx

T0)/T)*T+T0;
Te=Ts+T;其中,Ts代表T时段开始时间,Te代表T时段结束时间。4.根据权利要求3所述的一种基于实时话单大数据的诈骗号码识别方法,其特征在于:所述S4中的超过边界的数据具体包括:通话次数<MIN(已知诈骗号码通话次数)/2;被叫次数>MAX(已知诈骗号码被叫次数)*2。5.根据权利要求1所述的一种基于实时话单大数据的诈骗号码识别方法,其特征在于:所述S...

【专利技术属性】
技术研发人员:王德良温若辉陈云曾超黄雅如刘明洪姚政勇李婉婷林成斌吴僖子汤增荣王泽纪艺能
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1