System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本实施例中涉及电信安全,尤其是一种基于动态分位数处理技术的诈骗电话号码识别方法、计算机装置和存储介质。
技术介绍
1、随着互联网和通信技术的飞速发展,人们享受到了高速网络通信带来的种种便利。然而,这一进步的背后也伴随着一些副作用,其中电话诈骗活动的激增是较为突出的负面影响。电话诈骗活动不仅给广大民众带来了经济损失,也对通信运营商的业务运营和企业形象造成了严重损害。由于电话诈骗分子的手法不断更新,作案过程愈发隐蔽,对社会的危害日益严重。在这种形势下,如何有效地识别和阻止电信诈骗行为,成为了一个亟待解决的现实问题。
2、在电信运营商层面,存在以下几个需要解决的问题:首先,如何精确地识别出诈骗电话号码;其次,如何提前发现潜在的诈骗电话号码;最后,如何在做到以上两点的同时,有效降低误伤普通用户的概率。这些问题的解决对于提升电信反诈效能至关重要,对运营商的业务运作具有深远的影响。
3、目前,电信运营商以及相关层面的反诈手段主要是对话单数据进行分析,从而识别存在电话诈骗嫌疑的电话号码,具体而言,对话单数据进行分析的过程所依赖的技术可以分为规则算法模型和机器学习算法模型两类。
4、目前的诈骗电话号码识别技术采用的算法模型需要使用正样本(基于公安部提供的涉案号码提取的特征)和负样本(从话单数据中随机提取的非涉案号码特征)进行训练。办案部门(如警察)提供的涉案号码用于生成正样本号码,而负样本则通过随机选择话单数据中的号码并提取其特征来构建,这一过程没有经过办案部门的验证。因此,负样本中可能包含尚未识别的涉案号码
技术实现思路
1、针对目前的电信安全技术中,识别存在电话诈骗嫌疑的电话号码时,使用的算法模型面临着负样本噪声干扰等技术问题,本实施例中的目的在于提供一种基于动态分位数处理技术的诈骗电话号码识别方法、计算机装置和存储介质。
2、一方面,本实施例中实施例包括一种基于动态分位数处理技术的诈骗电话号码识别方法,所述基于动态分位数处理技术的诈骗电话号码识别方法包括以下步骤:
3、获取全量电话号码集和正样本号码;所述全量电话号码集中包括多个由运营商采集到的全量电话号码,所述正样本号码为被确认涉及电信诈骗案件的电话号码;
4、建立特征集;所述特征集中包括若干个特征项目,所述特征项目用于描述所述电话号码使用通话业务形成的特征;
5、对所述特征集中的各所述特征项目分别赋予相应的取值条件,从而形成筛选规则;
6、从所述全量电话号码集中,筛选出满足所述筛选规则的电话号码作为输出量,从各所述正样本号码中,筛选出满足筛选规则的电话号码作为命中量;其中,所述输出量和所述命中量组成筛选结果;
7、根据所述筛选结果、所述全量电话号码集和所述正样本号码,基于动态分位数对所述筛选规则进行更新或确认;
8、获取待识别电话号码,根据确认后的所述筛选规则,对所述待识别电话号码进行识别。
9、进一步地,所述获取全量电话号码集和正样本号码,包括:
10、从样本库提取涉案样本清单号码;
11、检测所述涉案样本清单号码使用通话业务的涉案时间段;
12、根据所述涉案时间段,从不同粒度的特征库提取涉案号码特征,从而获得所述正样本号码;
13、选取在一个时间段内发生了通话业务的电话号码,作为所述全量电话号码集。
14、进一步地,所述建立特征集,包括:
15、根据所述正样本号码的特性,选定多个特征项目;
16、分别将各所述特征项目分类至第一特征子集、第二特征子集或第三特征子集,从而组成所述特征集;其中,对于任意正样本号码,所述第一特征子集中的所述特征项目对应的取值条件为小于第一阈值,所述第二特征子集中的所述特征项目对应的取值条件为大于第二阈值,所述第三特征子集中的所述特征项目对应的取值条件为取固定值。
17、进一步地,所述根据所述正样本号码的特性,选定多个特征项目,包括:
18、获取所述正样本号码的全部特征维度;
19、对全部所述特征维度执行主成分分析,获得所述特征项目。
20、进一步地,所述对所述特征集中的各所述特征项目分别赋予相应的取值条件,从而形成筛选规则,包括:
21、分别对所述第一阈值、所述第二阈值和所述固定值设定初始值。
22、进一步地,所述根据所述筛选结果、所述全量电话号码集和所述正样本号码,基于动态分位数对所述筛选规则进行更新或确认,包括:
23、根据所述全量电话号码集中的电话号码数量,设定目标输出量条件;
24、设定目标命中率条件;
25、根据所述命中量与全部所述正样本号码的数量,确定实际命中率;
26、当所述输出量满足目标输出量条件,且所述实际命中率满足目标命中率条件,对所述筛选规则进行确认,反之,基于动态分位数对所述筛选规则进行更新。
27、进一步地,所述基于动态分位数对所述筛选规则进行更新,包括:
28、获取所述正样本号码对应的特征值;所述特征值为相应的所述特征项目的实际取值;
29、将对应相同的特征项目的各所述特征值,按照大小关系进行排序;
30、获取排序后的所述特征值对应的分位数;
31、对于所述第一特征子集中的各所述特征项目,获取相应的所述特征值对应的较小分位数作为新的所述第一阈值;
32、对于所述第二特征子集中的各所述特征项目,获取相应的所述特征值对应的较大分位数作为新的所述第二阈值。
33、进一步地,所述根据确认后的所述筛选规则,对所述待识别电话号码进行识别,包括:
34、当所述待识别电话号码满足确认后的所述筛选规则,将所述待识别电话号码确认为可疑电话号码;
35、获取所述可疑电话号码的通信业务信息;
36、根据所述通信业务信息,对所述可疑电话号码进行过滤和关停。
37、另一方面,本实施例中实施例还包括一种计算机装置,包括存储器和处理器,存储器用于存储至少一个程序,处理器用于加载至少一个程序以执行实施例中的一种基于动态分位数处理技术的诈骗电话号码识别方法。
38、另一方面,本实施例中实施例还包括一种存储介质,其中存储有处理器可执行的程序,处理器可执行的程序在由处理器执行时用于执行实施例中的一种基于动态分位数处理技术的诈骗电话号码识别方法。
39、本实施例中的有益效果是:实施例中的基于动态分位数处理技术的诈骗电话号码识别方法,只需要使用正样本号码来训练得到筛选规则模型,从而减少甚至无需使用负样本,减少对负样本的依赖,减少了因负样本噪声引入的误差,并简化了模型训练过程;实施例中的基于动态分位数处理技术的诈骗电话号码识别方法适用于正样本号码数据稀缺的情况,即使在可用的诈骗电话号码样本较少时本文档来自技高网...
【技术保护点】
1.一种基于动态分位数处理技术的诈骗电话号码识别方法,其特征在于,所述基于动态分位数处理技术的诈骗电话号码识别方法包括:
2.根据权利要求1所述的基于动态分位数处理技术的诈骗电话号码识别方法,其特征在于,所述获取全量电话号码集和正样本号码,包括:
3.根据权利要求1所述的基于动态分位数处理技术的诈骗电话号码识别方法,其特征在于,所述建立特征集,包括:
4.根据权利要求3所述的基于动态分位数处理技术的诈骗电话号码识别方法,其特征在于,所述根据所述正样本号码的特性,选定多个特征项目,包括:
5.根据权利要求3所述的基于动态分位数处理技术的诈骗电话号码识别方法,其特征在于,所述对所述特征集中的各所述特征项目分别赋予相应的取值条件,从而形成筛选规则,包括:
6.根据权利要求3-5任一项所述的基于动态分位数处理技术的诈骗电话号码识别方法,其特征在于,所述根据所述筛选结果、所述全量电话号码集和所述正样本号码,基于动态分位数对所述筛选规则进行更新或确认,包括:
7.根据权利要求6所述的基于动态分位数处理技术的诈骗电话号码识
8.根据权利要求1所述的基于动态分位数处理技术的诈骗电话号码识别方法,其特征在于,所述根据确认后的所述筛选规则,对所述待识别电话号码进行识别,包括:
9.一种计算机装置,其特征在于,包括存储器和处理器,存储器用于存储至少一个程序,处理器用于加载至少一个程序以执行权利要求1-8任一项所述的基于动态分位数处理技术的诈骗电话号码识别方法。
10.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于,处理器可执行的程序在由处理器执行时用于执行权利要求1-8任一项所述的基于动态分位数处理技术的诈骗电话号码识别方法。
...【技术特征摘要】
1.一种基于动态分位数处理技术的诈骗电话号码识别方法,其特征在于,所述基于动态分位数处理技术的诈骗电话号码识别方法包括:
2.根据权利要求1所述的基于动态分位数处理技术的诈骗电话号码识别方法,其特征在于,所述获取全量电话号码集和正样本号码,包括:
3.根据权利要求1所述的基于动态分位数处理技术的诈骗电话号码识别方法,其特征在于,所述建立特征集,包括:
4.根据权利要求3所述的基于动态分位数处理技术的诈骗电话号码识别方法,其特征在于,所述根据所述正样本号码的特性,选定多个特征项目,包括:
5.根据权利要求3所述的基于动态分位数处理技术的诈骗电话号码识别方法,其特征在于,所述对所述特征集中的各所述特征项目分别赋予相应的取值条件,从而形成筛选规则,包括:
6.根据权利要求3-5任一项所述的基于动态分位数处理技术的诈骗电话号码识别方法,其特征在于,所...
【专利技术属性】
技术研发人员:王一茸,
申请(专利权)人:广州市申迪计算机系统有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。