一种基于图网络和机器学习的电话号码诈骗模式识别的方法技术

技术编号:35191400 阅读:37 留言:0更新日期:2022-10-12 18:11
本发明专利技术属于通讯信息安全应用技术领域,尤其涉及一种基于图网络和机器学习的电话号码诈骗模式识别的方法。与现有技术相比,本发明专利技术的优点和积极效果在于,本发明专利技术提供一种基于图网络和机器学习的电话号码诈骗模式识别的方法,首先利用图网络进行初步分析,减少样本的计算量以及提高样本的准确率,在通过机器学习算法得到相应的诈骗模型,从而提高诈骗号码识别的准确率。为通信安全、和谐提供有利的护航。为通信安全、和谐提供有利的护航。为通信安全、和谐提供有利的护航。

【技术实现步骤摘要】
一种基于图网络和机器学习的电话号码诈骗模式识别的方法


[0001]本专利技术属于通讯信息安全应用
,尤其涉及一种基于图网络和机器学习的电话号码诈骗模式识别的方法。

技术介绍

[0002]随着互联网和移动终端的快速发展,个人计算机、智能手机以及其他具有上网功能的移动设备已经成为人们生活与工作中不可缺少的工具,但是背后的安全问题越来越严重,网络、电信诈骗就是其中一种。目前,网络诈骗已成为人们经济和财产损失的主要危害方式。网络诈骗的手段多种方式,诈骗分子通过电子邮件、手机短信、电话、微信等向被害者发送含有诈骗信息的内容,如含有木马的链接、可疑的账号甚至虚假信息等数据,会有大量的群众受骗。电信诈骗是通过电话的方式,经常是通过软件进行改号,并仿冒银行、运营商、社保、公检法等进行欺诈行为。
[0003]传统的电话号码诈骗识别模式系统多是利用话单、流量、短信、位置等信息,综合使用专家规则和机器学习算法等方法,建立相关模型,对电话号码是否诈骗进行识别。传统的电话号码诈骗识别模式系统往往仅利用了电话号码的静态的、孤立的属性和行为信息,忽略了号码与号码之间、号码与证件之间、号码与终端之间、号码与位置之间等的关联信息,即没有使用号码的社交网络属性,不能有效地对诈骗电话进行识别。
[0004]因此,如何对具有社交网络属性的诈骗号码进行识别,是本领域业务和技术人员亟待解决的问题。

技术实现思路

[0005]本专利技术针对上述的现有诈骗号码的识别所存在的技术问题,提出一种设计合理、方法简单且能够有效识别诈骗号码、提高服务质量的基于图网络和机器学习的电话号码诈骗模式识别的方法。
[0006]为了达到上述目的,本专利技术采用的技术方案为,本专利技术提供一种基于图网络和机器学习的电话号码诈骗模式识别的方法,包括以下步骤:
[0007]a、获取初始电话号码,并提取初始电话号码当天的一跳、二跳的通话数据;
[0008]b、根据预设的判定规则对初始电话号码、一跳电话号码、二跳电话号码进行黑灰类型标注;
[0009]c、根据主被叫关系和初始电话号码、一跳电话号码、二跳电话号码的黑灰情况,筛选符合图网络模式的号码;
[0010]d、将筛选后的号码再次进行黑灰类型标注;
[0011]e、对获取号码的属性和行为数据,并对数据进行预处理,得到训练数据,并获取独立于训练数据的测试数据;
[0012]f、使用训练数据利用机器学习算法,对数据训练、评估和优化,得到基于图网络的机器学习模型;
[0013]g、根据测试数据,对机器学习模型识别结果进行进一步的评估;
[0014]h、将获取的号码的属性和行为数据输入到预先构建的模型中,并对其进行诈骗识别;
[0015]i、将模型识别出的异常号码输入到诈骗号码处置平台,进行号码观察、关停等措施进行处置。
[0016]作为优选,所述初始电话号码为入网半年或一年以内的电话号码或其他群体类型的号码。
[0017]作为优选,所述b步骤中,判定规则为:近半年来,被上级主管部门通报的号码,此类号码为黑号码;近半年来,通信运营商内部模型检出的号码,此类号码为灰号码;近半年来,没有被上级主管部门通报且没有被通信运营商内部模型检出的号码,此类号码为白号码。
[0018]作为优选,所述c步骤中,根据图网络类型,判定初始电话是否符合诈骗类型,若符合则将该初始电话号码筛选出来。
[0019]作为优选,所述d步骤中,黑灰类型标注的规则为:如果筛选后的号码近半年来被上级主管部门通报或被通信运营商内部模型检出,同时当天被通信运营商内部模型检出,此类号码为黑号码;如果筛选后的号码近半年来被上级主管部门通报或被通信运营商内部模型检出,同时当天没有被通信运营商内部模型检出,此类号码为灰号码;如果筛选后的号码没有被近半年来被上级主管部门通报或没有被通信运营商内部模型检出,而且当天没有被通信运营商内部模型检出,此类号码为白号码。
[0020]作为优选,所述f步骤中,机器学习算法为随机森林、XGBooost或 LightGBM。
[0021]作为优选,所述f步骤的具体操作方法为:
[0022]f1、首先根据随机森林、XGBooost或LightGBM算法进行训练,得到诈骗识别模式;
[0023]f2、然后采用欠采样和过采样、代价敏感学习、概率阈值调整的方式对诈骗识别模式进行处理,直到得到高准确率、高召回率的诈骗识别模型。
[0024]作为优选,所述g步骤中,对机器学习模型识别结果进行进一步的评估方法为:
[0025]g1、检测诈骗识别模型标记为诈骗的号码分别在前一个月、后一个月被其他模型的检出情况,比例是否较高;检测诈骗识别模型标记为诈骗的号码分别在前一个月、后一个月覆盖工信部涉案、工信部欺诈、公安调证号码的情况;检测诈骗识别模型标记为诈骗的号码分别在前一个月、后一个月用户状态情况,即正常开机号码比例有没有下降,下降比例是否较高等,局方双向停机是否增加,增加比例是否较高等内容;检测诈骗识别模型标记为诈骗的号码被互联网诈骗标签标记情况,诈骗号码比例是否较高,标记比例是否较高;
[0026]g2、根据调整模型阈值大小,直至评估结果符合要求。
[0027]与现有技术相比,本专利技术的优点和积极效果在于,
[0028]1、本专利技术提供一种基于图网络和机器学习的电话号码诈骗模式识别的方法,首先利用图网络进行初步分析,减少样本的计算量以及提高样本的准确率,在通过机器学习算法得到相应的诈骗模型,从而提高诈骗号码识别的准确率。为通信安全、和谐提供有利的护航。
附图说明
[0029]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0030]图1为基于图网络和机器学习的电话号码诈骗模式识别的方法为的结构示意图;
[0031]图2为诈骗识别模型初步识别的结果图;
[0032]图3为诈骗识别模型调整后识别的结果图。
具体实施方式
[0033]为了能够更清楚地理解本专利技术的上述目的、特征和优点,下面结合附图和实施例对本专利技术做进一步说明。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
[0034]在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,但是,本专利技术还可以采用不同于在此描述的其他方式来实施,因此,本专利技术并不限于下面公开说明书的具体实施例的限制。
[0035]实施例1,如图1所示,获取初始电话号码,并提取该初始电话号码当天的一跳电话号码、二跳电话号码的通话数据,诈骗分子往往是很活跃的,即再通话和流量等方面使用较多。这样,通过提取该初始电话号码当天的一跳电话号码、二跳电话号码的通话数据,有利于观察该初始电话号码每天的通话情况及其对端号码的通话本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图网络和机器学习的电话号码诈骗模式识别的方法,其特征在于,包括以下步骤:a、获取初始电话号码,并提取初始电话号码当天的一跳、二跳的通话数据;b、根据预设的判定规则对初始电话号码、一跳电话号码、二跳电话号码进行黑灰类型标注;c、根据主被叫关系和初始电话号码、一跳电话号码、二跳电话号码的黑灰情况,筛选符合图网络模式的号码;d、将筛选后的号码再次进行黑灰类型标注;e、对获取号码的属性和行为数据,并对数据进行预处理,得到训练数据,并获取独立于训练数据的测试数据;f、使用训练数据利用机器学习算法,对数据训练、评估和优化,得到基于图网络的机器学习模型;g、根据测试数据,对机器学习模型识别结果进行进一步的评估;h、将获取的号码的属性和行为数据输入到预先构建的模型中,并对其进行诈骗识别;i、将模型识别出的异常号码输入到诈骗号码处置平台,进行号码观察、关停等措施进行处置。2.根据权利要求1所述的基于图网络和机器学习的电话号码诈骗模式识别的方法,其特征在于,所述初始电话号码为入网半年或一年以内的电话号码或其他群体类型的号码。3.根据权利要求2所述的一种基于图网络和机器学习的电话号码诈骗模式识别的方法,其特征在于,所述b步骤中,判定规则为:近半年来,被上级主管部门通报的号码,此类号码为黑号码;近半年来,通信运营商内部模型检出的号码,此类号码为灰号码;近半年来,没有被上级主管部门通报且没有被通信运营商内部模型检出的号码,此类号码为白号码。4.根据权利要求3所述的一种基于图网络和机器学习的电话号码诈骗模式识别的方法,其特征在于,所述c步骤中,根据图网络类型,判定初始电话是否符合诈骗类型,若符合则将该初始电话号码筛选出来。5.根据权利要求4所述的一种基于图网络和机器学习的电话号码诈骗模式识别的方法,其特征在于,所述d步骤中,黑灰类型标注的规则为:如果筛选后...

【专利技术属性】
技术研发人员:王凤玺王中飞常福慧郭永江万翔宇
申请(专利权)人:联通山东产业互联网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1