基于深度学习的通信号码检测方法及系统技术方案

技术编号:29618367 阅读:12 留言:0更新日期:2021-08-10 18:39
本发明专利技术公开了基于深度学习的通信号码检测方法及系统,该方法包括以下步骤:获取通信号码的CDR信令数据及开卡信息,提取通信号码的通信特征数据;将通信号码及通信特征数据聚合预设时间,转化为流式数据,输入白名单深度学习模型的生产侧,由白名单深度学习模型消费流式数据,得到每个通信号码的评分,其中白名单深度学习模型为基于RNN的神经网络;根据评分将通信号码存入白名单或者灰名单,对灰名单中的通信号码进行监测。本发明专利技术通过抓取非诈骗的号码,扩充并累积更新白名单库,可以大辐度减少监测号码的数量,减少筛选的难度,从而减少识别诈骗通信号码的难度,提高通信号码识别准确率。

【技术实现步骤摘要】
基于深度学习的通信号码检测方法及系统
本专利技术涉及通信号码监测的
,特别涉及一种基于深度学习的通信号码检测方法及系统。
技术介绍
随着科技时代的发展,手机越来越普及,极大的方便了人们的生活,但是随着而来的是大量的诈骗信息,诈骗分子使用各种手段,包括使用通话信息、个人信息等渠道,给很多人造成财产损失等伤害。诈骗份子的手段层出不穷,使得精确抓取监控诈骗号码变得困难,预判识别诈骗号码容易出现误判。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术提出一种基于深度学习的通信号码检测方法,能够提高通信号码识别准确率。本专利技术还提出一种具有上述基于深度学习的通信号码检测方法的基于深度学习的通信号码检测系统。本专利技术还提出一种具有上述基于深度学习的通信号码检测方法的计算机可读存储介质。根据本专利技术的第一方面实施例的基于深度学习的通信号码检测方法,包括以下步骤:获取通信号码的CDR信令数据及开卡信息,提取所述通信号码的通信特征数据;将所述通信号码及所述通信特征数据聚合预设时间,转化为流式数据,输入白名单深度学习模型的生产侧,由所述白名单深度学习模型消费所述流式数据,得到每个所述通信号码的评分,其中所述白名单深度学习模型为基于RNN的神经网络;根据所述评分将所述通信号码存入白名单或者灰名单,对所述灰名单中的所述通信号码进行监测。根据本专利技术实施例的基于深度学习的通信号码检测方法,至少具有如下有益效果:通过抓取非诈骗的号码,扩充并累积更新白名单库,可以大辐度减少监测号码的数量,减少筛选的难度,从而减少识别诈骗通信号码的难度,提高通信号码识别准确率。根据本专利技术的一些实施例,所述白名单深度学习模型的获取方法包括:获取通信号码的CDR信令数据及开卡信息,进行预处理并提取所述通信号码的通信特征数据,得到预处理数据;将预处理数据划分为训练集及测试集,输入所述训练集对所述白名单深度学习模型进行训练,根据训练结果调整所述白名单深度学习模型的参数并进行迭代训练;将所述测试集输入所述白名单深度学习模型,对所述白名单深度学习模型进行测试,根据测试结果对所述白名单深度学习模型进行迭代训练。根据本专利技术的一些实施例,所述训练集及所述测试集中数据对应的标签中,1表示白名单数据,0表示灰名单数据。根据本专利技术的一些实施例,根据所述评分将所述通信号码存入白名单或者灰名单的方法包括:所述评分大于第一预定值,则将所述通信号码存入白名单。根据本专利技术的一些实施例,所述第一预定值为0.8。根据本专利技术的一些实施例,所述白名单深度学习模型中采用二分类的交叉熵的损失函数。根据本专利技术的一些实施例,所述通信特征数据包括:主叫离散率、主叫频率、主叫空号率、呼叫成功率、呼叫结束原因、被叫拒绝率、被叫挂机率、被叫号码连续率、呼出终止率、通话时间分布、通话时长分布、主叫来源地、办卡开卡时间间隔、一机多号特征、被叫新号率、套餐类型、流量使用特征、主叫呼叫次数、通话总次数、主叫呼叫率、用户接通次数、用户接通率、被叫号码个数、被叫号码离散率、一人多号特征、主叫呼叫公共服务情况、客户类型及号段特征。根据本专利技术的一些实施例,所述预设时间为12小时或24小时。根据本专利技术的第二方面实施例的基于深度学习的通信号码检测系统,包括:特征提取模块,用于获取通信号码的CDR信令数据及开卡信息,提取所述通信号码的通信特征数据;聚合模块,用于将所述通信号码及所述通信特征数据聚合预设时间,转化为流式数据;检测模块,用于接收所述流式数据,通过白名单深度学习模型所述流式数据,得到每个所述通信号码的评分,其中所述白名单深度学习模型为基于RNN的神经网络;监测模块,用于根据所述评分将所述通信号码存入白名单或者灰名单,以及,对所述灰名单中的所述通信号码进行监测。根据本专利技术实施例的基于深度学习的通信号码检测系统,至少具有如下有益效果:通过抓取非诈骗的号码,扩充并累积更新白名单库,可以大辐度减少监测号码的数量,减少筛选的难度,从而减少识别诈骗通信号码的难度,提高通信号码识别准确率根据本专利技术的第三方面实施例的计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据本专利技术的第一方面实施例的方法。根据本专利技术实施例的计算机可读存储介质,至少具有与本专利技术的第一方面实施例的方法同样的有益效果。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术实施例的方法的流程示意图;图2为本专利技术实施例中提取到通信数据特征示意图;图3为本专利技术实施例的白名单深度学习模型的训练测试示意图;图4为本专利技术实施例的系统的模块示意框图。附图标记:特征提取模块100、聚合模块200、检测模块300、监测模块400。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。在本专利技术的描述中,若干的含义是一个或者多个,多个的含义是两个及两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。在本专利技术的描述中,步骤标号仅是为了描述的方便或者引述的方便所作出的标识,各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本专利技术实施例的实施过程构成任何限定。参照图1,本专利技术的实施例的方法包括:获取通信号码的CDR信令数据及开卡信息,提取通信号码的通信特征数据;将通信号码及通信特征数据聚合预设时间,转化为流式数据,输入白名单深度学习模型的生产侧,由白名单深度学习模型消费流式数据,得到每个通信号码的评分,其中白名单深度学习模型为基于RNN的神经网络;根据评分将通信号码存入白名单或者灰名单,对灰名单中的通信号码进行监测。本专利技术的实施例中,获取通信号码的CDR信令数据,获取包括话单及开卡注册信号,对这些数据提取其特征维度,得到一系列的通信特征数据,然后利用神经网络对这些通信特征数据进行分析,得到白名单号码。本实施例中,提取到的通信特征数据参照图2,包括:主叫离散率、主叫频率、主叫空号率、呼叫成功率、呼叫结束原因(图2中的主/被叫挂机或拒绝)、被叫拒绝率、被叫挂机率、被叫号码连续率、呼出终止率、通话时间分布(图2中的通话时段)、通话时长分布(图2中的通话时长)、主叫来源地、办卡开卡时间间隔、一机多号特征、被叫新号率(图2中的新号数)、套餐类型、流量使用特征、主叫呼叫次数、通话总次数本文档来自技高网...

【技术保护点】
1.一种基于深度学习的通信号码检测方法,其特征在于,包括以下步骤:/n获取通信号码的CDR信令数据及开卡信息,提取所述通信号码的通信特征数据;/n将所述通信号码及所述通信特征数据聚合预设时间,转化为流式数据,输入白名单深度学习模型的生产侧,由所述白名单深度学习模型消费所述流式数据,得到每个所述通信号码的评分,其中所述白名单深度学习模型为基于RNN的神经网络;/n根据所述评分将所述通信号码存入白名单或者灰名单,对所述灰名单中的所述通信号码进行监测。/n

【技术特征摘要】
1.一种基于深度学习的通信号码检测方法,其特征在于,包括以下步骤:
获取通信号码的CDR信令数据及开卡信息,提取所述通信号码的通信特征数据;
将所述通信号码及所述通信特征数据聚合预设时间,转化为流式数据,输入白名单深度学习模型的生产侧,由所述白名单深度学习模型消费所述流式数据,得到每个所述通信号码的评分,其中所述白名单深度学习模型为基于RNN的神经网络;
根据所述评分将所述通信号码存入白名单或者灰名单,对所述灰名单中的所述通信号码进行监测。


2.根据权利要求1所述的基于深度学习的通信号码检测方法,其特征在于,所述白名单深度学习模型的获取方法包括:
获取通信号码的CDR信令数据及开卡信息,进行预处理并提取所述通信号码的通信特征数据,得到预处理数据;
将预处理数据划分为训练集及测试集,输入所述训练集对所述白名单深度学习模型进行训练,根据训练结果调整所述白名单深度学习模型的参数并进行迭代训练;
将所述测试集输入所述白名单深度学习模型,对所述白名单深度学习模型进行测试,根据测试结果对所述白名单深度学习模型进行迭代训练。


3.根据权利要求2所述的基于深度学习的通信号码检测方法,其特征在于,所述训练集及所述测试集中数据对应的标签中,1表示白名单数据,0表示灰名单数据。


4.根据权利要求2所述的基于深度学习的通信号码检测方法,其特征在于,根据所述评分将所述通信号码存入白名单或者灰名单的方法包括:所述评分大于第一预定值,则将所述通信号码存入白名单。


5.根据权利要求4所述的基于深度学习的通信号码检测方法,其特征在于,所述第一预定值为0...

【专利技术属性】
技术研发人员:刘立峰冯志峰鲍尚策董华
申请(专利权)人:珠海高凌信息科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1