【技术实现步骤摘要】
本专利技术涉及一种基于通话数据来识别诈骗号码的方法和系统,属于网络通信
技术介绍
手机等移动终端作为目前普及的通讯工具,已经成为人们工作生活中不可或缺的一部分。随着近年来公安部、工信部及各级基础电信运营商的针对诈骗电话的持续打击治理,电信诈骗的猖獗势头得到有效遏制,但诈骗分子不断变换花样,由原来的广撒网的高频攻击,逐渐转向基于个人信息泄露的低频攻击,给诈骗号码的识别分析工作带来巨大挑战。如果能在主叫用户发起呼叫时快速识别出其中的疑似诈骗号码,则可以对电信诈骗进行有效防范。当前也存在有一些识别诈骗号码的技术方案,如申请人的专利申请CN201410693578.X(申请名称:一种基于聚类算法的实时拦截诈骗电话的方法和系统,申请日:2014-11-26,申请人:杭州东信北邮信息技术有限公司)公开了一种基于聚类算法的实时拦截诈骗电话的方法和系统,方法包括:根据话单记录,计算所有主叫号码在一定时间周期内的若干个特征指标值,然后采用聚类算法将所有主叫号码划分到三个簇中,从而使得每个簇中的主叫号码具有相同或相近的特征指标值;将已确认诈骗号码的特征指标值分别和三个簇中主叫号码的特征指标值进行匹配,如果特征指标值所构成的取值区间越接近则说明匹配相似度越高,最后将其中匹配相似度最高的簇设置为诈骗电话簇、匹配相似度次之的簇设置为疑似诈骗电话簇;将诈骗号码簇和疑似诈骗号码簇中的所有主叫号码分别更新到取证号码表和拦截号码表中。这些技术方案均需要较大的计算量和计算时间,主要用于后台从全网话单记录中识别出诈骗号码,然后写入到拦截号码表中,而并不能从现网所有发起呼叫的主叫号码 ...
【技术保护点】
一种基于通话数据来识别诈骗号码的方法,其特征在于,当主叫用户向被叫用户发起呼叫时,包括有:步骤A、提取本次呼叫的主叫用户在当前时间周期内的所有通话记录,并从其所有通话记录中提取出主叫用户在当前时间周期内的所有通话号码,从而构成主叫用户的通话号码集;步骤B、根据所提取的通话记录来统计主叫用户和其所有通话号码在当前时间周期内的若干通话指标,然后根据所述若干通话指标来计算主叫号码的诈骗标识符,以识别主叫号码是否是疑似诈骗号码。
【技术特征摘要】
1.一种基于通话数据来识别诈骗号码的方法,其特征在于,当主叫用户向被叫用户发起呼叫时,包括有:步骤A、提取本次呼叫的主叫用户在当前时间周期内的所有通话记录,并从其所有通话记录中提取出主叫用户在当前时间周期内的所有通话号码,从而构成主叫用户的通话号码集;步骤B、根据所提取的通话记录来统计主叫用户和其所有通话号码在当前时间周期内的若干通话指标,然后根据所述若干通话指标来计算主叫号码的诈骗标识符,以识别主叫号码是否是疑似诈骗号码。2.根据权利要求1所述的方法,其特征在于,主叫号码的诈骗标识符包括有:第一诈骗标识符,步骤B进一步包括有:步骤B11、逐一从主叫用户在当前时间周期内的所有通话记录中提取其和每个通话号码的相互通话记录,统计主叫用户在当前时间周期内作为每个通话号码的主叫时的总呼叫次数、作为每个通话号码的被叫时的总被呼叫次数、和作为每个通话号码的被叫时的平均接听时长,然后计算主叫号码相对每个通话号码的第一疑似诈骗标识符:其中,是主叫号码相对通话号码集中的第j个通话号码的第一疑似诈骗标识符,calling_numsj是主叫用户在当前时间周期内作为第j个通话号码的主叫时的总呼叫次数,called_numsj是主叫用户在当前时间周期内作为第j个通话号码的被叫时的总被呼叫次数,avg_called_ansj是主叫用户在当前时间周期内作为第j个通话号码的被叫时的平均接通时长,ZP是诈骗通话次数阈值,ACA是平均接通时长阈值;步骤B12、计算主叫号码的第一诈骗标识符:其中,M是主叫用户的通话号码集中的通话号码总数,S是疑似诈骗数阈值;步骤B13、判断主叫号码的第一诈骗标识符是否大于1,如果是,则主叫号码是疑似诈骗号码。3.根据权利要求1所述的方法,其特征在于,主叫号码的诈骗标识符包括有:第二诈骗标识符,步骤B进一步包括有:步骤B21、根据主叫用户在当前时间周期内的所有通话记录,统计主叫用户在当前时间周期内作为被叫时的总被呼叫次数作为被叫时的平均通话时长avg_called_ans,其中,M是主叫用户的通话号码集中的通话号码总数,called_numsj是主叫用户在当前时间周期内作为第j个通话号码的被叫时的总被呼叫次数;步骤B22、计算主叫号码的第二诈骗标识符:其中,PFmax分别是频繁通话次数的最大阈值,ACA是平均接通时长阈值;步骤B23、判断主叫号码的第二诈骗标识符是否是1,如果是,则主叫号码是疑似诈骗号码。4.根据权利要求1所述的方法,其特征在于,主叫号码的诈骗标识符包括有:第三诈骗标识符,步骤B进一步包括有:步骤B31、根据主叫用户在当前时间周期内的所有通话记录,统计主叫用户在当前时间周期内作为每个通话号码的被叫时的总被呼叫次数,并计算主叫号码相对每个通话号码的第三疑似诈骗标识符:其中,是主叫号码相对通话号码集中的第j个通话号码的第三疑似诈骗标识符,called_numsj是主叫用户在当前时间周期内作为第j个通话号码的被叫时的总被呼叫次数,ZP是诈骗通话次数阈值;步骤B32、计算主叫号码的第三诈骗标识符:其中,M是主叫用户的通话号码集中的通话号码总数,S是疑似诈骗数阈值;步骤B33、判断主叫号码的第三诈骗标识符是否大于1,如果是,则继续下一步;步骤B34、判断是否此次呼叫的主、被叫用户的归属地不相同、且当前的呼叫时间处于忙时工作时段,如果是,则主叫号码是疑似诈骗号码。5.根据权利要求1所述的方法,其特征在于,步骤A之前还包括有:步骤1、判断主叫号码是否在系统白名单之内,如果是,则主叫号码不是疑似诈骗号码,本流程结束;如果否,则继续下一步;步骤2、从主、被叫用户在当前时间周期内的相互通话记录中提取主叫用户作为主叫时的通话记录;步骤3、统计主叫用户在当前时间周期内作为主叫时的总呼叫次数calling_nums、主叫用户在当前时间周期内作为主叫时的接通次数calling_nums_jt、主叫用户在当前时间周期内作为主叫时的平均接通时长avg_calling_ans,计算主叫用户在当前时间周期内作为主叫时的接通率:步骤4、计算本次呼叫的主叫用户对于被叫用户的联系标识符:其中,PFmin、PFmax分别是频繁通话次数的最小、最大阈值,P是接通率阈值,ACA是平均接通时长阈值;步骤5、判断主叫用户对于被叫用户的联系标识符是否是0,如果是,则主叫号码不是疑似诈骗号码,本流程结束;如果否,则继续步骤A。6...
【专利技术属性】
技术研发人员:申正,洪永婷,吉立妍,张煊,王昊,王娜,
申请(专利权)人:杭州东信北邮信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。