一种通信诈骗识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37874759 阅读:13 留言:0更新日期:2023-06-15 21:03
本发明专利技术实施例提供了一种通信诈骗识别方法、装置、电子设备和存储介质,所述方法包括:获取主叫号码N天内的通话数据;将前N/2天内的通话数据作为第一通话数据,将后N/2天内的通话数据作为第二通话数据;根据第一通话数据、第二通话数据,确定通话指标,通话指标包括:第一通话数据中被叫号码总数、第二通话数据中被叫号码总数、第一通话数据中短联号码占比、第二通话数据中短联号码占比、常联号码相似度、短联号码相似度、长途通话占比中至少一种;根据通话指标判断主叫号码是否为通信诈骗号码。通过所述方法,可以有效解决传统模型中对通话频次低,和前期正常后期突然涉诈这类通信诈骗识别能力差的问题。识别能力差的问题。识别能力差的问题。

【技术实现步骤摘要】
一种通信诈骗识别方法、装置、电子设备和存储介质


[0001]本专利技术涉及通信安全
,特别是涉及一种通信诈骗识别方法、装置、电子设备和存储介质。

技术介绍

[0002]随着国家和运营商对通讯诈骗的持续高压态势,诈骗分子也在不断研究尝试规避打击的方法和手段。目前通讯诈骗呈现的形式是:1、诈骗用户逐渐由新入网用户向老用户倾斜。2、从诈骗行为上看出现了很多呼叫频次低,单日呼叫量少的涉诈用户。3、出现很多诈骗用户在被运营商的反诈手段识别停机后又进行实名核验复机,然后继续执行诈骗。
[0003]针对以上问题,运营商急需研究新的反诈技术手段对现有反诈体系进行完善,实现对这些新型诈骗行为进行高精度的甄别。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种通信诈骗识别方法、装置、电子设备和存储介质。
[0005]为了解决上述问题,第一方面,本专利技术实施例公开了一种通信诈骗识别方法,所述方法包括:
[0006]获取主叫号码N天内的通话数据,其中,N为大于0的整数,所述通话数据包括被叫号码、通话时间、通话时长、主叫号码通话地、被叫号码通话地;
[0007]将前N/2天内的所述通话数据作为第一通话数据,将后N/2天内的所述通话数据作为第二通话数据;
[0008]根据所述第一通话数据、所述第二通话数据,确定通话指标;所述通话指标包括:所述第一通话数据中被叫号码总数、所述第二通话数据中被叫号码总数、所述第一通话数据中短联号码占比、所述第二通话数据中短联号码占比、常联号码相似度、短联号码相似度、长途通话占比中至少一种;所述常联号码相似度为第一通话数据中的常联号码与第二通话数据中的常联号码相似度,所述短联号码相似度为第一通话数据中的短联号码与第二通话数据中的短联号码相似度;
[0009]判断所述通话指标是否满足第一预设条件;
[0010]若所述通话指标满足第一预设条件,则确定所述主叫号码为通信诈骗号码。
[0011]可选的,所述根据所述第一通话数据、所述第二通话数据,确定通话指标,包括:
[0012]根据所述第一通话数据的所述通话时间、所述通话时长,从所述第一通话数据的被叫号码中确定常联号码和短联号码;以及根据所述第二通话数据的所述通话时间、所述通话时长,从所述第二通话数据的被叫号码中确定常联号码和短联号码;
[0013]根据所述第一通话数据的常联号码和短联号码、所述第二通话数据的常联号码和短联号码,确定N天内常联号码总数和短联号码总数;以及,确定所述第一通话数据和所述第二通话数据中,重复的常联号码个数和重复的短联号码个数;
[0014]将所述重复的常联号码个数和所述N天内的常联号码总数的比值,作为常联号码相似度;
[0015]将所述重复的短联号码个数和所述N天内的短联号码总数的比值,作为短联号码相似度。
[0016]可选的,所述根据所述第一通话数据的所述通话时间、所述通话时长,从所述第一通话数据的被叫号码中确定常联号码和短联号码,包括:
[0017]将所述主叫号码分别与所述第一通话数据中的各个被叫号码组成号码对,得到第一号码对集合;
[0018]根据所述第一通话数据的所述通话时间、所述通话时长,确定所述第一号码对集合中每个号码对的号码对特征,所述号码对特征包括:主叫次数、被叫次数、平均时长、最大时长、通话天数;
[0019]当号码对的号码对特征满足第二预设条件时,将号码对中的被叫号码标记为常联号码;其中,所述第二预设条件包括:所述主叫次数大于等于第一预设数值,所述被叫次数大于等于第二预设数值,所述平均时长大于等于第三预设数值,所述最大时长大于等于第四预设数值,所述通话天数大于第五预设数值;
[0020]当号码对的所述号码对特征不满足所述第二预设条件时,将号码对中的被叫号码标记为短联号码;
[0021]所述根据所述第二通话数据的所述通话时间、所述通话时长,从所述第二通话数据的被叫号码中确定常联号码和短联号码,包括:
[0022]将所述主叫号码与所述第二通话数据中的各个被叫号码组成号码对,得到第二号码对集合;
[0023]根据所述第二通话数据的所述通话时间、所述通话时长,确定所述第二号码对集合中每个号码对的所述号码对特征;
[0024]当号码对的所述号码对特征满足所述第二预设条件时,将号码对中的被叫号码标记为常联号码;
[0025]当号码对的所述号码对特征不满足所述第二预设条件时,将号码对中的被叫号码标记为短联号码。
[0026]可选的,所述通话天数为号码对存在呼叫记录的天数,所述平均时长为号码对累计通话时长与所述通话天数的比值。
[0027]可选的,所述根据所述第一通话数据、所述第二通话数据,确定通话指标,包括:
[0028]根据所述第一通话数据的短联号码,统计所述第一通话数据中的短联号码总数;
[0029]根据所述第一通话数据的被叫号码,统计所述第一通话数据中被叫号码总数;
[0030]将所述第一通话数据中的短联号码总数和所述第一通话数据中被叫号码总数的比值,作为所述第一通话数据中短联号码占比;
[0031]根据所述第二通话数据的短联号码,统计所述第二通话数据中的短联号码总数;
[0032]根据所述第二通话数据的被叫号码,统计所述第二通话数据中被叫号码总数;
[0033]将所述第二通话数据中的短联号码总数和所述第二通话数据中被叫号码总数的比值,作为所述第二通话数据中短联号码占比。
[0034]可选的,所述根据所述第一通话数据、所述第二通话数据,确定通话指标,包括:
[0035]根据所述第一通话数据的所述主叫号码通话地和所述被叫号码通话地、所述第二通话数据的所述主叫号码通话地和所述被叫号码通话地,统计N天内长途通话号码个数;
[0036]根据所述第一通话数据的被叫号码、所述第二通话数据的被叫号码,统计N天内被叫号码总数;
[0037]将所述N天内长途通话号码个数和所述N天内被叫号码总数的比值,作为长途通话占比。
[0038]可选的,所述第一预设条件包括:所述长途通话占比大于第六预设数值,所述第一通话数据中被叫号码总数大于等于第七预设数值,所述第二通话数据中被叫号码总数大于等于第八预设数值,所述第一通话数据中短联号码占比和所述第二通话数据中短联号码占比的最大值大于第九预设数值,所述常联号码相似度小于第十预设数值,所述短联号码相似度小于第十一预设数值。
[0039]第二方面,本专利技术实施例公开了一种通信诈骗识别装置,所述装置包括:
[0040]数据获取模块,用于获取主叫号码N天内的通话数据,其中,N为大于0的整数,所述通话数据包括被叫号码、通话时间、通话时长、主叫号码通话地、被叫号码通话地;
[0041]数据分类模块,用于将前N/2天内的所述通话数据作为第一通话数据,将后N/2天内的所述通话数据作为第二通本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种通信诈骗识别方法,其特征在于,包括:获取主叫号码N天内的通话数据,其中,N为大于0的整数,所述通话数据包括被叫号码、通话时间、通话时长、主叫号码通话地、被叫号码通话地;将前N/2天内的所述通话数据作为第一通话数据,将后N/2天内的所述通话数据作为第二通话数据;根据所述第一通话数据、所述第二通话数据,确定通话指标;所述通话指标包括:所述第一通话数据中被叫号码总数、所述第二通话数据中被叫号码总数、所述第一通话数据中短联号码占比、所述第二通话数据中短联号码占比、常联号码相似度、短联号码相似度、长途通话占比中至少一种;所述常联号码相似度为第一通话数据中的常联号码与第二通话数据中的常联号码相似度,所述短联号码相似度为第一通话数据中的短联号码与第二通话数据中的短联号码相似度;判断所述通话指标是否满足第一预设条件;若所述通话指标满足第一预设条件,则确定所述主叫号码为通信诈骗号码。2.根据权利要求1所述的通信诈骗识别方法,其特征在于,所述根据所述第一通话数据、所述第二通话数据,确定通话指标,包括:根据所述第一通话数据的所述通话时间、所述通话时长,从所述第一通话数据的被叫号码中确定常联号码和短联号码;以及根据所述第二通话数据的所述通话时间、所述通话时长,从所述第二通话数据的被叫号码中确定常联号码和短联号码;根据所述第一通话数据的常联号码和短联号码、所述第二通话数据的常联号码和短联号码,确定N天内常联号码总数和短联号码总数;以及,确定所述第一通话数据和所述第二通话数据中,重复的常联号码个数和重复的短联号码个数;将所述重复的常联号码个数和所述N天内的常联号码总数的比值,作为常联号码相似度;将所述重复的短联号码个数和所述N天内的短联号码总数的比值,作为短联号码相似度。3.根据权利要求2所述的通信诈骗识别方法,其特征在于,所述根据所述第一通话数据的所述通话时间、所述通话时长,从所述第一通话数据的被叫号码中确定常联号码和短联号码,包括:将所述主叫号码分别与所述第一通话数据中的各个被叫号码组成号码对,得到第一号码对集合;根据所述第一通话数据的所述通话时间、所述通话时长,确定所述第一号码对集合中每个号码对的号码对特征,所述号码对特征包括:主叫次数、被叫次数、平均时长、最大时长、通话天数;当号码对的号码对特征满足第二预设条件时,将号码对中的被叫号码标记为常联号码;其中,所述第二预设条件包括:所述主叫次数大于等于第一预设数值,所述被叫次数大于等于第二预设数值,所述平均时长大于等于第三预设数值,所述最大时长大于等于第四预设数值,所述通话天数大于第五预设数值;当号码对的所述号码对特征不满足所述第二预设条件时,将号码对中的被叫号码标记为短联号码;
所述根据所述第二通话数据的所述通话时间、所述通话时长,从所述第二通话数据的被叫号码中确定常联号码和短联号码,包括:将所述主叫号码与所述第二通话数据中的各个被叫号码组成号码对,得到第二号码对集合;根据所述第二通话数据的所述通话时间、所述通话时长,确定所述第二号码对集合中每个号码对的所述号码对特征;当号码对的所述号码对特征满足所述第二预设条件时,将号码对中的被叫号码标记为常联号码;当号码对的所述号码对特征不满足所述第二预设条件时,将号码对中的被叫号码标记为短联号码。4.根据权利要求3所述的通信诈骗识别方法,其特征在于,所述通话天数为号码对存在呼叫记录...

【专利技术属性】
技术研发人员:李荣刘楠博陈舜
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1