当前位置: 首页 > 专利查询>王晨专利>正文

一种诈骗电话识别方法、装置、系统及计算机存储介质制造方法及图纸

技术编号:32742398 阅读:20 留言:0更新日期:2022-03-20 08:49
本发明专利技术公开一种诈骗电话识别方法、装置、系统及计算机存储介质。其中,该方法包括:获取当前场景下的训练样本数据集和测试样本数据集;将训练样本数据集进行多维度特征提取得到的多个第一特征通过随机森林算法进行模型训练,得到检测模型;将测试样本数据集输入到检测模型中并对检测模型进行参数优化,以得到更新的检测模型以及模型预测结果;根据多个评价指标对模型预测结果进行评估,判断检测模型是否可行;当检测模型可行时,将待预测号码进行多维度特征提取得到的多个第二特征输入到更新的检测模型中进行预测,得到待预测号码为异常的概率P;将概率P与预设阈值进行比较,根据比较结果判断待预测号码是否为异常。该方法时效性长,准确率高。准确率高。准确率高。

【技术实现步骤摘要】
一种诈骗电话识别方法、装置、系统及计算机存储介质


[0001]本专利技术涉及网络安全
,具体而言,涉及一种诈骗电话识 别方法、装置、系统及计算机存储介质。

技术介绍

[0002]现有技术中,针对电信诈骗的号卡治理主要是基于名单库和业务 规则两种方式进行研判。第一种通过黑白名单机制进行号卡过滤的方 法,其有效性主要依赖于名单库的实效,该名单库通常是在事后再进 入系统,研判的实效性和涉诈号卡捕获的全面性都有明显的短板。另 一种是基于历史黑名单进行业务数据分析,提炼出地域属性、频次属 性等的强业务规则,这类业务规则的研判方式则充分依赖于专家经验, 存在着维护困难、拦截准确率不可预估等问题。
[0003]针对现有技术中通过黑名单机制进行号卡过滤的方法所存在的时 效性短、不全面以及通过依赖专家经验进行研判存在的准确率低、维 护困难的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本专利技术实施例中提供一种诈骗电话识别方法、装置、系统及计算 机存储介质,以解决现有技术中通过黑名单机制进行号卡过滤的方法 所存在的时效性短、不全面以及通过依赖专家经验进行研判存在的准 确率低、维护困难的问题。
[0005]为达到上述目的,一方面,本专利技术提供了一种诈骗电话识别方法, 该方法包括:获取当前场景下的训练样本数据集和测试样本数据集; 对所述训练样本数据集进行多维度特征提取,得到多个第一特征;将 所述多个第一特征通过随机森林算法进行模型训练,得到检测模型; 将所述测试样本数据集输入到所述检测模型中并对所述检测模型进行 参数优化,以得到更新的检测模型以及模型预测结果;根据多个评价 指标对所述模型预测结果进行评估,根据评估结果判断所述检测模型 是否可行;当所述检测模型可行时,将待预测号码进行多维度特征提 取,并将提取到的多个第二特征输入到所述更新的检测模型中进行预 测,得到所述待预测的电话号码为异常的概率P;将所述概率P与预 设阈值进行比较,根据比较结果判断所述待预测的电话号码是否为异 常。
[0006]可选的,所述根据多个评价指标对所述模型预测结果进行评估, 根据评估结果判断所述检测模型是否可行包括:当每个所述评价指标 对所述模型预测结果的评估值均大于90分时,则判定所述检测模型可 行。
[0007]可选的,所述多维度特征至少包括:通话特征、短信特征和流量 特征。
[0008]可选的,所述对所述训练样本数据集进行多维度特征提取,得到 多个第一特征包括:对所述训练样本数据集进行筛选,筛选出所述训 练样本数据集中负样本占比更高的训练样本数据子集;对所述训练样 本数据子集进行多维度特征提取,得到所述多个第一特征。
[0009]可选的,所述场景至少包括:沉默卡复活场景、异常漫游涉诈场 景、新开卡涉诈场景。
[0010]另一方面,本专利技术提供了一种诈骗电话识别装置,该装置包括:
[0011]获取单元,用于获取当前场景下的训练样本数据集和测试样本数 据集;训练单元,用于对所述训练样本数据集进行多维度特征提取, 得到多个第一特征;将所述多个第一特征通过随机森林算法进行模型 训练,得到检测模型;更新单元,用于将所述测试样本数据集输入到 所述检测模型中并对所述检测模型进行参数优化,以得到更新的检测 模型以及模型预测结果;评估单元,用于根据多个评价指标对所述模 型预测结果进行评估,根据评估结果判断所述检测模型是否可行;预 测单元,用于当所述检测模型可行时,将待预测号码进行多维度特征 提取,并将提取到的多个第二特征输入到所述更新的检测模型中进行 预测,得到所述待预测的电话号码为异常的概率P;判断单元,用于将 所述概率P与预设阈值进行比较,根据比较结果判断所述待预测的电话 号码是否为异常。
[0012]可选的,所述评估单元包括:评估子单元,用于当每个所述评价 指标对所述模型预测结果的评估值均大于90分时,则判定所述检测模 型可行。
[0013]可选的,所述训练单元包括:筛选子单元,用于对所述训练样本 数据集进行筛选,筛选出所述训练样本数据集中负样本占比更高的训 练样本数据子集;提取子单元,用于对所述训练样本数据子集进行多 维度特征提取,得到所述多个第一特征。
[0014]另一方面,本专利技术还提供了一种诈骗电话识别系统,包括上述的 诈骗电话识别装置。
[0015]另一方面,本专利技术还提供了一种计算机可读存储介质,其上存储 有计算机程序,所述程序被处理器执行时实现上述的诈骗电话识别方 法。
[0016]本专利技术的有益效果:
[0017]本专利技术提供了一种诈骗电话识别方法,该方法包括:获取当前场 景下的训练样本数据集和测试样本数据集;对所述训练样本数据集进 行多维度特征提取,得到多个第一特征;将所述多个第一特征通过随 机森林算法进行模型训练,得到检测模型;将所述测试样本数据集输 入到所述检测模型中并对所述检测模型进行参数优化,以得到更新的 检测模型以及模型预测结果;根据多个评价指标对所述模型预测结果 进行评估,根据评估结果判断所述检测模型是否可行;当所述检测模 型可行时,将待预测号码进行多维度特征提取,并将提取到的多个第 二特征输入到所述更新的检测模型中进行预测,得到所述待预测的电 话号码为异常的概率P;将所述概率P与预设阈值进行比较,根据比较 结果判断所述待预测的电话号码是否为异常。
[0018]上述方法中,通过进行多维度特征提取,可以提高检测的准确率; 将训练样本数据集通过随机森林算法进行模型训练得到检测模型,实 时将待预测的号码输入到检测模型中进行预测,可以保证检测的全面 性,以及通过该方法保证时效性长、后续维护方便。
附图说明
[0019]图1是本专利技术实施例提供的一种诈骗电话识别方法的流程图;
[0020]图2是本专利技术实施例提供的获取多个第一特征的流程图;
[0021]图3是本专利技术实施例提供的一种诈骗电话识别装置的结构示意图;
[0022]图4是本专利技术实施例提供的训练单元的结构示意图。
具体实施方式
[0023]为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附 图对本专利技术作进一步地详细描述,显然,所描述的实施例仅仅是本发 明一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本 领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实 施例,都属于本专利技术保护的范围。
[0024]现有技术中,针对电信诈骗的号卡治理主要是基于名单库和业务 规则两种方式进行研判。第一种通过黑白名单机制进行号卡过滤的方 法,其有效性主要依赖于名单库的实效,该名单库通常是在事后再进 入系统,研判的实效性和涉诈号卡捕获的全面性都有明显的短板。另 一种是基于历史黑名单进行业务数据分析,提炼出地域属性、频次属 性等的强业务规则,这类业务规则的研判方式则充分依赖于专家经验, 存在着维护困难、拦截准确率不可预估等问题。
[0025]因而,本专利技术提供了一种诈骗电话识别方法,图1是本专利技术实施 例提供的一种诈骗电话识别本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种诈骗电话识别方法,其特征在于,包括:获取当前场景下的训练样本数据集和测试样本数据集;对所述训练样本数据集进行多维度特征提取,得到多个第一特征;将所述多个第一特征通过随机森林算法进行模型训练,得到检测模型;将所述测试样本数据集输入到所述检测模型中并对所述检测模型进行参数优化,以得到更新的检测模型以及模型预测结果;根据多个评价指标对所述模型预测结果进行评估,根据评估结果判断所述检测模型是否可行;当所述检测模型可行时,将待预测的电话号码进行多维度特征提取,并将提取到的多个第二特征输入到所述更新的检测模型中进行预测,得到所述待预测的电话号码为异常的概率P;将所述概率P与预设阈值进行比较,根据比较结果判断所述待预测的电话号码是否为异常。2.根据权利要求1所述的方法,其特征在于,所述根据多个评价指标对所述模型预测结果进行评估,根据评估结果判断所述检测模型是否可行包括:当每个所述评价指标对所述模型预测结果的评估值均大于90分时,则判定所述检测模型可行。3.根据权利要求1所述的方法,其特征在于:所述多维度特征至少包括:通话特征、短信特征和流量特征。4.根据权利要求1所述的方法,其特征在于,所述对所述训练样本数据集进行多维度特征提取,得到多个第一特征包括:对所述训练样本数据集进行筛选,筛选出所述训练样本数据集中负样本占比更高的训练样本数据子集;对所述训练样本数据子集进行多维度特征提取,得到所述多个第一特征。5.根据权利要求1所述的方法,其特征在于:所述场景至少包括:沉默卡复活场景、异常漫游涉诈场景、新开卡涉诈场景。6.一种诈骗电话识别装置,其特征在于,包括:...

【专利技术属性】
技术研发人员:王晨包森成余娜徐强王健葛胜利
申请(专利权)人:王晨
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1