一种骚扰号码识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:31009518 阅读:22 留言:0更新日期:2021-11-30 00:04
本发明专利技术实施例提供了一种骚扰号码识别方法、装置、计算机设备和存储介质。本发明专利技术实施例提供的技术方案中,将获取的待识别号码输入预先训练的第一决策树模型,输出多个第一决策树对应的第一预测标签;通过第一决策树对多个第一预测标签进行投票,生成票数最多的第一预测标签;将票数最多的第一预测标签确定为第一骚扰号码识别结果;将获取的待识别号码输入预先训练的第二决策树模型,输出多个第二决策树对应的第二预测标签;通过第二决策树对多个第二预测标签进行投票,生成票数最多的第二预测标签;将票数最多的第二预测标签确定为第二骚扰号码识别结果,通过对预测标签进行投票,提高识别骚扰号码的准确率。识别骚扰号码的准确率。识别骚扰号码的准确率。

【技术实现步骤摘要】
一种骚扰号码识别方法、装置、计算机设备和存储介质


[0001]本专利技术涉及通信
,尤其涉及一种骚扰号码识别方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着科技的发展和人民生活水平的提高,人们越来越离不开手机带给我们的便利,但是也不可避免地会接到各种各样的骚扰电话。现有技术方案主要是通过收集骚扰号码和正常号码作为算法学习的输入数据,构建分类模型。这种方案的输入数据较为单一且不能得到充分利用,导致骚扰号码的查准率偏低。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供了一种骚扰号码识别方法、装置、计算机设备和存储介质,可以提高识别骚扰号码的准确率。
[0004]一方面,本专利技术实施例提供了一种骚扰号码识别方法,所述方法包括:
[0005]将获取的待识别号码输入预先训练的第一决策树模型,输出多个第一决策树对应的第一预测标签,第一决策树与第一预测标签一一对应;
[0006]通过第一决策树对多个第一预测标签进行投票,生成票数最多的第一预测标签;
>[0007]将票数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种骚扰号码识别方法,其特征在于,所述方法包括:将获取的待识别号码输入预先训练的第一决策树模型,输出多个第一决策树对应的第一预测标签,所述第一决策树与所述第一预测标签一一对应;通过所述第一决策树对所述多个第一预测标签进行投票,生成票数最多的所述第一预测标签;将票数最多的所述第一预测标签确定为第一骚扰号码识别结果;将获取的待识别号码输入预先训练的第二决策树模型,输出多个第二决策树对应的第二预测标签,所述第二决策树与所述第二预测标签一一对应;通过所述第二决策树对所述多个第二预测标签进行投票,生成票数最多的所述第二预测标签;将票数最多的所述第二预测标签确定为第二骚扰号码识别结果。2.根据权利要求1所述的骚扰号码识别方法,其特征在于,在将获取的待识别号码输入预先训练的第一决策树模型,输出第一预测标签之前,还包括:将获取的第一样本数据划分为第一训练集和第一袋外数据;基于类bagging算法,根据所述第一训练集,构建第一树模型,所述第一树模型包括模型参数;通过网格搜索算法,对所述第一树模型的模型参数进行调整,生成初始第一决策树模型;将所述第一袋外数据输入所述初始第一决策树模型,输出第一预测准确率;将所述第一预测准确率大于第一准确率阈值的初始第一决策树模型作为第一决策树模型。3.根据权利要求1所述的骚扰号码识别方法,其特征在于,在将获取的待识别号码输入预先训练的第二决策树模型,输出第二预测标签之前,还包括:将获取的第二样本数据划分为第二训练集和第二袋外数据;基于类bagging算法,根据所述第二训练集,构建第二树模型,所述第二树模型包括模型参数;通过网格搜索算法,对所述第二树模型的模型参数进行调整,生成初始第二决策树模型;将所述第二袋外数据输入所述初始第二决策树模型,输出第二预测准确率;将所述第二预测准确率大于第二准确率阈值的初始第二决策树模型作为第二决策树模型。4.根据权利要求2所述的骚扰号码识别方法,其特征在于,在将获取的第一样本数据划分为第一训练集和第一袋外数据之前,还包括:获取白号码、灰号码、第一黑号码和第一黑号码的第一被叫侧指标数据;根据统计出的第一黑号码的数量、所述白号码的数量和所述灰号码的数量,生成第一号码比例值;通过独立成分分析算法,根据所述第一被叫侧指标数据,生成第一特征数据;若判断出所述第一号码比例值大于所述第一比例阈值,通过不平衡分类算法,根据所述第一特征数据、所述白号码、所述灰号码和所述第一黑号码,生成第一样本数据,所述第
一样本数据包括所述白号码、所述灰号码、所述第一黑号码、第一样本增加量和第一特征指标。5.根据权利要求3所述的骚扰号码识别方法,其特征在于,在将获取的第二样本数据划分为第二训练集和第二袋外数据之前,还包括:获取白号码、灰号码、第二黑号码和第二黑号码的第二被叫侧指标数据;根据统计出的第二黑号码的数量、所述白号码的数量和所述灰号码的数量,生成第二号码比例值;通过独立成...

【专利技术属性】
技术研发人员:张滨娄涛温暖周莹廖珺廖奇
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1