一种基于大数据分析的骚扰电话检测方法及系统技术方案

技术编号:32517050 阅读:15 留言:0更新日期:2022-03-02 11:13
本发明专利技术涉及一种基于大数据分析的骚扰电话检测方法及系统,所述一种基于大数据分析的骚扰电话检测方法包括:利用通话数据获取通话数据场景特征库;利用所述通话数据场景特征库获取骚扰电话检测结果,所述一种基于大数据分析的骚扰电话检测系统包括:获取模块,用于利用通话数据获取通话数据场景特征库;检测模块,用于利用所述通话数据场景特征库获取骚扰电话检测结果,针对不同通话数据的多种类特征进行提取,并进行分类检测,在提升了分类识别速度的同时,也可以覆盖大多数通话数据场景,提高了对骚扰电话的分析程度,对分类识别的准确性有较大提升,应用范围较广,改善了检测方法的适用性。法的适用性。法的适用性。

【技术实现步骤摘要】
一种基于大数据分析的骚扰电话检测方法及系统


[0001]本专利技术涉及通信
,具体涉及一种基于大数据分析的骚扰电话检测方法及系统。

技术介绍

[0002]目前骚扰电话分析、分类方法单一,无法细分骚扰电话属性;骚扰电话的分析程度比较浅,分析结果种类少,提取特征有限,准确性不高。针对以上问题,亟需对电信网话务数据进行大数据特征分析并进行重要特征提取,并依据深度学习技术进行模型训练,进而准确分析出骚扰号码,进行预警处置的技术手段。

技术实现思路

[0003]针对现有技术的不足,本专利技术提出一种基于大数据分析的骚扰电话检测方法,包括:
[0004]利用通话数据获取通话数据场景特征库;
[0005]利用所述通话数据场景特征库获取骚扰电话检测结果。
[0006]优选的,所述利用通话数据获取通话数据场景特征库包括:
[0007]对通话数据进行预处理获取通话数据场景初始特征;
[0008]将所述通话数据初始特征带入预先训练的通话数据特征分类模型得到通话数据场景特征库。
[0009]进一步的,所述对通话数据进行预处理获取通话数据场景初始特征包括:
[0010]利用数据相识度与非骚扰电话数据记录去除所述通话数据中正常通话数据,得到所述通化数据场景初始特征。
[0011]进一步的,所述通话数据特征分类模型的训练包括:
[0012]利用通话数据的通话呼叫数据获取通话数据分类特征,利用通话数据的通话身份数据获取通话数据特有特征,利用通话数据的通话基础数据获取通话数据基础特征;
[0013]利用所述通话数据分类特征、通话数据特有特征与通话数据基础特征划分建立通话数据训练集与通话数据验证集;
[0014]以所述通话数据训练集为输入,以通话数据对应的特征类型为输出,基于机器学习算法对模型进行训练;
[0015]利用所述通话数据验证集进行验证,得到通话数据特征初始分类模型;
[0016]根据所述通话数据特征初始分类模型的拟合度获取通话数据特征分类模型。
[0017]进一步的,所述利用通话数据分类特征、通话数据特有特征与通话数据基础特征划分建立通话数据训练集与通话数据验证集包括:
[0018]利用通话数据分类特征、通话数据特有特征与通话数据基础特征基于二八法则建立通话数据训练集与通话数据验证集。
[0019]进一步的,所述根据通话数据特征初始分类模型的拟合度获取通话数据特征分类
模型包括:
[0020]根据拟合度判断通话数据特征初始分类模型是否达到要求,若是,则保留进行模型融合,否则,对通话数据特征初始分类模型进行模型调整后再次计算拟合度。
[0021]进一步的,所述保留进行模型融合包括:
[0022]对达到要求的通话数据特征初始分类模型基于特征融合法进行融合。
[0023]进一步的,所述对通话数据特征初始分类模型进行模型调整包括:
[0024]根据通话数据特征初始分类模型的拟合度选择机器学习算法。
[0025]基于同一专利技术构思,本专利技术还提供了一种基于大数据分析的骚扰电话检测系统,包括:
[0026]获取模块,用于利用通话数据获取通话数据场景特征库;
[0027]检测模块,用于利用所述通话数据场景特征库获取骚扰电话检测结果。
[0028]优选的,所述利用通话数据获取通话数据场景特征库包括:
[0029]对通话数据进行预处理获取通话数据场景初始特征;
[0030]将所述通话数据初始特征带入预先训练的通话数据特征分类模型得到通话数据场景特征库。
[0031]与最接近的现有技术相比,本专利技术具有的有益效果:
[0032]利用通话数据获取通话数据场景特征库;利用所述通话数据场景特征库获取骚扰电话检测结果,针对通话数据的不同特征进行分类,基于机器学习算法并加以改进,提高了分类的准确性与检测速度。
附图说明
[0033]图1是本专利技术提供的一种基于大数据分析的骚扰电话检测方法示意图;
[0034]图2是本专利技术提供的基于大数据分析的骚扰电话检测方法流程图;
[0035]图3是本专利技术提供的一种基于大数据分析的骚扰电话检测系统示意图。
具体实施方式
[0036]下面结合附图对本专利技术的具体实施方式作进一步的详细说明。
[0037]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0038]实施例1:
[0039]本专利技术提供了一种基于大数据分析的骚扰电话检测方法,如图1所示,包括:
[0040]步骤1:利用通话数据获取通话数据场景特征库;
[0041]步骤2:利用所述通话数据场景特征库获取骚扰电话检测结果。
[0042]步骤1具体包括:
[0043]1‑
1:对通话数据进行预处理获取通话数据场景初始特征;
[0044]1‑
2:将所述通话数据初始特征带入预先训练的通话数据特征分类模型得到通话数据场景特征库。
[0045]本实施例中,一种基于大数据分析的骚扰电话检测方法,所述场景特征包括:提取相似特征、各场景特有特征及基本特征,所述相似特征包括:日主叫量、日被叫量、日主叫占比、被叫离散度、漫游占比,所述各场景特有特征包括:同名身份证、同一天同一身份证下存在不同活跃号码、一机多卡、存在同一天一个手机对应不同手机卡的情况,所述基本特征包括呼叫总量、频次、主叫占比、被叫离散度、通话时长,通过多种途径、对来自电信网的用户数据根据诈骗场景等进行诈骗各场景诈骗特征及公共诈骗特征提取,形成初始特征库。所述各场景诈骗特征包括漫游的场景如当天漫游呼叫次数,当天漫游呼叫占比等。所述公共诈骗特征包括主叫占比,被叫离散度,主叫外省次数,主叫外省占比等。各场景诈骗特征及公共诈骗特征区别在于各场景诈骗特征依据场景不同相应指标会有异常。
[0046]步骤1

1具体包括:
[0047]1‑1‑
1:利用数据相识度与非骚扰电话数据记录去除所述通话数据中正常通话数据,得到所述通化数据场景初始特征。
[0048]步骤1

2具体包括:
[0049]1‑2‑
1:利用通话数据的通话呼叫数据获取通话数据分类特征,利用通话数据的通话身份数据获取通话数据特有特征,利用通话数据的通话基础数据获取通话数据基础特征;
[0050]1‑2‑
2:利用所述通话数据分类特征、通话数据特有特征与通话数据基础特征划分建立通话数据训练集与通话数据验证集;
[0051]1‑2‑
3:以所述通话数据训练集为输入,以通话数据对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据分析的骚扰电话检测方法,其特征在于,包括:利用通话数据获取通话数据场景特征库;利用所述通话数据场景特征库获取骚扰电话检测结果。2.如权利要求1所述方法,其特征在于,所述利用通话数据获取通话数据场景特征库包括:对通话数据进行预处理获取通话数据场景初始特征;将所述通话数据初始特征带入预先训练的通话数据特征分类模型得到通话数据场景特征库。3.如权利要求2所述方法,其特征在于,所述对通话数据进行预处理获取通话数据场景初始特征包括:利用数据相识度与非骚扰电话数据记录去除所述通话数据中正常通话数据,得到所述通化数据场景初始特征。4.如权利要求2所述方法,其特征在于,所述通话数据特征分类模型的训练包括:利用通话数据的通话呼叫数据获取通话数据分类特征,利用通话数据的通话身份数据获取通话数据特有特征,利用通话数据的通话基础数据获取通话数据基础特征;利用所述通话数据分类特征、通话数据特有特征与通话数据基础特征划分建立通话数据训练集与通话数据验证集;以所述通话数据训练集为输入,以通话数据对应的特征类型为输出,基于机器学习算法对模型进行训练;利用所述通话数据验证集进行验证,得到通话数据特征初始分类模型;根据所述通话数据特征初始分类模型的拟合度获取通话数据特征分类模型。5.如权利要求4所述方法,其特征在于,所述利...

【专利技术属性】
技术研发人员:吴冠标胡文波李新毛海翔齐帅许高尚
申请(专利权)人:天津市国瑞数码安全系统股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1