一种网络诈骗号码检测方法、系统、存储介质及终端设备技术方案

技术编号：30641480 阅读：23 留言：0更新日期：2021-11-04 00:39

本申请涉及一种网络诈骗号码检测方法，所述方法包括：首先针对信息诈骗行为设计相应特征并对用户行为日志进行特征提取，以构建原始特征矩阵并进行数据预处理；然后根据数据预处理后原始特征矩阵中正常用户与风险用户比例的不平衡度，采用自调节过采样算法进行少数类样本过采样，重构训练集；接着通过XGBoost模型进行预训练及特征重要性评估和特征筛选；然后对重构后的特征矩阵使用XGBoost和LightGBM模型进行模型训练；最后通过Stacking多模型融合方式提高模型性能，得到二层模型Logistic，完成移动网络风险用户识别模型。本发明专利技术能够提高对网络通信中诈骗号码识别的准确度及鲁棒性，满足了实际应用需求。满足了实际应用需求。满足了实际应用需求。

全部详细技术资料下载

【技术实现步骤摘要】
一种网络诈骗号码检测方法、系统、存储介质及终端设备

[0001]本申请涉及机器学习和网络安全领域，特别是涉及一种网络诈骗号码检测方法、系统、存储介质及终端设备。

技术介绍

[0002]随着信息技术及通信技术的不断发展，信息通信诈骗等网络风险行为越来越频繁，技术也越来越先进且多样性，严重影响人们生活和工作。利用大数据，人工智能实现诈骗号码的识别是提升防范打击通信诈骗技术能力的重要方向。
[0003]目前，对诈骗号码的的检测，通常是基于特定的约束条件约束，或者采用随机森林算法进行的。然而，基于规则的检测方法不利于诈骗行为变化多端的情况，且基于人工设计特定的规则，不够灵活，效果比较有限；随机森林算法其预测准确度较低，因此在对于诈骗风险用户的检出率也相对较低。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够提高对网络通信中诈骗号码识别的准确度及鲁棒性的网络诈骗号码检测方法、系统、存储介质及终端设备。
[0005]本专利技术实施例提供了一种网络诈骗号码检测方法，所述方法包括以下步骤：
[0006]通过自调节过采样算法进行少数类样本的过采样，并将过采样得到的过采样矩阵与特征工程矩阵融合后得到训练特征矩阵；
[0007]通过所述训练特征矩阵分别对XGBoost模型和LightGBM模型进行训练；
[0008]将所述XGBoost模型和LightGBM模型的预测结果通过Stacking的方式进行模型融合，以得到Logistic模型；
[0009]...

【技术保护点】

【技术特征摘要】
1.一种网络诈骗号码检测方法，其特征在于，所述方法包括以下步骤：通过自调节过采样算法进行少数类样本的过采样，并将过采样得到的过采样矩阵与特征工程矩阵融合后得到训练特征矩阵；通过所述训练特征矩阵分别对XGBoost模型和LightGBM模型进行训练；将所述XGBoost模型和LightGBM模型的预测结果通过Stacking的方式进行模型融合，以得到Logistic模型；通过所述Logistic模型对通信过程中的网络风险用户进行识别。2.根据权利要求1所述的网络诈骗号码检测方法，其特征在于，所述特征工程矩阵的获取方法包括：对实际数据集中通信网络用户的原始数据进行特征提取，并根据提取到的特征数据构建原始特征矩阵；对所述原始特征矩阵进行特征工程处理，以得到特征工程矩阵。3.根据权利要求2所述的网络诈骗号码检测方法，其特征在于，对实际数据集中通信网络用户的原始数据进行特征提取，并根据提取到的特征数据构建原始特征矩阵的方法包括：对通信网络用户的通话日志、短信日志和网络原始日志进行特征提取；将提取到的所述通话日志、短信日志和网络原始日志的特征信息与用户基础数据进行合并，以得到原始特征矩阵。4.根据权利要求2所述的网络诈骗号码检测方法，其特征在于，对所述原始特征矩阵进行特征工程处理，以得到特征工程矩阵的方法包括：统计所述原始特征矩阵中正常用户群体和诈骗用户群体的特征维度信息；通过可视化工具获取正常用户群体和诈骗用户群体差异度大于目标值的多个特征；计算各个特征维度在原始特征矩阵的方差，根据方差选择法提取出方差大于阈值的特征，并删除正常用户和诈骗用户群体差异度小于目标值的特征，从而得到特征工程矩阵。5.根据权利要求4所述的网络诈骗号码检测方法，其特征在于，通过自调节过采样算法进行少数类样本的过采样，并将过采样得到的过采样矩阵与特征工程矩阵融合后得到训练特征矩阵的方法包括：根据距离度量计算每个少数类样本的K近邻样本；其中，K为计算近邻样本的个数；根据同类系数模型计算每个少数类样本K近邻样本的同类系数C，并筛选出C>C_method的少数类样本作为采样少数样本；其中，C_method为同类系数阈值；所述采样少数样本与其对应的近邻少数类样本通过随机样本生成模型得到过采样数据集，过采样数据集结合分类器模型采用“嵌入法”进行样本筛选，得到...

【专利技术属性】
技术研发人员：杨伟志，衣杨，赵小蕾，张海，曾青青，刘少江，黎丹雨，王玉娟，
申请(专利权)人：中山大学新华学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人