宽带用户真实性判断模型的训练方法、装置及设备制造方法及图纸

技术编号:33508519 阅读:24 留言:0更新日期:2022-05-19 01:17
本发明专利技术实施例提供了一种宽带用户真实性判断模型的训练方法、装置及设备,该方法包括:获取多个用户的历史宽带业务数据;采用预设算法处理历史宽带业务数据,以生成多个训练样本数据;对于每个训练样本数据,分别执行以下操作:将训练样本数据输入XGBoost模型,以训练XGBoost模型;在不满足预设训练停止条件的情况下,应用网格搜索GridsearchCV调整XGBoost模型的参数;返回将训练样本数据输入XGBoost模型,直至满足预设训练停止条件,得到宽带用户真实性判断模型;本发明专利技术实施例能够解决现有技术中宽带用户真实性识别效果较差的问题。技术中宽带用户真实性识别效果较差的问题。技术中宽带用户真实性识别效果较差的问题。

【技术实现步骤摘要】
宽带用户真实性判断模型的训练方法、装置及设备


[0001]本专利技术属于宽带业务分析领域,尤其涉及一种宽带用户真实性判断模型的训练方法、装置及设备。

技术介绍

[0002]智慧家庭作为电信运营商争夺的又一新兴市场,其主要入口为家庭宽带业务,家庭宽带市场业务集中、客户群稳定、市场空间大,是各家运营商重点抢夺的目标。为了抢占市场份额、占据家庭宽带市场的主导地位,各大运营商间竞争日益激烈,宽带用户的拉新以及存量用户的保有都发挥着关键作用。
[0003]在宽带业务迅速发展的趋势下,在正常用户中夹杂着很多存在套利动机的异常用户,这对业务发展健康度、营销资源使用率以及公司收入等均造成不良影响,因此精准识别家庭宽带用户中行为异常的虚假用户显得尤为重要。
[0004]但是现有技术中宽带用户真实性识别效果较差。

技术实现思路

[0005]本专利技术实施例提供一种在宽带用户真实性判断模型的训练方法、装置及设备,能够解决现有技术中宽带用户真实性识别效果较差的问题。
[0006]第一方面,本专利技术实施例提供一种宽带用户真实性判本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种宽带用户真实性判断模型的训练方法,其特征在于,包括:获取多个用户的历史宽带业务数据;采用预设算法处理所述历史宽带业务数据,以生成多个训练样本数据;其中,所述训练样本数据包括宽带业务特征数据及其对应的用户标签数据,所述用户标签数据指示出所述宽带业务特征数据对应的用户是否为真实用户;对于每个所述训练样本数据,分别执行以下操作:将所述训练样本数据输入XGBoost模型,以训练所述XGBoost模型,所述XGBoost模型的逻辑回归参数为binary:logitraw;在不满足预设训练停止条件的情况下,应用网格搜索GridsearchCV调整所述XGBoost模型的参数;返回将所述训练样本数据输入XGBoost模型,直至满足预设训练停止条件,得到宽带用户真实性判断模型。2.如权利要求1所述的宽带用户真实性判断模型的训练方法,其特征在于,所述将所述训练样本数据输入XGBoost模型,以训练所述XGBoost模型,包括:针对经所述训练样本数据输入后的所述XGBoost模型的每个回归树叶子节点,分别执行以下操作:分别计算所述叶子节点中每个所述训练样本为分割点时的分数增益;在所述分数增益和原始分数增益中取大值作为目标分数增益;选取最大的所述目标分数增益对应的所述训练样本分裂所述叶子节点;返回分别计算所述叶子节点中每个所述训练样本为分割点时的分数增益,直至所述目标分数增益小于第一预设阈值,得到一个弱学习器。3.如权利要求2所述的宽带用户真实性判断模型的训练方法,所述预设训练停止条件,包括:所述XGBoost模型的残差小于第二预设阈值;或者,所述XGBoost模型回归树的数量等于第三预设阈值。4.如权利要求1所述的宽带用户真实性判断模型的训练方法,其特征在于,当所述历史宽带业务数据中存在异常数据时,所述方法还包括:在所述历史宽带业务数据中存在缺失值的情况下:当所述缺失值占其所在字段超过预设比例时,删除所述缺失值;当所述缺失值占其所在字段不超过预设比例,且所述缺失值为离散型变量时,应用所述缺失值所在字段的众数作为所述缺失值的补充;当所述缺失值占其所在字段不超过预设比例,且所述缺失值为连续型变量时,应用所述缺失值所在字段的均值作为所述缺失值的补充;在所述历史宽带业务数据中存在异常值的情况下:应用四分位数离群检测所述异常值,得到检测结果,删除所述检测结果在预设四分差值区间之外的所述异常值。5.如权利要求1所述的宽带用户真实性判断模型的训练方法,其特征在于,所述XGBoost模型的激活函数为其中a为实数。
6.如权利要求1所述的宽带用户真实性判断模型的训练方法,其特征在于,所述XGBoost模型的目标函数为:其中,q代表当前回归树的叶子节点,T为所述叶子节点的个数,每个所述叶子节点j上的所述训练样本下标的集合为I
j
,I
j
={i|q(x
i

【专利技术属性】
技术研发人员:杨抒怡余晨李冰侯旻杨猛陶涛徐海勇郑巧琼
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1