【技术实现步骤摘要】
宽带流失用户确定方法、装置、电子设备和存储介质
[0001]本申请涉及数据分析
,尤其涉及一种宽带流失用户确定方法、装置、电子设备和存储介质。
技术介绍
[0002]针对宽带用户流失的问题,相关技术中通常会进行提前预警,在进行提前预警时通常采用的技术手段是数据统计分析技术,即:采集用户消费、宽带用户登录次数、上网时长、使用流量等指标,对指标进行统计、分析和监控,预测用户是否有流失倾向,以判断是否需要采取相关措施挽留客户。
[0003]但是,在相关技术中采用的流失预警方法,存在以下问题:数据统计分析方法需要对用户的指标进行先统计再分析,两个计算步骤使得计算速度降低,进而使得对宽带用户预测时长较长,导致预测效率低下。
技术实现思路
[0004]本申请的目的是提供一种宽带流失用户确定方法、装置、电子设备和存储介质,通过预警模型来预测流失用户,提高预测的效率,缩短对宽带用户预测的时长。
[0005]第一方面,本申请实施例提供了一种宽带流失用户确定方法,所述方法包括:
[0006]从数据库 ...
【技术保护点】
【技术特征摘要】
1.一种宽带流失用户确定方法,其特征在于,所述方法包括:从数据库中提取与宽带用户关联的多种指标;其中,所述多种指标表征所述宽带用户在网络中的活跃程度;将所述多种指标输入预警模型中,以根据每个指标对应的权重对所述宽带用户进行流失概率预测;其中,所述预警模型是基于正样本和负样本得到,所述正样本包括与活跃用户关联的多种指标,所述负样本包括与不活跃用于关联的多种指标;若所述宽带用户的流失概率大于预设值,则确定所述宽带用户为宽带流失用户,其中所述宽带流失用户为在预设时间内离网的宽带用户。2.根据权利要求1所述的方法,其特征在于,所述预警模型是根据以下方法得到的:基于所述正样本和所述负样本,对预警模型进行多轮训练,直到所述预警模型输出的宽带用户的流失概率与所述正样本和负样本中的宽带用户的流失概率之间的误差在预设误差范围内;其中,每轮训练过程包括下列步骤:将第一样本输入所述预警模型,以第一样本中的宽带用户的流失概率值为期望输出训练所述预警模型,获取所述预警模型输出的所述第一样本中的宽带用户的流失概率;根据所述预警模型输出的所述第一样本中的宽带用户的流失概率和所述第一样本中的宽带用户的流失概率值确定第一损失值;将第二样本输入所述预警模型,以第二样本中的宽带用户的流失概率值为期望输出训练所述预警模型,获取所述预警模型输出的所述第二样本中的宽带用户的流失概率;根据所述预警模型输出的所述第二样本中的宽带用户的流失概率和所述第二样本中的宽带用户的流失概率值确定第二损失值;基于所述第一损失值和所述第二损失值对所述预警模型进行参数调整;其中,若所述第一样本为正样本,则所述第二样本为负样本;若所述第二样本为正样本,则所述第一样本为负样本。3.根据权利要求2所述的方法,其特征在于,所述基于所述正样本和所述负样本,对预警模型进行多轮训练之前,所述方法还包括:构建第一指标集合和第二指标集合;其中,所述第一指标集合由与活跃用户关联的多种指标中的指定指标和所述指定指标的量化值构成,所述第二指标集合由与不活跃用户关联的多种指标中的指定指标和所述指定指标的量化值构成;对所述第一指标集合中的量化值中的第一异常值和所述第二指标集合中的量化值中的第二异常值进行纠正处理;其中,所述第一异常值为所述第一指标集合中大于第一上限值或小于第一下限值的量化值;所述第二异常值为第二指标集合中大于第二上限值或小于第二下限值的量化值。4.根据权利要求3所述的方法,其特征在于,所述构建第一指标集合和第二指标集合之后,所述方法还包括:若确定所述第一指标集合中存在没有对应量化值的指标,则将第一预设值作为所述没有量化值的指标对应的量化值进行填充;若确定所述第二指标集合中存在没有对应量化值的指标,则采用第二预设值作为所述没有量化值的指标对应的量化值。
5.根据权利要求3所述的方法,其特征在于,所述第一异常值是根据以下方法确定的:将所述第一指标集合中的指标按照对应的量化值的大小进行排序,得到第一量化值序列,并确定所述第一量化值序列的第一上限值和第一下限值;将大于第一上限值的量化值或小于第一下限值的量化值作为第一异常值;所述第二异常值是根据以下方法确定的:将所述第二指标集合中的指标按照对应的量化值的大小进行排序,得到第二量化值序列;并确定所述第二量化值序列的第二上限值和第二下限值;将大于第二上...
【专利技术属性】
技术研发人员:张婉璐,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。