一种家用宽带潜在投诉用户预测方法及预测系统技术方案

技术编号:39299293 阅读:13 留言:0更新日期:2023-11-07 11:08
本发明专利技术实施例公开了一种家用宽带潜在投诉用户预测方法及预测系统。基于家用宽带批量数据以及居家特征数据构建特征池并获得训练样本集;将训练样本集输入基于随机森林算法构建的投诉预测模型进行训练得到训练完成的投诉预测模型;最后利用训练完成的投诉预测模型确定所述潜在投诉用户的投诉预测结果。避免了当用户不在家时,即便设备出现故障和性能问题,也不会产生投诉行为导致的分析误判。在保证预测精度前提下减低数据采集工作,提升算法效率的同时,发现网络设备的不足之处,进行相对应的提升,降低被投诉的风险。同时构建特征池,通过不断地迭代,进一步提升预测的准确性。进一步提升预测的准确性。进一步提升预测的准确性。

【技术实现步骤摘要】
一种家用宽带潜在投诉用户预测方法及预测系统


[0001]本专利技术涉及家用宽带运维领域,尤其涉及一种家用宽带潜在投诉用户预测方法及预测系统。

技术介绍

[0002]目前家用宽带故障处理都是被动救火处理问题,无法满足日益增加的用户满意度需求,亟需建立基于AI能力的潜在投诉用户预测能力,精准识别潜在网络质差问题,先于用户发现问题,从

看急诊

逐步向

治未病

转变,提高动态监测,实时预警能力,推进风险防控,成为提升网络质量的驱动力。
[0003]现有技术中,宽带用户投诉预测采用的技术方案一般基于投诉定界,使用故障类数据和性能类数据,从而区分设备故障类投诉和质差类投诉,根据对宽带网络系统中的目标设备的投诉,确定所述目标设备存在投诉故障,则将与所述目标设备关联的第一用户作为第一潜在投诉用户;根据第二用户使用宽带网络系统上网时的网络质量指标,确定第二用户是否为第二潜在投诉用户;将第一潜在投诉用户和第二潜在投诉用户进行融合,获取最终的潜在投诉用户。
[0004]现有技术中,宽带用户投诉预测采用的技术方案还包括,在预测流程上,通过采集家用宽带批量数据,进行数据预处理,通过异常点检测和逻辑回归、Arima等算法进行建模并进行模型评价;其中,所述异常点检测算法通常采用单特征高斯分布计算和孤立森林算法,单特征高斯分布计算包括:计算历史数据均值,计算历史数据方差以及计算标准差,如果新数据不在均值正负2个标准差之内,则标记为告警数据;基于告警数据进行模型训练实现投诉预测,从而提前解决问题,实现投诉预测及预防,降低投诉比例。
[0005]以上两种技术方案中,起到最主要的投诉影响的因素是:设备故障,如家庭网关故障、家庭Wifi路由器故障、严重弱光类引起的故障和断纤类故障,这些故障对用户的影响严重,造成大量用户投诉。设备运行质量,如网关的CPU利用率和内存占用率、Wifi弱覆盖、Wifi强干扰等指标,当CPU高利用率的时长占比超过60%时,会严重影响用户的上网质量,当Wifi弱覆盖占比大于60%时,会影响用户上网质量,若Wifi信号小于

85dBm的持续时间较长,则会导致Wifi路由器吊死或用户上不了网。所以对故障类投诉相关的设备运行指标和网络质量差类投诉相关的网络质量指标进行数据预处理,通过异常点检测和逻辑回归、Arima算法建立预测模型,实现投诉预测及预防,降低投诉比例。
[0006]针对当前家用宽带用户投诉预测的场景中,以上技术方案都存在着不足,当前模型主要考虑设备故障类和性能类问题对用户感知的影响引起的投诉。存在没有考虑的影响因素,例如:时间因素,在节假日期间(法定假日+周末)和忙时(18:00

22:00)等;用户偏好因素,流量分布情况等。影响投诉预测准确性。另外,家客用户投诉预测主要使用场景是让在线公司或代维人员针对预测出的潜在投诉用户清单进行主动关怀,实现投诉压降及用户上网满意度提升。现有预测方法采用分类模型,输出为投诉清单,而通常各省家客用户数都在千万级别,预测的潜在投诉清单也相对规模较大,同时由于预测准确率无法达到100%,
对所有清单人员进行关怀会造成极大的资源浪费。
[0007]综上所述,当前模型主要根据设备故障和性能数据进行预测,未考虑到用户不在家时便无法感知设备故障或劣化这一可能事实,由此会产生误判。因此,如何提高用户投诉预测的准确性以及降低用户关怀成本成为亟待解决的技术问题。

技术实现思路

[0008]针对现有技术中存在的家用宽带潜在投诉用户预测准确性差,用户关怀成本高的问题,本专利技术实施例提供了一种家用宽带潜在投诉用户预测方法及预测系统。
[0009]第一方面,本专利技术提供了一种家用宽带潜在投诉用户预测方法,包括:
[0010]基于第一识别特征、第二识别特征以及第三识别特征中任两项特征,确定所述潜在投诉用户的居家特征数据;其中,所述第一识别特征通过软探针网关对所述用户的网关数据进行识别确定;所述第二识别特征通过对所述用户的话单数据进行识别确定、所述第三识别特征通过对所述用户的信令数据进行识别确定;
[0011]利用数据采集模块获得所述用户的宽带批量数据,基于所述家用宽带批量数据以及居家特征数据构建第一特征池,并利用随机森林算法对所述特征池进行筛选确定第二特征池;
[0012]基于第二特征池获得预测集,将所述预测集输入基于随机森林算法构建的家用宽带潜在投诉用户预测模型,确定所述潜在投诉用户的投诉预测结果。
[0013]另一方面,本专利技术实施例提供了一种家用宽带潜在投诉用户预测模型训练方法,包括:
[0014]基于第一识别特征、第二识别特征以及第三识别特征中任两项特征,确定所述潜在投诉用户的居家特征数据;其中,所述第一识别特征通过软探针网关对所述用户的网关数据进行识别确定;所述第二识别特征通过对所述用户的AAA话单数据进行识别确定、所述第三识别特征通过对所述用户的S1

MME移网信令数据进行识别确定;
[0015]利用数据采集模块获得所述用户的宽带批量数据,基于所述家用宽带批量数据以及居家特征数据构建第一特征池,并利用随机森林算法对所述特征池进行筛选确定第二特征池;
[0016]基于第二特征池中的K个特征构建N棵决策树,基于训练集获得N个训练样本集;
[0017]利用N个训练样本集对N棵决策树进行训练的到训练完成的用户预测模型;
[0018]其中,每个训练样本集中包括M个维度;用户预测模型中的N棵决策树输出N个预测值,对所述N个预测值进行平均值计算确定所述潜在投诉用户的投诉预测结果。
[0019]另一方面,本专利技术实施例提供了一种家用宽带潜在投诉用户预测系统,应用于权利要求上述方法,其特征在于,包括:
[0020]数据采集模块,所述数据采集模块用于获得宽带批量数据,所述用户的网关数据、话单数据以及信令数据;
[0021]特征识别模块,所述特征识别模块基于第一识别特征、第二识别特征以及第三识别特征确定所述潜在投诉用户的居家特征数据;其中,所述第一识别特征通过软探针网关对所述用户的网关数据进行识别确定;所述第二识别特征通过对所述用户的话单数据进行识别确定、所述第三识别特征通过对所述用户的信令数据进行识别确定;
[0022]特征池构建模块,所述特征池构建模块基于所述家用宽带批量数据以及居家特征数据构建第一特征池,并利用随机森林算法对所述特征池进行筛选确定第二特征池;其中,第一特征池原始特征池,第二特征池为筛选后的特征池;
[0023]预测模块,所述预测模块基于第二特征池获得训练集,将所述训练集输入基于随机森林算法构建的投诉预测模型进行训练得到训练完成的投诉预测模型;利用训练完成的投诉预测模型确定所述潜在投诉用户的投诉预测结果。
[0024]相较于现有技术,本专利技术实施例公开了一种家用宽带潜在投诉用户预测方法及预测系统。基于家用宽带批量数据以及居家特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种家用宽带潜在投诉用户预测方法,其特征在于,包括:基于第一识别特征、第二识别特征以及第三识别特征中任两项特征,确定所述潜在投诉用户的居家特征数据;其中,所述第一识别特征通过软探针网关对所述用户的网关数据进行识别确定;所述第二识别特征通过对所述用户的话单数据进行识别确定、所述第三识别特征通过对所述用户的信令数据进行识别确定;利用数据采集模块获得所述用户的宽带批量数据,基于所述家用宽带批量数据以及居家特征数据构建第一特征池,并利用随机森林算法对所述特征池进行筛选确定第二特征池;基于第二特征池获得预测集,将所述预测集输入基于随机森林算法构建的家用宽带潜在投诉用户预测模型,确定所述潜在投诉用户的投诉预测结果。2.根据权利要求1所述的家用宽带潜在投诉用户预测方法,其特征在于,所述第一识别特征的确定方法,包括:利用软探针网关按预设周期采集所述用户的下挂设备的原始数据信息并进行筛选,获得所述用户的手机设备信息;基于预设时间的手机设备信息构建所述用户的手机设备池;对预设周期或多个预设周期的所述用户的手机设备信息以及所述用户的手机设备池中的手机设备信息进行识别确定所述用户的第一识别特征。3.根据权利要求1所述的家用宽带潜在投诉用户预测方法,其特征在于,所述第二识别特征的确定方法,包括:获得所述用户的话单数据;按照预设阈值对所述所述用户的话单数据进行识别确定所述用户的第二识别特征;其中,所述话单数据包括所述用户的实时流量使用统计信息。4.根据权利要求1所述的家用宽带潜在投诉用户预测方法,其特征在于,所述第三识别特征的确定方法,包括:获得所述用户的移网信令数据;所述用户的移网信令数据包括所述用户所在小区的实时信息;采用多次重合判定的方式,对所述用户所在小区的实时信息以及所述用户的开户地址进行识别确定所述用户的第三识别特征。5.根据权利要求1所述的家用宽带潜在投诉用户预测方法,其特征在于:所述居家特征数据包括在家或不在家两种状态;若第一识别特征、第二识别特征以及第三识别特征中任二项所述特征满足在家状态,则确定居家特征数据为在家;若第一识别特征、第二识别特征以及第三识别特征中任二项所述特征不满足在家状态,则确定居家特征数据为不在家。6.根据权利要求1所述的家用宽带潜在投诉用户预测方法,其特征在于,所述宽带批量数据包括所述用户的用户感知数据、用户属性数据以及用户偏好数据;其中,用户感知数据包括设备故障信息、性能指标信息;用户属性数据包括用户是否开通互联网电视、宽带使用天数、路由器型号、用户宽带类型、用户宽带资源类型、宽带套餐类型、宽带套餐、超套餐流量费、是否家为家用宽带用户,
是否位于农村的属性信息;用户偏好数据包括用户宽带日均使用流量、流量分布、活跃度、投诉次数、越级投诉次数、观看篮球直播时长、观看足球直播时长用户的偏好信息。7.根据权利要求6所述的家用宽带潜在投诉用户预测方法,其特征在于,所述用户感知数据的预处理方法包括:根据设备拓扑关联关系将所述用户感知数据中的设备信息映射到该用户的家庭宽带账户;将所述家庭宽带账...

【专利技术属性】
技术研发人员:肖扬田聊民黄淙
申请(专利权)人:杭州东方通信软件技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1