基于用户数据的资费套餐贬损用户预测方法技术

技术编号:32191744 阅读:21 留言:0更新日期:2022-02-08 15:56
本发明专利技术涉及一种基于用户数据的资费套餐贬损用户预测方法,具体包括以下步骤:S1数据采集:从用户数据中,提取出与用户个体行为特征相关的指标;S2数据清洗与样本划分;S3贬损用户预测模型的训练与测试:使用测试集样本数据验证该贬损用户预测模型的效果,同时保存特征筛选后的结果;S4贬损用户归因分析模型训练:S5预测全量用户:将全量用户数据输入贬损用户预测模型,得到潜在的贬损用户。从海量数据中分析用户个体消费行为特征,通过用户的多维度特征高效且低成本的挖掘出潜在的贬损用户,从而针对性的改善用户感知,提升运营商的品牌形象。品牌形象。品牌形象。

【技术实现步骤摘要】
基于用户数据的资费套餐贬损用户预测方法


[0001]本专利技术涉及通信数据处理
,尤其涉及一种基于用户数据的资费套餐贬损用户预测方法。

技术介绍

[0002]随着我国通信市场个人用户趋于饱和,三大运营商均面临着用户难以增长的问题,竞争便从增量市场转到了存量市场,如4G用户向5G转化,语音用户向宽带用户转化等。
[0003]在如此激烈的竞争背景下,保证存量用户使用体验、减少用户流失,成为电信运营商保持用户和收入增长的重要手段。因此就需要电信运营商加强对贬损用户的维护与挽留,改善贬损用户的质差体验,从而提升品牌形象,保证收入增长。
[0004]“贬损用户”指对品牌、产品或服务不满意的人,且此类用户不愿意向别人推荐该公司的产品或服务,从而使企业的销售额和利润下降、品牌形象受损、让竞争对手获利。由此可见,及时发现贬损用户对企业至关重要。
[0005]在中国专利文献CN111311338A,公开了一种用户价值的预测方法以及用户价值预测模型的训练方法,一种用户价值的预测方法以及用户价值预测模型的训练方法,预测方法包括:获取待预测用户在新增期的行为特征数据;将行为特征数据作为多类预测模型的输入,获得多类预测模型的价值预测结果;将多类预测模型的价值预测结果作为分类模型的输入,获得分类模型输出的待预测用户的未来价值。在用户成为高价值用户之前可以及时挖掘出潜在的高价值用户,提高了用户价值预测的准确性和及时性。
[0006]但是上述技术方案的对于运营商在资费服务方面的贬损用户,没有提供具体的方案进行高效寻找出来,有必要在这方面提供一个新的方案。

技术实现思路

[0007]本专利技术要解决的技术问题是,提供一种基于用户数据的资费套餐贬损用户预测方法,能够通过大数据建模,高效寻找出运营商在资费服务方面的贬损用户。
[0008]为了解决上述技术问题,本专利技术采用的技术方案是:该基于用户数据的资费套餐贬损用户预测方法,具体包括以下步骤:
[0009]S1数据采集:从用户数据中,提取出与用户个体行为特征相关的指标;
[0010]S2数据清洗与样本划分:对所述步骤S1中采集的用户数据进行清洗,将清洗后的样本数据划分为贬损用户预测模型的训练集与测试集;
[0011]S3贬损用户预测模型的训练与测试:采用所述步骤S2中得到的训练集样本数据训练一个贬损用户预测模型,并使用所述步骤S2中得到的测试集样本数据验证该贬损用户预测模型的效果,同时保存特征筛选后的结果;
[0012]S4贬损用户归因分析模型训练:将所述步骤S3中保存的特征筛选后的结果作为归因因子,使用逻辑回归算法训练一个分类模型,并从提取出的逻辑回归模型系数中寻找每个潜在贬损用户的贬损原因;
[0013]以往对贬损用户的处理手段是以被动解决投诉用户的诉求为主,辅助手段也仅仅是通过人工经验对个别指标进行潜在贬损用户的判断,上述步骤变被动为主动,使用机器学习算法寻找贬损原因,并进行预测全量用户的潜在贬损概率;此处的逻辑回归算法属于现有的,逻辑回归算法logistic起源于对人口数量增长情况的研究,最重要的工作是PierreVerhulst在1838年提出了对人口增长的公式描述。在1958年David Cox在The regression analysis of binary sequences中提出了logistic regression,既逻辑回归;
[0014]S5预测全量用户:将全量用户数据输入贬损用户预测模型,得到潜在的贬损用户。
[0015]采用本专利技术的基于用户数据的资费套餐贬损用户预测方法,从海量数据中分析用户个体消费行为特征,通过用户的多维度特征高效且低成本的挖掘出潜在的贬损用户,从而针对性的改善用户感知,提升运营商的品牌形象。
[0016]从海量用户数据中,快速聚焦潜在资费贬损用户,从预测出的潜在资费贬损用户中随机抽取验证,贬损率是全量随机用户贬损率的2.58倍,效果显著;同时针对性地锁定可能造成该潜在资费贬损用户体验较差的原因,为电信运营商改进服务质量、提升品牌形象等工作提供了参考依据,助推电信运营商工作的降本增效。
[0017]优选的,在所述步骤S3中,所述训练集样本数据使用历史用户调研数据作为正负样本,通过电话外呼方式开展客户资费服务调研,评分0

10分,10分表示非常满意,0分表示非常不满,9

10分为推荐者,7

8分为中立者,0

6分为贬损者。
[0018]优选的,在所述步骤S1中,用户数据中与用户个体行为特征相关的指标包括有基础信息、终端信息、投诉信息、五网属性、宽带信息、电视信息、套餐信息、消费行为、营销案信息和掌厅使用信息;
[0019]其中,基础信息包括年龄、性别、入网时长、用户星级等指标;终端信息包括是否合约机、和是否4/5G终端;投诉信息包括是否历史投诉用户和当月投诉次数;五网属性包括是否集团网/家庭网用户;宽带信息包括是否宽带用户和宽带带宽;电视信息包括是否互联网电视用户和电视观看时长;套餐信息包括流量主体套餐名称和套餐费用;消费行为包括当月通话分钟数、当月流量使用数和当月短信条数;营销案信息包括营销案个数和营销案到期月份;掌厅使用信息包括掌厅登录天数和掌厅套餐业务接触次数。
[0020]优选的,在所述步骤S2中,样本数据的进行清洗包括缺失值填充、错误数据修改、字符串型特征转换、多类别型特征嵌入和套餐价格提取;
[0021]其中,套餐价格提取为基于流量套餐名称、语音套餐名称、其他套餐名称的文本信息中匹配出价格信息。
[0022]优选的,在所述步骤S3中,对训练集中的样本数据进行特征扩维、特征分箱、数据归一化和特征筛选;
[0023]特征扩维是对样本数据的特征进行扩维,包括计算流量套餐饱和度、超流量套餐流量数、超流量套餐费用、语音套餐饱和度、超语音套餐分钟数和超语音套餐费用;
[0024]特征分箱是将连续型特征进行离散化的处理,将分箱结果的数据特征与样本数据的特征均保留,同时放入贬损用户预测模型进行特征筛选;
[0025]数据归一化是对训练集中的样本数据连续型特征进行了标准化处理,将训练集的均值和方差当做是总体的均值和方差,样本x的标准分数计算如下:
[0026]z=(x

u)/s;
[0027]其中u是训练样本的均值,s是训练样本的标准偏差;
[0028]特征筛选是采用Boosting算法对样本数据的特征重要性排序进行特征筛选,某个特征的重要性就是它在所有树中出现的次数之和,在特征重要性排序后,保留了前100个特征进入贬损用户预测模型。
[0029]在对潜在贬损用户进行预测时,将特征分箱的特征筛选结果保留,并作为贬损用户归因分析的输入从而增加贬损归因的准确性与可解释性;此处的Boosting算法属于现有的,Boosting算法有许多种具体算法,包括但不限于AdaBoosting。1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用户数据的资费套餐贬损用户预测方法,其特征在于,具体包括以下步骤:S1数据采集:从用户数据中,提取出与用户个体行为特征相关的指标;S2数据清洗与样本划分:对所述步骤S1中采集的用户数据进行清洗,将清洗后的样本数据划分为贬损用户预测模型的训练集与测试集;S3贬损用户预测模型的训练与测试:采用所述步骤S2中得到的训练集样本数据训练一个贬损用户预测模型,并使用所述步骤S2中得到的测试集样本数据验证该贬损用户预测模型的效果,同时保存特征筛选后的结果;S4贬损用户归因分析模型训练:将所述步骤S3中保存的特征筛选后的结果作为归因因子,使用逻辑回归算法训练一个分类模型,并从提取出的逻辑回归模型系数中寻找每个潜在贬损用户的贬损原因;S5预测全量用户:将全量用户数据输入贬损用户预测模型,得到潜在的贬损用户。2.根据权利要求1所述的基于用户数据的资费套餐贬损用户预测方法,其特征在于,在所述步骤S3中,所述训练集样本数据使用历史用户调研数据作为正负样本,通过电话外呼方式开展客户资费服务调研,评分0

10分,10分表示非常满意,0分表示非常不满,9

10分为推荐者,7

8分为中立者,0

6分为贬损者。3.根据权利要求1所述的基于用户数据的资费套餐贬损用户预测方法,其特征在于,在所述步骤S1中,用户数据中与用户个体行为特征相关的指标包括有基础信息、终端信息、投诉信息、五网属性、宽带信息、电视信息、套餐信息、消费行为、营销案信息和掌厅使用信息;其中,基础信息包括年龄、性别、入网时长、用户星级等指标;终端信息包括是否合约机、和是否4/5G终端;投诉信息包括是否历史投诉用户和当月投诉次数;五网属性包括是否集团网/家庭网用户;宽带信息包括是否宽带用户和宽带带宽;电视信息包括是否互联网电视用户和电视观看时长;套餐信息包括流量主体套餐名称和套餐费用;消费行为包括当月通话分钟数、当月流量使用数和当月短信条数;营销案信息包括营销案个数和营销案到期月份;掌厅使用信息包括掌厅登录天数和掌厅套餐...

【专利技术属性】
技术研发人员:陈大龙郭柏龙唐大鹏张冬冬
申请(专利权)人:南京华苏科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1