基于Flink流处理引擎的用户数据处理方法和装置制造方法及图纸

技术编号:33243521 阅读:68 留言:0更新日期:2022-04-27 17:49
本发明专利技术实施例提供了基于Flink流处理引擎的用户数据处理方法和装置,所述方法包括:获取实时用户数据;采用预设Flink流处理引擎中已训练的预测模型对所述实时用户数据进行预测,以判断实时用户数据是否符合离网特征;若是,则采用所述Flink流处理引擎针对所述目标用户数据对应的用户发送服务信息;其中,所述目标用户数据为符合所述离网特征的实时用户数据。本发明专利技术实施例能够实时对用户数据进行预测,以识别出符合离网特征的目标用户数据,并针对目标用户数据对应的用户输出服务信息,提高识别符合离网特征的高危用户的时效性,以及对高危用户发送服务信息的效率。对高危用户发送服务信息的效率。对高危用户发送服务信息的效率。

【技术实现步骤摘要】
基于Flink流处理引擎的用户数据处理方法和装置


[0001]本专利技术涉及计算机
,特别是涉及一种基于Flink流处理引擎的用户数据处理方法和一种基于Flink流处理引擎的用户数据处理装置。

技术介绍

[0002]随着互联网卡用户的日益增多,不可避免的出现离网、携号转网等电信用户流失现象。目前现有技术识别即将离网用户大致分为两类:第一类为通过离线数据的挖掘分析获取离网用户的特征阈值,通过特征阈值判定是否即将离网;第二类为通过离线数据建模的方式预测即将离网用户。以上两种方式均使用离线数据进行挖掘/建模,离线数据往往具有滞后性(按天/按月滞后),这样可能导致部分即将离网用户得不到及时的维系安抚,从而造成部分用户真正流失。

技术实现思路

[0003]鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于Flink流处理引擎的用户数据处理方法和相应的一种基于Flink流处理引擎的用户数据处理装置。
[0004]为了解决上述问题,本专利技术实施例公开了一种基于Flink流处理引擎的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于Flink流处理引擎的用户数据处理方法,其特征在于,包括:获取实时用户数据;采用预设Flink流处理引擎中已训练的预测模型对所述实时用户数据进行预测,以判断实时用户数据是否符合离网特征;若是,则采用所述Flink流处理引擎针对所述目标用户数据对应的用户发送服务信息;其中,所述目标用户数据为符合所述离网特征的实时用户数据。2.根据权利要求1所述的方法,其特征在于,还包括:确定接收所述服务信息的目标用户;获取所述目标用户对应的服务效果数据;采用所述服务效果数据迭代更新所述预测模型。3.根据权利要求1所述的方法,其特征在于,所述已训练的预测模型通过如下方法生成:获取样本用户数据;生成与所述样本用户数据匹配的样本特征数据以及标签数据;将至少部分的所述样本特征数据及其对应的标签数据划分为第一训练集;采用所述第一训练集构建并训练第一随机森林模型,得到预测模型。4.根据权利要求3所述的方法,其特征在于,所述采用至少部分的第一训练集构建并训练随机森林模型,得到预测模型的步骤包括:采用所述第一训练集以及预设的网络搜索算法、K折交叉验证算法,确定第一目标参数;采用所述第一目标参数构建第一随机森林模型;采用所述第一随机森林模型确定所述第一训练集中的冗余特征;剔除所述第一训练集中的冗余特征,得到第二训练集;采用所述第二训练集构建并训练第二随机森林模型,得到预测模型。5.根据权利要求4所述的方法,其特征在于,所述特征数据对应于多个类型的特征;所述采用所述第一随机森林模型确定所述第一训练集中的冗余特征的步骤包括:采用所述第一随机森林模型确定所述第一训练集中各个所...

【专利技术属性】
技术研发人员:张健力兴龙刘健
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1