【技术实现步骤摘要】
用户流失预测模型的构建方法、用户流失预测方法及装置
[0001]本专利技术涉及通信用户流失预测
,尤其涉及一种用户流失预测模型的构建方法、用户流失预测方法及装置。
技术介绍
[0002]通信行业在现代社会中扮演着重要的角色,为用户提供通信、互联网接入和移动应用等服务。在通信行业中,用户流失是一个重要的问题。流失用户对通信厂家而言意味着损失和市场份额的减少。因此,准确预测用户流失情况对于通信厂家来说具有重要的商业意义。过去,通信用户流失预测主要基于统计方法和传统机器学习算法,如逻辑回归、决策树等。然而,这些方法在处理复杂的用户行为和服务数据时存在一些限制。例如,传统方法难以处理数据不平衡和样本不足问题,无法充分利用时间序列数据中的动态变化信息。此外,它们也可能无法处理高维度的特征和复杂的关联关系。
[0003]随着深度学习和人工智能的发展,基于神经网络的方法在预测和分类任务中取得了显著的成果。特别是长短期记忆网络(LSTM),作为一种递归神经网络(RNN)的变体,具备记忆能力和对序列信息的建模能力,适用于处理时间 ...
【技术保护点】
【技术特征摘要】
1.一种用户流失预测模型的构建方法,其特征在于,所述方法包括:获取训练数据集,其中,所述训练数据集的每个训练数据包括一个用户的用户信息、历史行为数据和该用户的流失标签,所述流失标签用于表征该用户是否为流失用户;使用预先构建的LSTM网络模型对所述训练数据集的训练数据进行特征提取,以提取所述训练数据对应的目标特征向量,其中,所述目标特征向量包括时间序列的动态信息;将所述目标特征向量和所述目标特征向量对应的所述训练数据的用户标签输入至预先设置的分类器中,以对所述分类器进行分类训练,并将分类训练的结果满足预设条件时的分类器确定为用户流失预测模型;其中,所述用户流失预测模型用于对用户待测数据进行流失预测。2.根据权利要求1所述的方法,其特征在于,所述用户信息包括所述用户的个人信息和服务信息;所述方法还包括:获取预设信息数据库中的用户数据,其中,所述用户数据包括多个用户的用户信息和该用户对应的历史行为数据;基于所述用户数据构建数据集表格,其中,所述数据集表格的每一行代表一个所述用户数据,每一列代表一个属性,以及该属性对应的数据特征;按照每个用户的流失信息生成该用户的流失标签,并使用所述流失标签对每个所述用户数据进行标注;对所述流失标签表征为流失用户对应的用户数据进行数据扩充;基于扩充后的流失用户的用户数据,和所述流失标签表征为非流失用户对应的用户数据构建所述训练数据集。3.根据权利要求2所述的方法,其特征在于,对所述流失标签表征为流失用户对应的用户数据进行数据扩充的步骤,包括:将流失标签表征为流失用户对应的用户数据输入至预先设置的生成对抗网络中,通过所述生成对抗网络的生成对抗函数生成初始生成样本;所述生成对抗网络包括生成器和判别器,所述生成对抗函数中包括正则化项,所述正则化项根据所述生成器的参数和所述判别器的参数确定;根据所述初始生成样本,以及所述初始生成样本对应的均值和方差,确定自适应增强因子;基于所述自适应增强因子对所述生成器的参数和所述判别器的参数进行调整,执行将流失标签表征为流失用户对应的用户数据输入至预先设置的生成对抗网络中,通过所述生成对抗网络的生成对抗函数生成初始生成样本的步骤,更新所述初始生成样本;直到生成的所述初始生成样本满足预设的生成要求时,将所述初始生成样本确定为所述用户数据对应的扩充样本,以确定扩充后的流失用户的用户数据。4.根据权利要求1所述的方法,其特征在于,所述训练数据集的每个训练数据包括多个数据特征;使用预先构建的LSTM网络模型对所述训练数据集的训练数据进行特征提取,以提取所述训练数据对应的目标特征向量的步骤,包括:从所述训练数据集的多个所述数据特征中选择预设数量的特征,得到特征集;
根据所述特征集中的每个所述特征对应的预测准确率,和预先设置的权重参数,对所述特征集进行特征选择,确定所述特征集中的目标特征;通过预先设置的递归神经网络,对所述目标特征进行特征提取,得到包括基于时间序列的动态信息的目标特征向量;所述递归神经网络包括神经网络目标函数,所述神经网络目标函数基于预先设置的模型权重参数、模型预测错误率和所述递归神经网络对应的模型正则化项确定。5.根据权利要求1所述的方法,其特征在于,将所述目标特征向量和所述目标特征向量对应的所述...
【专利技术属性】
技术研发人员:屈道宽,高琰,姜海洋,马海苓,明玲,王广洲,郑子龙,李杨,
申请(专利权)人:山东理工昊明新能源有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。