一种用户换机预测方法及系统技术方案

技术编号：20798167 阅读：21 留言：0更新日期：2019-04-06 11:48

本发明专利技术公开了一种用户换机预测方法、系统、装置及一种计算机可读存储介质，涉及信息处理技术领域。本发明专利技术对获取的用户信息进行编码，采用复合参数量子粒子群优化算法对用户信息编码进行迭代优化，确定用户特征标签作为决策树训练模型的输入，根据决策树训练模型训练所述用户特征标签，确定最优目标函数值，输出用户换机预测结果。不仅可以处理高维度的数据，还可以提高用户换机预测结果的准确度。

A Prediction Method and System for User Switching

The invention discloses a method, system, device and a computer readable storage medium for user switching prediction, which relates to the technical field of information processing. The invention codes the acquired user information, uses compound parameter quantum particle swarm optimization algorithm to iteratively optimize the user information coding, determines the user feature label as the input of the decision tree training model, trains the user feature label according to the decision tree training model, determines the optimal objective function value, and outputs the prediction result of user switching. It can not only process high-dimensional data, but also improve the accuracy of user switch prediction results.

全部详细技术资料下载

【技术实现步骤摘要】
一种用户换机预测方法及系统
本专利技术涉及信息处理
，尤其涉及一种基于复合参数量子粒子群决策树的用户换机预测的方法、系统、装置及一种计算机可读存储介质。
技术介绍
目前，智能终端已成为人们生活中社交、消费、娱乐以及获取信息等不可或缺的辅助工具，随着移动通信技术及智能终端的快速发展，移动终端的使用场景、品牌、型号等更新换代迅速，运营商和设备商等往往需要为进行终端相关的营销活动，而为了提高电信用户换机预测的准确率，需要尽可能充分的运用各类电信数据源。现有技术中的用户换机预测方法主要是基于终端出货量、用户问卷调查、终端开机发送的标识信息、运用现有的决策树算法进行换机预测等方式，而基于终端出货量的方式，分析结果侧重于移动设备厂商的出货量及市占比，无法准确分析用户实际启用新移动设备的情况以及无法获知准确的换机位置信息；基于用户问卷调查的方式，由于周期较长，分析的时效性较差，分析结果的应用价值也受到了限制；基于终端开机发送的标识信息的方式，则无法在较长时间尺度内对用户换机的策略进行分析，且现有技术的上述方式得到的分析结果精确度较低；而运用现有的决策树算法进行换机预测容易过拟合，导致实际预测的效果并不高，且不适合处理高维数据，当属性数量过大的时候，决策树效果较差，另外，现有的决策树算法对异常值过于敏感，容易导致树的结构产生变化，且泛化能力太差，对于没有出现过的用户特征标签无法进行处理。
技术实现思路
本专利技术实施例提供一种用户换机预测方法，可以在适用于高维度数据的同时，提高用户换机预测结果准确度。为达到上述目的，本专利技术的实施例提供一种用户换机预测方法，应用于用户...

【技术保护点】
1.一种用户换机预测方法，其特征在于，所述方法包括：获取用户信息，所述用户信息包括：终端参数信息、终端行为信息、用户信息、位置信息、消费信息、用户偏好信息和用户浏览信息；对所述用户信息进行编码；根据复合参数量子粒子群优化算法优化所述编码，获得用户特征标签；根据决策树训练模型训练所述用户特征标签，得到用户换机预测结果。

【技术特征摘要】
1.一种用户换机预测方法，其特征在于，所述方法包括：获取用户信息，所述用户信息包括：终端参数信息、终端行为信息、用户信息、位置信息、消费信息、用户偏好信息和用户浏览信息；对所述用户信息进行编码；根据复合参数量子粒子群优化算法优化所述编码，获得用户特征标签；根据决策树训练模型训练所述用户特征标签，得到用户换机预测结果。2.根据权利要求1所述的用户换机预测方法，其特征在于，所述终端参数信息包括：终端品牌、终端型号、终端价格、上市时间和操作系统；所述终端行为信息包括：终端使用时长和终端是否为合约机；所述用户信息包括：用户年龄、用户性别和用户等级；所述位置信息包括：用户白天常驻地和用户夜间常驻地；所述消费信息包括：用户月平均消费、用户月平均使用流量、用户月平均通话时长和用户套餐类型；所述用户偏好信息包括：用户常用应用程序、用户每日活跃时间、用户每日所经过的跟踪区列表TAList数量和用户关注类别；所述用户浏览信息包括：用户浏览手机销售平台的次数和时长。3.根据权利要求2所述的用户换机预测方法，其特征在于，所述对所述用户信息进行编码包括：对离散型用户信息采用枚举值的方法进行独热编码；对连续型用户信息采用等频分箱法进行区间划分，根据所述区间划分对每个区间进行编码；其中，所述离散型用户信息包括：终端品牌、终端型号、操作系统、用户性别、用户等级、用户白天常驻地、用户夜间常驻地、用户套餐类型、用户常用应用程序、用户每日活跃时间和用户关注类别；所述连续型用户信息包括：终端价格、上市时间、用户年龄、用户月平均消费、用户月平均使用流量、用户月平均通话时长、用户每日所经过的跟踪区列表TAList数量、用户浏览手机销售平台的次数和时长。4.根据权利要求3所述的用户换机预测方法，其特征在于，所述根据复合参数量子粒子群优化算法优化所述编码，获得用户特征标签，包括：根据复合参数量子粒子群优化算法，初始化量子粒子的位置、速度和个体最优位置；其中，所述初始化量子粒子的位置xi为0或1，初始化量子粒子的速度vi＝(αi1αi2…αil)＝(vi1vi2…vil)，初始化量子粒子的个体最优位置pi＝xi；其中，i指第i个量子粒子，l指量子粒子的维度，所述维度用于标识所述用户信息；计算所述量子粒子的目标函数，获得粒子群的总体最优位置pg；更新所述量子粒子的位置和速度；根据更新后的所述量子粒子的位置和速度计算所述量子粒子的目标函数，获得所述量子粒子的个体最优位置、总体最优位置和平均位置；根据所述量子粒子的个体最优位置、总体最优位置和平均位置确定用户特征标签；其中，所述量子粒子的目标函数F(x)＝(TP+TN)/(TP+TN+FN+FP)；其中，TP表示预测结果为用户换机，且用户实际换机；FP表示预测结果为用户换机，实际用户未换机；TN表示预测用户为换机，实际用户未换机；FN表示预测用户未换机，实际用户换机。5.根据权利要求4所述的用户换机预测方法，其特征在于，所述根据决策树训练模型训练所述用户特征标签，得到用户换机预测结果，包括：根据所述用户特征标签确定所述决策树的输入；根据决策树训练模型训练所述决策树的输入，若迭代次数大于预设门限，确定最优目标函数值，输出用户换机预测结果。6.根据权利要求4或5所述的用户换机预测方法，其特征在于，所述根据所述量子粒子的个体最优位置、总体最优位置和平均位置确定用户特征标签，包括：根据确定用户特征标签；其中，是第i个量子粒子的第d个比特位第t次迭代的位置，r是每次迭代随机生成的[0,1]之间均匀分布的随机数，是第i个量子粒子的第d个比特位第t次迭代的速度；其中，其中，是第i个量子粒子的第d个比特位第t次迭代的旋转角；是第i个量子粒子的第d个比特位第t-1次迭代的个体最优位置，是第i个量子粒子的第d个比特位第t-1次迭代的总体最优位置；其中其中，a1和a2是常数，用于标识量子粒子的个体最优位置、总体最优位置和初始化量子粒子的位置对本次迭代中量子粒子的速度的影响程度。7.一种用户换机预测系统，其特征在于，所述系统包括：信息获取单元，用于获取用户信息，所述用户信息包括：终端参数信息、终端行为信息、用户信息、位置信息、消费信息、用户偏好信息和用户浏览信息；编码...

【专利技术属性】
技术研发人员：成晨，韩玉辉，程新洲，袁明强，徐乐西，叶海纳，高洁，
申请(专利权)人：中国联合网络通信集团有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人