一种用户换机预测方法及系统技术方案

技术编号:20798167 阅读:21 留言:0更新日期:2019-04-06 11:48
本发明专利技术公开了一种用户换机预测方法、系统、装置及一种计算机可读存储介质,涉及信息处理技术领域。本发明专利技术对获取的用户信息进行编码,采用复合参数量子粒子群优化算法对用户信息编码进行迭代优化,确定用户特征标签作为决策树训练模型的输入,根据决策树训练模型训练所述用户特征标签,确定最优目标函数值,输出用户换机预测结果。不仅可以处理高维度的数据,还可以提高用户换机预测结果的准确度。

A Prediction Method and System for User Switching

The invention discloses a method, system, device and a computer readable storage medium for user switching prediction, which relates to the technical field of information processing. The invention codes the acquired user information, uses compound parameter quantum particle swarm optimization algorithm to iteratively optimize the user information coding, determines the user feature label as the input of the decision tree training model, trains the user feature label according to the decision tree training model, determines the optimal objective function value, and outputs the prediction result of user switching. It can not only process high-dimensional data, but also improve the accuracy of user switch prediction results.

【技术实现步骤摘要】
一种用户换机预测方法及系统
本专利技术涉及信息处理
,尤其涉及一种基于复合参数量子粒子群决策树的用户换机预测的方法、系统、装置及一种计算机可读存储介质。
技术介绍
目前,智能终端已成为人们生活中社交、消费、娱乐以及获取信息等不可或缺的辅助工具,随着移动通信技术及智能终端的快速发展,移动终端的使用场景、品牌、型号等更新换代迅速,运营商和设备商等往往需要为进行终端相关的营销活动,而为了提高电信用户换机预测的准确率,需要尽可能充分的运用各类电信数据源。现有技术中的用户换机预测方法主要是基于终端出货量、用户问卷调查、终端开机发送的标识信息、运用现有的决策树算法进行换机预测等方式,而基于终端出货量的方式,分析结果侧重于移动设备厂商的出货量及市占比,无法准确分析用户实际启用新移动设备的情况以及无法获知准确的换机位置信息;基于用户问卷调查的方式,由于周期较长,分析的时效性较差,分析结果的应用价值也受到了限制;基于终端开机发送的标识信息的方式,则无法在较长时间尺度内对用户换机的策略进行分析,且现有技术的上述方式得到的分析结果精确度较低;而运用现有的决策树算法进行换机预测容易过拟合,导致实际预测的效果并不高,且不适合处理高维数据,当属性数量过大的时候,决策树效果较差,另外,现有的决策树算法对异常值过于敏感,容易导致树的结构产生变化,且泛化能力太差,对于没有出现过的用户特征标签无法进行处理。
技术实现思路
本专利技术实施例提供一种用户换机预测方法,可以在适用于高维度数据的同时,提高用户换机预测结果准确度。为达到上述目的,本专利技术的实施例提供一种用户换机预测方法,应用于用户换机预测装置,所述方法包括:获取用户信息,所述用户信息包括:终端参数信息、终端行为信息、用户信息、位置信息、消费信息、用户偏好信息和用户浏览信息;对所述用户信息进行编码;根据复合参数量子粒子群优化算法优化所述编码,获得用户特征标签;根据决策树训练模型训练所述用户特征标签,得到用户换机预测结果。对应地,本专利技术实施例还提供了一种用户换机预测系统,所述系统包括信息获取单元、编码单元和分析单元;所述信息获取单元,用于获取用户信息,所述用户信息包括:终端参数信息、终端行为信息、用户信息、位置信息、消费信息、用户偏好信息和用户浏览信息;所述编码单元,用于对所述用户信息进行编码;所述分析单元,用于根据复合参数量子粒子群优化算法优化所述编码,获得用户特征标签;以及根据决策树训练模型训练所述用户特征标签,得到用户换机预测结果。本专利技术通过采用复合参数量子粒子群优化算法对用户信息编码进行迭代优化,获取决策树训练模型的输入,即用户特征标签,根据决策树训练模型训练所述用户特征标签,确定最优目标函数值,输出用户换机预测结果。不仅可以处理高维度的数据,还可以提高用户换机预测结果的准确度。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例的用户换机预测方法的流程图;图2为本专利技术实施例的决策树模型算法的流程图;图3为本专利技术实施例的复合参数量子粒子群优化算法的流程图;图4为本专利技术实施例的用户换机预测系统的结构示意图;图5为本专利技术实施例的用户换机预测装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供一种用户换机预测方法,如图1所示,为本专利技术的用户换机预测方法流程图,所述方法应用于用户换机预测装置,所述方法具体包括:S101、获取用户信息,所述用户信息包括:终端参数信息、终端行为信息、用户信息、位置信息、消费信息、用户偏好信息和用户浏览信息。其中,可以从用户处获取用户信息,也可以从网络侧获取所述用户信息,也可以从第三方信息平台获取所述用户信息,对此,本专利技术实施例不做具体限定。所述终端参数信息可以包括但不限于终端品牌、终端型号、终端价格、上市时间和操作系统;所述终端行为信息可以包括但不限于终端使用时长和终端是否为合约机;所述用户信息可以包括但不限于用户年龄、用户性别和用户等级;所述位置信息可以包括但不限于用户白天常驻地和用户夜间常驻地;所述消费信息可以包括但不限于用户月平均消费、用户月平均使用流量、用户月平均通话时长和用户套餐类型;所述用户偏好信息可以包括但不限于用户常用应用程序、用户每日活跃时间、用户每日所经过的跟踪区列表TAList数量和用户关注类别;所述用户浏览信息可以包括但不限于用户浏览手机销售平台的次数和时长。可以根据具体的情况调整用户信息类别。对此,本专利技术实施例不进行限定。S102、对所述用户信息进行编码。具体的,对离散型用户信息采用枚举值的方法进行独热编码;对连续型用户信息采用等频分箱法进行区间划分,根据所述区间划分对每个区间进行编码。其中,所述离散型用户信息包括:终端品牌、终端型号、操作系统、用户性别、用户等级、用户白天常驻地、用户夜间常驻地、用户套餐类型、用户常用应用程序、用户每日活跃时间和用户关注类别;所述连续型用户信息包括:终端价格、上市时间、用户年龄、用户月平均消费、用户月平均使用流量、用户月平均通话时长、用户每日所经过的跟踪区列表TAList数量、用户浏览手机销售平台的次数和时长。例如:对用户性别进行编码,可以将男性编码为0,女性编码为1;对终端品牌进行编码,可以将TOP20常见品牌按照1~20编码,其他品牌编码为0;对用户白天/夜间常驻地进行编码,可以针对不同的城市的不同区域进行编码;对终端价格进行编码,可以将终端价格划分成区间:(0,2000],(2000,4000]、(4000,6000]和(6000,+∞),将上述区间分别编码为1、2、3、4。本专利技术实施例对具体的编码方式和方法不进行限定。S103、根据复合参数量子粒子群优化算法优化所述编码,获得用户特征标签。S104、根据决策树训练模型训练所述用户特征标签,得到用户换机预测结果。所述过程具体为如图2所示,为本专利技术实施例的决策树模型算法流程图,包括:S1041、根据所述用户特征标签确定所述决策树的输入;具体的,根据确定用户特征标签;其中,是第i个量子粒子的第d个比特位第t次迭代的位置,r是每次迭代随机生成的[0,1]之间均匀分布的随机数,是第i个量子粒子的第d个比特位第t次迭代的速度;其中,其中,是第i个量子粒子的第d个比特位第t次迭代的旋转角;是第i个量子粒子的第d个比特位第t-1次迭代的个体最优位置,是第i个量子粒子的第d个比特位第t-1次迭代的总体最优位置;其中其中,a1和a2是常数,用于标识量子粒子的个体最优位置、总体最优位置和初始化量子粒子的位置对本次迭代中量子粒子的速度的影响程度。具体的,若第i个量子粒子的第d个比特位第t次迭代的位置为1,则将其对应的用户特征标签作为决策树的输入,若第i个量子粒子的第d个比特位第t次迭代的位置为0,则舍本文档来自技高网...

【技术保护点】
1.一种用户换机预测方法,其特征在于,所述方法包括:获取用户信息,所述用户信息包括:终端参数信息、终端行为信息、用户信息、位置信息、消费信息、用户偏好信息和用户浏览信息;对所述用户信息进行编码;根据复合参数量子粒子群优化算法优化所述编码,获得用户特征标签;根据决策树训练模型训练所述用户特征标签,得到用户换机预测结果。

【技术特征摘要】
1.一种用户换机预测方法,其特征在于,所述方法包括:获取用户信息,所述用户信息包括:终端参数信息、终端行为信息、用户信息、位置信息、消费信息、用户偏好信息和用户浏览信息;对所述用户信息进行编码;根据复合参数量子粒子群优化算法优化所述编码,获得用户特征标签;根据决策树训练模型训练所述用户特征标签,得到用户换机预测结果。2.根据权利要求1所述的用户换机预测方法,其特征在于,所述终端参数信息包括:终端品牌、终端型号、终端价格、上市时间和操作系统;所述终端行为信息包括:终端使用时长和终端是否为合约机;所述用户信息包括:用户年龄、用户性别和用户等级;所述位置信息包括:用户白天常驻地和用户夜间常驻地;所述消费信息包括:用户月平均消费、用户月平均使用流量、用户月平均通话时长和用户套餐类型;所述用户偏好信息包括:用户常用应用程序、用户每日活跃时间、用户每日所经过的跟踪区列表TAList数量和用户关注类别;所述用户浏览信息包括:用户浏览手机销售平台的次数和时长。3.根据权利要求2所述的用户换机预测方法,其特征在于,所述对所述用户信息进行编码包括:对离散型用户信息采用枚举值的方法进行独热编码;对连续型用户信息采用等频分箱法进行区间划分,根据所述区间划分对每个区间进行编码;其中,所述离散型用户信息包括:终端品牌、终端型号、操作系统、用户性别、用户等级、用户白天常驻地、用户夜间常驻地、用户套餐类型、用户常用应用程序、用户每日活跃时间和用户关注类别;所述连续型用户信息包括:终端价格、上市时间、用户年龄、用户月平均消费、用户月平均使用流量、用户月平均通话时长、用户每日所经过的跟踪区列表TAList数量、用户浏览手机销售平台的次数和时长。4.根据权利要求3所述的用户换机预测方法,其特征在于,所述根据复合参数量子粒子群优化算法优化所述编码,获得用户特征标签,包括:根据复合参数量子粒子群优化算法,初始化量子粒子的位置、速度和个体最优位置;其中,所述初始化量子粒子的位置xi为0或1,初始化量子粒子的速度vi=(αi1αi2…αil)=(vi1vi2…vil),初始化量子粒子的个体最优位置pi=xi;其中,i指第i个量子粒子,l指量子粒子的维度,所述维度用于标识所述用户信息;计算所述量子粒子的目标函数,获得粒子群的总体最优位置pg;更新所述量子粒子的位置和速度;根据更新后的所述量子粒子的位置和速度计算所述量子粒子的目标函数,获得所述量子粒子的个体最优位置、总体最优位置和平均位置;根据所述量子粒子的个体最优位置、总体最优位置和平均位置确定用户特征标签;其中,所述量子粒子的目标函数F(x)=(TP+TN)/(TP+TN+FN+FP);其中,TP表示预测结果为用户换机,且用户实际换机;FP表示预测结果为用户换机,实际用户未换机;TN表示预测用户为换机,实际用户未换机;FN表示预测用户未换机,实际用户换机。5.根据权利要求4所述的用户换机预测方法,其特征在于,所述根据决策树训练模型训练所述用户特征标签,得到用户换机预测结果,包括:根据所述用户特征标签确定所述决策树的输入;根据决策树训练模型训练所述决策树的输入,若迭代次数大于预设门限,确定最优目标函数值,输出用户换机预测结果。6.根据权利要求4或5所述的用户换机预测方法,其特征在于,所述根据所述量子粒子的个体最优位置、总体最优位置和平均位置确定用户特征标签,包括:根据确定用户特征标签;其中,是第i个量子粒子的第d个比特位第t次迭代的位置,r是每次迭代随机生成的[0,1]之间均匀分布的随机数,是第i个量子粒子的第d个比特位第t次迭代的速度;其中,其中,是第i个量子粒子的第d个比特位第t次迭代的旋转角;是第i个量子粒子的第d个比特位第t-1次迭代的个体最优位置,是第i个量子粒子的第d个比特位第t-1次迭代的总体最优位置;其中其中,a1和a2是常数,用于标识量子粒子的个体最优位置、总体最优位置和初始化量子粒子的位置对本次迭代中量子粒子的速度的影响程度。7.一种用户换机预测系统,其特征在于,所述系统包括:信息获取单元,用于获取用户信息,所述用户信息包括:终端参数信息、终端行为信息、用户信息、位置信息、消费信息、用户偏好信息和用户浏览信息;编码...

【专利技术属性】
技术研发人员:成晨韩玉辉程新洲袁明强徐乐西叶海纳高洁
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1