用户行为数据预测方法、装置、设备及介质制造方法及图纸

技术编号:30424621 阅读:57 留言:0更新日期:2021-10-24 16:55
本发明专利技术公开了一种用户行为数据预测方法、装置、设备及介质。获取目标用户的历史行为数据及身份特征数据;将目标用户的历史行为数据及身份特征数据输入训练后的聚类模型,得到目标用户所属的用户类别;将目标用户的历史行为数据输入与目标用户所属的用户类别对应的第一分类器,得到目标用户行为数据初始预测结果;将目标用户行为数据初始预测结果输入第二分类器,得到目标用户行为数据最终预测结果。根据本发明专利技术实施例,能够提高用户行为数据预测的准确性。的准确性。的准确性。

【技术实现步骤摘要】
用户行为数据预测方法、装置、设备及介质


[0001]本专利技术属于计算机
,尤其涉及一种用户行为数据预测方法、用户行为数据预测装置、用户行为数据预测设备及计算机可读存储介质。

技术介绍

[0002]用户的行为数据是企业各种经营活动的向导。从市场营销角度来看,当企业掌握用户的行为数据后,例如用户的通信消费及其用量,例如流量、通话量等,就可以合理、有针对性地向用户推荐相关商品,提高销售量。因此,研究用户的用户行为数据是市场营销研究的重要内容,对正确引导居民消费和指导企业制定科学合理的推荐策略都具有重要的理论和现实意义。
[0003]然而目前对用户行为数据的预测还不够准确,因此,亟需一种新的用户行为数据预测方案。

技术实现思路

[0004]本专利技术实施例提供一种用户行为数据预测方法、装置、设备及介质,能够提高用户行为数据预测的准确性。
[0005]第一方面,本专利技术实施例提供一种用户行为数据预测方法,方法包括:
[0006]获取目标用户的历史行为数据及身份特征数据;
[0007]将目标用户的历史行为数据及身份特征数据输入训练后的聚类模型,得到目标用户所属的用户类别;
[0008]将目标用户的历史行为数据输入与目标用户所属的用户类别对应的第一分类器,得到目标用户行为数据初始预测结果;
[0009]将目标用户行为数据初始预测结果输入第二分类器,得到目标用户行为数据最终预测结果。
[0010]在第一方面一种可能的实施方式中,该方法还包括训练聚类模型;训练聚类模型,包括:
[0011]获取训练样本集及测试样本集,训练样本集及测试样本集包括多个用户数据,每个用户数据包括用户历史行为数据及用户身份特征数据;
[0012]利用训练样本集及测试样本集对聚类模型进行迭代训练,直至满足预设的训练停止条件,得到训练后的聚类模型。
[0013]在第一方面一种可能的实施方式中,利用训练样本集及测试样本集对聚类模型进行迭代训练,直至满足预设的训练停止条件,得到训练后的聚类模型,包括:
[0014]利用训练样本集及测试样本集对聚类模型进行初始训练,得到初始训练后的聚类模型;
[0015]将训练样本集输入初始训练后的聚类模型,得到多个聚类族;其中,每个聚类族为一个用户类别;
[0016]针对每个聚类族构建第一分类器;
[0017]利用各第一分类器的学习结果,训练第二分类器;
[0018]利用第二分类器的Kappa系数对初始训练后的聚类模型进行迭代训练,直至满足预设的训练停止条件,得到最终训练后的聚类模型。
[0019]在第一方面一种可能的实施方式中,聚类模型为基于谱聚类算法、Birch聚类算法及Agglomerative Clustering聚类算法构建的,利用训练样本集及测试样本集训练聚类模型,包括:
[0020]将谱聚类算法、Birch聚类算法及Agglomerative Clustering聚类算法聚类族的数量设置为相同数值;
[0021]利用谱聚类算法、Birch聚类算法及Agglomerative Clustering聚类算法分别对训练样本集进行聚类;
[0022]利用Calinski-Harabasz指数法及测试样本集,优化谱聚类算法、Birch聚类算法及Agglomerative Clustering聚类算法中除聚类族的数量之外的参数,得到优化后的谱聚类算法、Birch聚类算法及Agglomerative Clustering聚类算法。
[0023]在第一方面一种可能的实施方式中,将训练样本集输入初始训练后的聚类模型,得到多个聚类族,包括:
[0024]用优化后的谱聚类算法、Birch聚类算法及Agglomerative Clustering聚类算法分别对训练样本集进行聚类,得到谱聚类算法对应的第一聚类族编号信息、Birch聚类算法对应的第二聚类族编号信息及Agglomerative Clustering聚类算法对应的第三聚类族编号信息;
[0025]分别计算第二聚类族编号信息及第三聚类族编号信息与第一聚类族编号信息的重合度,并保留重合度最大的第二聚类族编号信息及第三聚类族编号信息;
[0026]利用投票机制从第一聚类族编号信息、重合度最大的第二聚类族编号信息及第三聚类族编号信息中确定最终的聚类族编号信息;
[0027]对应的,针对每个聚类类别信息构建第一分类器,包括:
[0028]针对每个最终的聚类族编号信息及每个聚类族内的用户历史行为数据,构建第一分类器。
[0029]在第一方面一种可能的实施方式中,针对每个聚类族构建第一分类器,包括:
[0030]针对每个聚类族,基于逻辑回归、决策树、随机森林及多层感知器构建第一分类器。
[0031]在第一方面一种可能的实施方式中,利用第二分类器的Kappa系数对聚类模型进行迭代训练,直至满足预设的训练停止条件,得到最终训练后的聚类模型,包括:
[0032]设置聚类族数量的取值区间及迭代步长,计算各数量下的第二分类器的Kappa系数;
[0033]将各Kappa系数中最大的Kappa系数对应的数量作为聚类模型的最优聚类族数量,得到最终训练后的聚类模型。
[0034]第二方面,本专利技术实施例提供了一种用户行为数据预测装置,装置包括:
[0035]数据获取模块,用于获取目标用户的历史行为数据及身份特征数据;
[0036]类别确定模块,用于将目标用户的历史行为数据及身份特征数据输入训练后的聚
类模型,得到目标用户所属的用户类别;
[0037]第一预测模块,用于将目标用户的历史行为数据输入与目标用户所属的用户类别对应的第一分类器,得到目标用户行为数据初始预测结果;
[0038]第二预测模块,用于将目标用户行为数据初始预测结果输入第二分类器,得到目标用户行为数据最终预测结果。
[0039]第三方面,本专利技术实施例提供了一种用户行为数据预测设备,设备包括:处理器以及存储有计算机程序指令的存储器;
[0040]所述处理器执行所述计算机程序指令时实现如第一方面所述的用户行为数据预测方法。
[0041]第四方面,本专利技术实施例提供了一种计算机存储介质,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如第一方面所述的用户行为数据预测方法。
[0042]本专利技术实施例提供的用户行为数据预测方法、装置、设备及计算机存储介质,通过将目标用户的历史行为数据及身份特征数据输入训练后的聚类模型,得到目标用户所属的用户类别;进一步的将目标用户的历史行为数据输入与目标用户所属的用户类别对应的第一分类器,得到目标用户行为数据初始预测结果,并最终将目标用户行为数据初始预测结果输入第二分类器,得到目标用户行为数据最终预测结果,得到目标用户行为数据最终预测结果。一方面,针对不同用户类别间具有差异性,每个用户类别均具有对应的第一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户行为数据预测方法,其特征在于,包括:获取目标用户的历史行为数据及身份特征数据;将所述目标用户的历史行为数据及身份特征数据输入训练后的聚类模型,得到所述目标用户所属的用户类别;将所述目标用户的历史行为数据输入与所述目标用户所属的用户类别对应的第一分类器,得到所述目标用户行为数据初始预测结果;将所述目标用户行为数据初始预测结果输入第二分类器,得到所述目标用户行为数据最终预测结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括训练所述聚类模型;所述训练所述聚类模型,包括:获取训练样本集及测试样本集,所述训练样本集及测试样本集包括多个用户数据,每个所述用户数据包括用户历史行为数据及用户身份特征数据;利用所述训练样本集及测试样本集对所述聚类模型进行迭代训练,直至满足预设的训练停止条件,得到训练后的所述聚类模型。3.根据权利要求2所述的方法,其特征在于,所述利用所述训练样本集及测试样本集对所述聚类模型进行迭代训练,直至满足预设的训练停止条件,得到训练后的所述聚类模型,包括:利用所述训练样本集及所述测试样本集对所述聚类模型进行初始训练,得到初始训练后的所述聚类模型;将所述训练样本集输入初始训练后的所述聚类模型,得到多个聚类族;其中,每个所述聚类族为一个所述用户类别;针对每个所述聚类族构建第一分类器;利用各所述第一分类器的学习结果,训练所述第二分类器;利用所述第二分类器的Kappa系数对初始训练后的所述聚类模型进行迭代训练,直至满足所述预设的训练停止条件,得到最终训练后的所述聚类模型。4.根据权利要求3所述的方法,其特征在于,所述聚类模型为基于谱聚类算法、Birch聚类算法及Agglomerative Clustering聚类算法构建的,所述利用所述训练样本集及所述测试样本集训练所述聚类模型,包括:将所述谱聚类算法、Birch聚类算法及Agglomerative Clustering聚类算法聚类族的数量设置为相同数值;利用所述谱聚类算法、Birch聚类算法及Agglomerative Clustering聚类算法分别对所述训练样本集进行聚类;利用Calinski-Harabasz指数法及所述测试样本集,优化所述谱聚类算法、Birch聚类算法及Agglomerative Clustering聚类算法中除所述聚类族数量之外的参数,得到优化后的所述谱聚类算法、Birch聚类算法及Agglomerative Clustering聚类算法。5.根据权利要求4所述的方法,其特征在于,所述将所述训练样本集输入初始训练后的所述聚类模型,得到多...

【专利技术属性】
技术研发人员:应嶒珺何怡陈晨
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1