用户稳定性分析方法及系统技术方案

技术编号:35722695 阅读:10 留言:0更新日期:2022-11-26 18:19
本发明专利技术提供一种用户稳定性分析方法及系统,方法包括:对更新后的不同时序的全量用户分别进行聚类,以获取相邻不同时序的聚类类别的相似度最高的最优配对;根据相似度最高的最优配对,确定满足预设条件的用户群体,并将用户群体添加到目标用户群体中,以对目标用户群体进行更新;将满足预设条件的用户群体剔除以对全量用户进行更新,直至更新后的全量用户的数量小于预设阈值,停止更新;将更新后的目标用户群体划分为观察组客群和实验组客群,并对观察组客群和实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析。本发明专利技术能够解决因个体特征差异导致的聚类效果不佳以及因聚类效果不佳带来的用户稳定性分析不准确问题。确问题。确问题。

【技术实现步骤摘要】
用户稳定性分析方法及系统


[0001]本专利技术涉及数据挖掘
,尤其涉及一种用户稳定性分析方法及系统。

技术介绍

[0002]用户稳定性是多个行业关注的指标,例如,金融行业中,用户稳定性越高,用户的还款能力越强。
[0003]现有用户稳定性分析方法主要包括:
[0004]基于聚类的用户识别及营销方法:基于聚类的用户识别及营销方法希望通过K

Means等无监督机器学习算法实现客群分类,针对聚类结果进行用户行为特征分析,定制用户运营营销策略。
[0005]基于机器学习模型的离网概率分析:基于机器学习模型的离网概率分析期望,使用机器学习模型及收集到的用户在网、离网数据,根据用户行为预判用户的离网可能性。
[0006]K

Means算法即为无监督的聚类算法,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇,让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。其主要缺点体现在,对于得到的聚类中心,根据得到的k个聚类的距离情况,合并距离最近的类,因此聚类中心数减小,相应的聚类数目也减小了,同时如果个体的数据不平衡,则聚类效果不佳。
[0007]基于机器学习模型的离网概率分析即为使用数据挖掘算法进行用户离网预测,针对离网倾向的用户实施客户挽留,展开维系与关怀,根据相似的个体特征,以及机器学习模型的推理能力,判断用户的力王特征。其主要缺点体现在,针对不寻常的数据组或者个体特征不稳定,得到的聚类结果可能因偏差较大。
[0008]考虑到用户通讯数据固有的不稳定性及季节性,单纯依靠个体特征进行稳定性(包含离网概率)会出现较大的偏差。因此,如何解决因个体数据不平衡或个体特征不稳定而导致的聚类效果不佳,以及因聚类效果不佳而导致对用户分析偏差较大,是亟需解决的问题。

技术实现思路

[0009]本专利技术提供的用户稳定性分析方法及系统,用于解决现有技术中存在的上述问题,能够解决因个体特征差异导致的聚类效果不佳以及因聚类效果不佳带来的用户稳定性分析不准确问题。
[0010]本专利技术提供的一种用户稳定性分析方法,包括:
[0011]对更新后的不同时序的全量用户分别进行聚类,以获取相邻不同时序的聚类类别的相似度最高的最优配对;
[0012]根据所述相似度最高的最优配对,确定满足预设条件的用户群体,并将所述用户群体添加到目标用户群体中,以对目标用户群体进行更新;
[0013]将满足所述预设条件的用户群体剔除以对所述不同时序的全量用户进行更新,直
至所述更新后的不同时序的全量用户的数量小于预设阈值,停止更新;
[0014]将更新后的目标用户群体划分为观察组客群和实验组客群,并对所述观察组客群和所述实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析;
[0015]其中,所述预设条件包括所述最优配对中在所述预设观察期的所有时序内均出现的用户。
[0016]根据本专利技术提供的一种用户稳定性分析方法,所述对更新后的不同时序的全量用户分别进行聚类,以获取相邻不同时序的聚类类别的相似度最高的最优配对,包括:
[0017]基于自组织映射SOM聚类算法对更新后的不同时序的全量用户分别进行聚类,获取更新后的不同时序的全量用户的聚类类别;
[0018]根据预设类别向量生成规则和所述聚类类别,获取不同时序的聚类类别的类别向量;
[0019]根据所述不同时序的聚类类别的类别向量,获取不同时序的聚类类别的相似度,并根据所述不同时序的聚类类别的相似度,确定所述相邻不同时序的聚类类别的相似度最高的最优配对。
[0020]根据本专利技术提供的一种用户稳定性分析方法,所述根据预设类别向量生成规则和所述聚类类别,获取不同时序的聚类类别的类别向量,包括:
[0021]将所述聚类类别中属于第一类别的第一用户以第一预设数字进行标注;
[0022]将所述聚类类别中不属于所述第一类别的其他用户以第二预设数字进行标注;
[0023]根据标注结果,获取所述不同时序的聚类类别的类别向量。
[0024]根据本专利技术提供的一种用户稳定性分析方法,所述根据所述不同时序的聚类类别的类别向量,获取不同时序的聚类类别的相似度,包括:
[0025]根据所述不同时序的聚类类别的类别向量和用户总数,获取所述不同时序的聚类类别的相似度;或
[0026]根据所述不同时序的聚类类别的类别向量、所述用户总数和预设权重,获取所述不同时序的聚类类别的相似度。
[0027]根据本专利技术提供的一种用户稳定性分析方法,所述将更新后的目标用户群体划分为观察组客群和实验组客群,包括:
[0028]根据目标稳定性分析需求,对所述目标用户群体中各用户进行分类标注;
[0029]将属于第一预设分类的用户作为所述实验组客群;
[0030]将属于第二预设分类的用户作为所述观察组客群。
[0031]根据本专利技术提供的一种用户稳定性分析方法,所述对所述观察组客群和所述实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析,包括:
[0032]将所述训练集样本和训练标签输入至预设二分类模型进行训练,以获取目标预测模型;
[0033]将所述测试集样本输入至所述目标预测模型,以预测所述目标用户群体的稳定性;
[0034]其中,所述训练集样本包括第一预设比例的所述观察组客群和所述实验组客群;
[0035]所述测试集样本包括第二预设比例的所述观察组客群和所述实验组客群;
[0036]所述训练标签为根据所述目标稳定性分析需求,对所述训练集样本中各用户进行
分类标注后确定的。
[0037]根据本专利技术提供的一种用户稳定性分析方法,所述对所述观察组客群和所述实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析,还包括:
[0038]基于差分整合移动平均自回归ARIMA算法对所述观察组客群和所述实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析。
[0039]本专利技术还提供一种用户稳定性分析系统,包括:数据获取模块、第一更新模块、第二更新模块和用户分析模块;
[0040]所述数据获取模块,用于对更新后的不同时序的全量用户分别进行聚类,以获取相邻不同时序的聚类类别的相似度最高的最优配对;
[0041]所述第一更新模块,用于根据所述相似度最高的最优配对,确定满足预设条件的用户群体,并将所述用户群体添加到目标用户群体中,以对目标用户群体进行更新;
[0042]所述第二更新模块,用于将满足所述预设条件的用户群体剔除以对所述不同时序的全量用户进行更新,直至所述更新后的不同时序的全量用户的数量小于预设阈值,停止更新;
[0043]所述用户分析模块,用于将更新后的目标用户群体划分为观察组客群和实验组客群,并对所述观察组客群和所述实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户稳定性分析方法,其特征在于,包括:对更新后的不同时序的全量用户分别进行聚类,以获取相邻不同时序的聚类类别的相似度最高的最优配对;根据所述相似度最高的最优配对,确定满足预设条件的用户群体,并将所述用户群体添加到目标用户群体中,以对目标用户群体进行更新;将满足所述预设条件的用户群体剔除以对所述不同时序的全量用户进行更新,直至所述更新后的不同时序的全量用户的数量小于预设阈值,停止更新;将更新后的目标用户群体划分为观察组客群和实验组客群,并对所述观察组客群和所述实验组客群进行特征差异性分析,以对目标用户群体的稳定性进行分析;其中,所述预设条件包括所述最优配对中在所述预设观察期的所有时序内均出现的用户。2.根据权利要求1所述的用户稳定性分析方法,其特征在于,所述对更新后的不同时序的全量用户分别进行聚类,以获取相邻不同时序的聚类类别的相似度最高的最优配对,包括:基于自组织映射SOM聚类算法对更新后的不同时序的全量用户分别进行聚类,获取更新后的不同时序的全量用户的聚类类别;根据预设类别向量生成规则和所述聚类类别,获取不同时序的聚类类别的类别向量;根据所述不同时序的聚类类别的类别向量,获取不同时序的聚类类别的相似度,并根据所述不同时序的聚类类别的相似度,确定所述相邻不同时序的聚类类别的相似度最高的最优配对。3.根据权利要求2所述的用户稳定性分析方法,其特征在于,所述根据预设类别向量生成规则和所述聚类类别,获取不同时序的聚类类别的类别向量,包括:将所述聚类类别中属于第一类别的第一用户以第一预设数字进行标注;将所述聚类类别中不属于所述第一类别的其他用户以第二预设数字进行标注;根据标注结果,获取所述不同时序的聚类类别的类别向量。4.根据权利要求2所述的用户稳定性分析方法,其特征在于,所述根据所述不同时序的聚类类别的类别向量,获取不同时序的聚类类别的相似度,包括:根据所述不同时序的聚类类别的类别向量和用户总数,获取所述不同时序的聚类类别的相似度;或根据所述不同时序的聚类类别的类别向量、所述用户总数和预设权重,获取所述不同时序的聚类类别的相似度。5.根据权利要求1所述的用户稳定性分析方法,其特征在于,所述将更新后的目标用户群体划分为观察组客群和实验组客群,包括:根据目标稳定性分析需求,对所述目标用户群体中各用户进行分类标注;将属于第一预设分类的用户作为所述实验组客群...

【专利技术属性】
技术研发人员:陈海歌
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1