【技术实现步骤摘要】
用户聚类方法、装置、设备和介质
本专利技术涉及通信领域,尤其涉及用户聚类方法、装置、设备和介质。
技术介绍
随着通信技术的发展,通信网络中包含着海量数据。相应地,大数据分析逐渐成为近年来通信运营商关注的热门话题。为了实现对用户的精准化管理,需要对用户进行聚类。然后,用户的需求往往是多维度的。如何依据用户的需求,将庞大的用户群体进行精准聚类,成为通信运营商关注的焦点。现有技术中,通常使用人工手段对用户群体进行聚类,精准度不高。
技术实现思路
本专利技术实施例提供用户聚类方法、装置、设备和介质,可以提高用户聚类的精准度。根据本专利技术实施例的一方面,提供一种用户聚类方法,包括:获取指定历史时间段内多个待聚类用户的业务数据;针对每个待聚类用户,构建该待聚类用户的业务数据的时间序列,并根据业务时间序列计算该待聚类用户的赫斯特指数;根据所述多个待聚类用户的赫斯特指数,对所述多个待聚类用户进行聚类,得到多个用户簇。其中,每个用户簇中待聚类用户的赫斯特指数 ...
【技术保护点】
1.一种用户聚类方法,其特征在于,所述方法包括:/n获取指定历史时间段内多个待聚类用户的业务数据;/n针对每个待聚类用户,构建该待聚类用户的业务数据的时间序列,并根据所述业务时间序列计算该待聚类用户的赫斯特指数;/n根据所述多个待聚类用户的赫斯特指数,对所述多个待聚类用户进行聚类,得到多个用户簇。/n其中,每个用户簇中待聚类用户的赫斯特指数与该用户簇的基准赫斯特指数的差值小于等于预设的指数阈值。/n
【技术特征摘要】
1.一种用户聚类方法,其特征在于,所述方法包括:
获取指定历史时间段内多个待聚类用户的业务数据;
针对每个待聚类用户,构建该待聚类用户的业务数据的时间序列,并根据所述业务时间序列计算该待聚类用户的赫斯特指数;
根据所述多个待聚类用户的赫斯特指数,对所述多个待聚类用户进行聚类,得到多个用户簇。
其中,每个用户簇中待聚类用户的赫斯特指数与该用户簇的基准赫斯特指数的差值小于等于预设的指数阈值。
2.根据权利要求1所述的方法,其特征在于,所述业务数据包括以下一种或多种:
办理的语音业务数据、办理的流量业务数据、办理的交互式网络电视IPTV业务数据和办理的增值业务数据。
3.根据权利要求1所述的方法,其特征在于,所述每个待聚类用户的业务数据的时间序列包括:按照时间先后顺序排列的、由所述指定历史时间段划分的多个子时间段内的业务数据;
所述多个子时间段内的业务数据符合正态分布。
4.根据权利要求3所述的方法,其特征在于,所述根据所述业务时间序列计算该待聚类用户的赫斯特指数,具体包括:
针对每个待聚类用户,基于该待聚类用户的业务数据的时间序列的正态分布,确定所述该待聚类用户的业务数据的时间序列的协方差矩阵;
基于所述协方差矩阵和所述待聚类用户的业务数据的时间序列的极差,计算所述待聚类用户的赫斯特指数。
5.根据权利要求3或权利要求4所述的方法,其特征在于,所述待聚类用户的业务数据的时间序列的极差表示所述业务数据的时间序列的累计离差中的最大值和最小值的差值。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于指定历史时间段内多个用户的业务数据,计算每个用户的李雅普诺夫指数;
将李雅普诺夫指数小于等于零的用户作为待聚类用户。
7.根据权利要求1所述的方法,其特征在于,所述每个用户簇的...
【专利技术属性】
技术研发人员:周全,梁志,杨波,
申请(专利权)人:中国移动通信集团山西有限公司,中国移动通信集团有限公司,
类型:发明
国别省市:山西;14
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。