The invention proposes a user clustering method based on the usage behavior of mobile applications. It combines SOM and Kmeans clustering algorithm for mobile phone users clustering. First, we build an applicable behavior analysis system for mobile users' mobile applications. We combine SOM and Kmeans methods to analyze users' mobile Internet behavior, so as to achieve the purpose of mobile phone users clustering. Analysis of the use of SOM Kmeans two stage clustering, the SOM algorithm is simple in calculation and good containment and the advantages of the Kmeans algorithm the number of less demanding on the data set, and for the SOM algorithm training for a long time, Kmeans algorithm to solve the initial value of K is difficult to determine the faults. In the clustering of mobile phone users, which use the preference matrix of mobile phone users as analysis data, it can get better subdivision results in a shorter time.
【技术实现步骤摘要】
基于移动应用使用行为的用户分群聚类方法
本专利技术涉及移动手机用户上网行为挖掘领域,特别是涉及一种基于移动应用使用行为的用户分群聚类方法。
技术介绍
随着互联网的广泛应用,特别是移动互联网、智能终端等的快速发展,人们的生活也被越来越快的数字化。各类移动应用手机的出现,手机应用越来越被移动用户所依赖,带给人们沟通便利的同时,人们使用通信网络传输的数据量也出现爆炸式增。面对着当前手机用户的不断增长和手机产生的大量数据,整个通信运营产业压力突出,移动运营商面临着数据流的附加值被互联网公司赚走的挑战。客户由于不同的兴趣爱好而表现出不同的互联网访问行为,该访问行为里面蕴含着丰富的客户信息,通过这些信息进行客户内容偏好分析,从而更好地把握客户需求,支撑和促进移动互联网业务发展。因此基于内容偏好的移动互联网上网行为已经成为一个研究的热点问题。如何利用好手中的大数据,有效地分析出移动用户的上网行为,有效地实施精确营销,成为需要面对的问题。当前,对移动用户上网行为的分析大概有三大类:一类是基于用户上网日志和搜索关键字的挖掘,首先对用户浏览过的页面进行分词,提取页面关键字,进一步分析 ...
【技术保护点】
基于移动应用使用行为的用户分群聚类方法,其特征在于,包括以下步骤:S1:针对某一通信运行商,提取用户特征信息、用户应用使用行为信息和移动应用信息,构建移动手机用户应用使用行为分析体系;S2:基于步骤S1所述移动手机用户应用使用行为分析体系,定义移动手机用户应用使用偏好;S3:根据步骤S2所述移动手机用户应用使用偏好的定义,构建移动手机用户使用偏好矩阵P;S4:将S3中构建的移动手机用户使用偏好矩阵P的行向量数据集E输入至SOM‑Keams聚类算法中;S5:使用SOM算法进行粗聚类,得到初步划分的群数目n,并计算每个群的群数据的平均值m;S6:将所述群数目n赋给Kmeans算 ...
【技术特征摘要】
1.基于移动应用使用行为的用户分群聚类方法,其特征在于,包括以下步骤:S1:针对某一通信运行商,提取用户特征信息、用户应用使用行为信息和移动应用信息,构建移动手机用户应用使用行为分析体系;S2:基于步骤S1所述移动手机用户应用使用行为分析体系,定义移动手机用户应用使用偏好;S3:根据步骤S2所述移动手机用户应用使用偏好的定义,构建移动手机用户使用偏好矩阵P;S4:将S3中构建的移动手机用户使用偏好矩阵P的行向量数据集E输入至SOM-Keams聚类算法中;S5:使用SOM算法进行粗聚类,得到初步划分的群数目n,并计算每个群的群数据的平均值m;S6:将所述群数目n赋给Kmeans算法的初始值k,挑选与每个群的群数据平均值m接近的数据点作为中心点,使用Kmeans算法进行再次聚类,最终得到用户群的划分结果,并输出。2.根据权利要求1中所述一种基于移动应用使用行为的用户分群聚类方法,其特征在于:所述用户特征信息包括脱敏后的用户编号,用户年龄,用户性别;所述用户应用使用行为信息包括应用使用次数,使用时间,使用流量;所述移动应用信息包括:应用名称和所属一级分类标签。3.根据权利要求1中所述一种基于移动应用使用行为的用户分群聚类方法,其特征在于:所述步骤S2中定义移动手机用户应用使用偏好的步骤如下:令L为提取所有一级分类标签集合,L={l1,l2,l3,...,lt},其中li∈L;A为分类标签下所有应用的集合,则该标签i下的所有应用表示为li={ai1,ai2,ai3,...,ail};S21:确定用户对于应用aij的使用次数偏好为:其中Fij为用户使用标签i下的第j个应用的次数,Fjk为第j个应用所属标签下第k个应用的使用次数,t标签总数,l该标签下的所有应用数;S22:确定用户对于应用aij的使用时间偏好为:其中Tij为用户使用标签i下的第j个应用的使用时间,Tjk表示第j个应用所属标签下第k个应用的使用时间;S23:确定用户对于应用aij的操作偏好为:Taffij/Traffli=1,2,...,t;j=1,2,...,l其中Taffij为用户使用标签i下的第j个应用的流量,Traffl为用户使用第i个标签下所有应用的总流量;S24:根据步骤S21,S22,S...
【专利技术属性】
技术研发人员:马创,张令浩,徐光侠,刘俊,胡梦潇,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。