The invention discloses a app user clustering method, in accordance with the default rules of the data set of frequent itemsets mining, mining frequent itemsets and then according to the construction of user association map, finally the community discovery, the user has been divided into the association graph into several regions, in order to achieve the app users rapid and precise clustering. To develop more precise marketing strategies, improve commodity recommendation, advertising effect. The invention does not need to carry out the numeric data set, and can display the indirect association between the users. The implementation is simple and the clustering accuracy is high. The invention also discloses a app user clustering device.
【技术实现步骤摘要】
一种app用户聚类方法及装置
本专利技术涉及数据处理
,尤其涉及一种app用户聚类方法及装置。
技术介绍
随着移动终端的普及,app(应用软件)的数量也在迅猛增长,目前市场上流行着数以亿计的app,很多使用相同或相似app的用户往往拥有相同的生活习惯或者消费习惯,从某种程度上可以认为他们是相似的用户群体。另外,获得用户终端上所安装的所有app列表也并非难事,部分应用市场以及杀毒软件等均可收集到用户app列表。有鉴于此,很多企业都希望对app用户进行聚类,从而制定更加精准的营销策略,提高商品推荐、广告投放的效果。目前,用户聚类的方法有很多,主要取决于数据的维度,例如中国专利技术专利申请CN201410380588中示出了一种基于用户行为的聚类方法。这种方法的前提是具有数值型的用户行为特征,由于用户app列表难以数值化,并且一旦数据量达到上千万甚至上亿时,这种方法的计算量是不可估量的,因此基于数值的聚类方法并不适用。
技术实现思路
本专利技术的目的在于提供一种app用户聚类方法和装置,能实现对app用户快速、精准的聚类,从而制定更加精准的营销策略,提高商品推荐、广告投放的效果。为了实现上述目的,本专利技术公开了一种app用户聚类方法,包括以下步骤:获取多个用户的app列表,生成数据集,其中,所述数据集包括若干app名称以及安装有相应app的用户ID;按照预设的规则对所述数据集进行频繁项集的挖掘;根据挖掘的频繁项集构建用户关联图谱;进行社区发现,将得到的用户关联图谱划分为若干区域。进一步的,所述用户关联图谱包括节点和边,每一个用户用一节点表示,构成频繁项集的用 ...
【技术保护点】
一种app用户聚类方法,其特征在于,所述app用户聚类方法包括以下步骤:获取多个用户的app列表,生成数据集,其中,所述数据集包括若干app名称以及安装有相应app的用户ID;按照预设的规则对所述数据集进行频繁项集的挖掘;根据挖掘的频繁项集构建用户关联图谱;进行社区发现,将得到的用户关联图谱划分为若干区域。
【技术特征摘要】
1.一种app用户聚类方法,其特征在于,所述app用户聚类方法包括以下步骤:获取多个用户的app列表,生成数据集,其中,所述数据集包括若干app名称以及安装有相应app的用户ID;按照预设的规则对所述数据集进行频繁项集的挖掘;根据挖掘的频繁项集构建用户关联图谱;进行社区发现,将得到的用户关联图谱划分为若干区域。2.如权利要求1所述的app用户聚类方法,其特征在于,所述用户关联图谱包括节点和边,每一个用户用一节点表示,构成频繁项集的用户之间通过边连接。3.如权利要求1所述的app用户聚类方法,其特征在于,对所述数据集进行频繁项集的挖掘时,安装同一app的不同用户构成一子项集,其中,定义频繁项集的方法如下:其中I表示数据集中的所有用户,X,Y分别为其中的两个不同用户,通过支持度Support(X,Y)来定义二者频繁出现的程度,支持度越大,说明{X,Y}共同出现得越频繁,反之越不频繁;P(X,Y)表示数据集中{X,Y}共同出现的概率,num(X,Y)表示{X,Y}共同出现的次数,num(I)表示用户总数。4.如权利要求1所述的app用户聚类方法,其特征在于,进行频繁项集的挖掘的方法包括Apriori算法或FP-tree算法。5.如权利要求1所述的app用户聚类方法,其特征在于,进行社区发现的方法包括Modularity算法。6.一种app用户聚类装置,其特征在于,所述聚类装置包括数据采集模块、数据挖掘模块、关联图...
【专利技术属性】
技术研发人员:张路,潘宣辰,
申请(专利权)人:武汉安天信息技术有限责任公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。