一种查找价值用户的数据处理方法和系统技术方案

技术编号:16188216 阅读:48 留言:0更新日期:2017-09-12 11:26
本发明专利技术提供一种查找价值用户的数据处理方法和系统,其方法包括:以用户名为行、RFM业务指标为列来构建数据分析列表;根据每个用户的RFM业务指标以及设定的划分阈值将数据分析列表中的数据划分为主体用户数据、高价值用户数据和异常用户数据;将高价值用户数据和异常用户数据滤除,保留主体用户数据;根据kmeans聚类方法对主体用户数据聚类处理,得到多个聚类簇;根据AHP层次分析法对聚类中心进行量化价值计算,根据量化价值的高低将主体用户数据进行归类,得到价值用户的种类。本发明专利技术采用RFM业务指标来从全局上考虑数据维度,并采用kmeans聚类方法,使数据自行成簇,避免了维度考虑单一的问题及人为造成的误差影响,从而提高工作效率。

Data processing method and system for finding value users

The present invention provides a search value of user data processing method and system, the method includes: user name, RFM index of business column to build data analysis list; according to each user's RFM business division index and threshold setting data analysis in the list of data into main user data, high value users abnormal data and user data; the high value of user data and abnormal user data filtering, retain user data according to the subject; kmeans clustering method to the subject user data clustering, get multiple clusters; according to the AHP level analysis method to quantify the clustering center value, according to the quantitative value will be the main user data classification get the user value, type. The invention adopts RFM business indicators to consider data from the global dimension, and by using the kmeans clustering method, the data by clustering, avoids the influence of single dimension to consider the problems and errors caused by human factors, so as to improve work efficiency.

【技术实现步骤摘要】
一种查找价值用户的数据处理方法和系统
本专利技术主要涉及数据分析
,具体涉及一种查找价值用户的数据处理方法和系统。
技术介绍
传统划分用户价值的方法是基于个人主观将不同维度的数据划分范围,然后加以组合,形成新的维度;传统划分方法有其自身的局限性:1.在分析过程中,遇到划分数据范围的问题时,往往凭借其中一个维度进行筛选,而不能多个维度同时考虑,影响结论准确;2.当数据量大,数据较复杂时,用传统的划分方法,会增加分析人员的负担,增加执行成本。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术的不足,提供一种查找价值用户的数据处理方法和系统。本专利技术解决上述技术问题的技术方案如下:一种查找价值用户的数据处理方法,包括如下步骤:步骤S1:以用户名为行、RFM业务指标为列来构建数据分析列表;步骤S2:根据每个用户的RFM业务指标以及设定的划分阈值将数据分析列表中的数据划分为主体用户数据、高价值用户数据和异常用户数据三部分;步骤S3:将高价值用户数据和异常用户数据滤除,保留主体用户数据;步骤S4:根据kmeans聚类方法对主体用户数据聚类处理,得到多个聚类簇,每个聚类簇包括一个聚类中本文档来自技高网...
一种查找价值用户的数据处理方法和系统

【技术保护点】
一种查找价值用户的数据处理方法,其特征在于,包括如下步骤:步骤S1:以用户名为行、RFM业务指标为列来构建数据分析列表;步骤S2:根据每个用户的RFM业务指标以及设定的划分阈值将数据分析列表中的数据划分为主体用户数据、高价值用户数据和异常用户数据;步骤S3:将高价值用户数据和异常用户数据滤除,保留主体用户数据;步骤S4:根据kmeans聚类方法对主体用户数据聚类处理,得到多个聚类簇,每个聚类簇包括一个聚类中心;步骤S5:根据AHP层次分析法对聚类中心进行量化价值计算,根据量化价值的高低将主体用户数据进行归类,得到价值用户的种类。

【技术特征摘要】
1.一种查找价值用户的数据处理方法,其特征在于,包括如下步骤:步骤S1:以用户名为行、RFM业务指标为列来构建数据分析列表;步骤S2:根据每个用户的RFM业务指标以及设定的划分阈值将数据分析列表中的数据划分为主体用户数据、高价值用户数据和异常用户数据;步骤S3:将高价值用户数据和异常用户数据滤除,保留主体用户数据;步骤S4:根据kmeans聚类方法对主体用户数据聚类处理,得到多个聚类簇,每个聚类簇包括一个聚类中心;步骤S5:根据AHP层次分析法对聚类中心进行量化价值计算,根据量化价值的高低将主体用户数据进行归类,得到价值用户的种类。2.根据权利要求1所述的查找价值用户的数据处理方法,其特征在于,所述数据分析列表为n*3的列表,其中n行分别为n个用户名,3列为每个用户名对应R指标、F指标和M指标;所述RFM业务指标包括R指标、F指标和M指标,R指标为用户最近充值日期至设定日期之间的间隔天数,F指标为用户在充值天数内成功充值的次数,M指标为用户在充值天数内成功充值的金额。3.根据权利要求1所述的查找价值用户的数据处理方法,其特征在于,所述设定的划分阈值包括第一划分阈值和第二划分阈值,第一划分阈值为主体用户与高价值用户间的划分阈值,第二划分阈值为高价值用户与异常用户间的划分阈值。4.根据权利要求1所述的查找价值用户的数据处理方法,其特征在于,所述步骤S5具体包括:步骤S501:根据AHP层次分析法分别对聚类中心进行加权计算处理,得到各聚类簇的量化价值;步骤S502:根据预设的业务分类数值和各聚类簇的量化价值的高低将各聚类簇归类处理,得到主体用户数据的高价值聚类簇和低价值聚类簇。5.根据权利要求4所述的查找价值用户的数据处理方法,其特征在于,所述步骤S5还包括步骤S503:将得到的高价值聚类簇和低价值聚类簇重复执行步骤S501加权计算处理和步骤S502归类处理,得到主体用户数据最终的高价值聚类簇和低价值聚类簇。6.一种查找价值用户的数...

【专利技术属性】
技术研发人员:朱波
申请(专利权)人:北京思特奇信息技术股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1