一种基于层次聚类的大型超市会员聚类方法技术

技术编号：15437968 阅读：102 留言：0更新日期：2017-05-26 03:57

本发明专利技术公开一种基于层次聚类的大型超市会员聚类方法包括：步骤1、获取大型超级会员数据；步骤2、对大型超级会员数据进行聚类计算；步骤3、经过聚类操作后会得K个类，每个类中都包含最终聚类后的会员数据，利用Java POI包将这K个类输出。采用本发明专利技术的技术方案，可以提升执行效率。

A clustering method for large supermarket members based on hierarchical clustering

The invention discloses a large supermarket member clustering method based on hierarchical clustering include: Step 1, access to a large super membership data; step 2, the super large membership data clustering calculation; step 3, the clustering operation will have K classes, each class contains the final clustering membership data, use the Java POI package will K output. By adopting the technical proposal of the invention, the execution efficiency can be improved.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于层次聚类的大型超市会员聚类方法
本专利技术属于计算机软件领域，尤其涉及一种基于层次聚类的大型超市会员聚类方法，进一步涉及基于集成了BisectingK-means和系统演化算法的层次聚类方法。
技术介绍
大型超级市场作为普通大众日常消费的场所，每日都会产生大量的消费数据。其中多数超市都有会员制，会员作为超市的重要消费者，如何从会员的消费行为数据中提取有价值的信息是超市决策者最为关心的问题之一。聚类分析是成为有效信息提取较为常用的方法。聚类分析是一个把数据对象划分成子集的过程。每个子集是一个类簇，使得类簇中的对象彼此相似，但与其他类簇中的对象又有不同之处。由聚类分析产生的类簇的集合称作一个聚类。聚类分析已经广泛地应用于商务智能在商务智能应用中，聚类分析可以用来把大量客户分组，其中组内的客户具有非常相似的特征，从而可以针对不同的客户分组开展有针对性工作，进行商品宣传和推广等。因此，对聚类算法的性能进行提升是非常必要的。其中层次聚类方法由于距离和规则的相似度容易定义；可以发现类的层次关系，所以也是常用的聚类方法。层次聚类算法的过程一般是首先将某个点作为单独的一个类簇(这里的点即为一条会员数据)，通过重复的计算比如单链接法或者全连接法等将所有点聚合成多个类簇，这种方法虽然简单但是执行效率不高。以本应用的会员聚类为例，超市中会员个数很多，产生的消费数据量也较大，不太适宜将单个会员作为一个类进而去一步一步地合并。当所有无序的点被划分成多个小的类簇后接下来需要对它们进行合并，目前在层次聚类方法中针对多个类簇进行合并的方法，主要是通过两两比较将类簇最相似的两个进行...
一种基于层次聚类的大型超市会员聚类方法

【技术保护点】
一种基于层次聚类的大型超市会员聚类方法，其特征在于，包括以下步骤：步骤1、获取大型超级会员数据；步骤2、对大型超级会员数据进行聚类计算，包括以下步骤：步骤2、1、基于误差项平方和(SSE)的数据划：首先需要确定最终划分后每个类簇中最多有多少个会员，然后将利用Bi sect ing K‑means将所有会员数据先分成多个子类簇并计算每块的SSE值，将其中SSE值较大的一些数据集进一步划分，直到所有经过划分的数据集中的会员个数小于等于设定最大会员数；步骤2、2、类簇判定聚合：当会员数据经过划分成多个类簇，基于系统演化算法判断两个类簇能否直接进行合并，即两组会员数据能否合并在一起，在进行计算时需要分别从两个参与判定的类簇中选取近邻区域和次近邻区域用作聚合计算，当满足聚合条件时，将两个类簇合并。否则不对两个类簇作合并操作，将二者继续与其他类簇进行聚合计算；步骤2、3、基于系统演化的层次聚类，利用系统演化算法中类簇聚合判定函数来计算已经划分好的类簇有哪些可以进行合并；当经过一轮聚合后仍存在两个类簇，则需要对已经合并的类簇再次进行聚合计算，以这种层次递进的方式检测是否还有类簇可以进行聚合，直到类簇...

【技术特征摘要】
1.一种基于层次聚类的大型超市会员聚类方法，其特征在于，包括以下步骤：步骤1、获取大型超级会员数据；步骤2、对大型超级会员数据进行聚类计算，包括以下步骤：步骤2、1、基于误差项平方和(SSE)的数据划：首先需要确定最终划分后每个类簇中最多有多少个会员，然后将利用BisectingK-means将所有会员数据先分成多个子类簇并计算每块的SSE值，将其中SSE值较大的一些数据集进一步划分，直到所有经过划分的数据集中的会员个数小于等于设定最大会员数；步骤2、2、类簇判定聚合：当会员数据经过划分成多个类簇，基于系统演化算法判断两个类簇能否直接进行合并，即两组会员数据能否合并在一起，在进行计算时需要分别从两个参与判定的类簇中选取近邻区域和次近邻区域用作聚合计算，当满足聚合条件时，...

【专利技术属性】
技术研发人员：王丹，吴浩同，付利华，杜金莲，苏航，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人