一种基于遗传算法改进的K-means算法的用电用户聚类方法技术

技术编号：17878986 阅读：34 留言：0更新日期：2018-05-06 00:47

本发明专利技术公开了一种基于遗传算法改进的K‑means算法的用电用户聚类方法，包括：对数据进行预处理并生成初始群体；计算数据的差异度，并随机选取k个点作为聚类中心并聚类；计算每个聚类的差异度；分别取每个聚类中心的坐标,聚类点平均值坐标点的个数作为特征，对K个聚类结果特征进行交叉变异，得到的新的子代作为候选的聚类结果的指标；计算聚类结果的适应度；由聚类适应度计算每个个体被选择的概率pi，筛选这一轮被选择的个体Xi并生成队列Yi；对队列Yi进行交叉运算形成新的群体X，若迭代次数满足300次则终止进化过程。本方法通过遗传算法改进始质点的分布位置来优化K‑means的最终聚类结果，通过多次进化修改初始的聚类中心点，使用电用户聚类结果更为可靠。

A user clustering method based on improved K-means algorithm based on genetic algorithm

The invention discloses an electric user clustering method based on the improved K means algorithm based on genetic algorithm, including: preprocessing data and generating initial group; calculating the difference degree of data and randomly selecting k points as cluster centers and clustering; calculating the difference degree of each cluster; taking the sitting of each cluster center respectively. The number of the coordinates of the average value of the cluster points is characterized, and the characteristics of the K clustering results are crossed and mutable. The new progeny of the clustering results is used as the index of the candidate clustering results; the fitness of the clustering results is calculated; the probability of each individual selected by the clustering fitness is calculated by the clustering fitness, and the selected individual Xi is selected and generated. The queue Yi; crosses the queue Yi to form a new population X; if the number of iterations satisfies 300 times, the evolution process is terminated. This method optimizes the final clustering result of K means by improving the distribution position of the initial particle by genetic algorithm. The result is more reliable by modifying the initial cluster center points by multiple evolution.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于遗传算法改进的K-means算法的用电用户聚类方法
本专利技术涉及电力用户用电行为分析
，具体涉及一种基于遗传算法改进的K-means算法的用电用户聚类方法。
技术介绍
随着大数据时代的到来，电力营销数据也成为电力企业发展过程中的重要财富。针对用电用户数据进行聚类手段的挖掘，可以节能减排，可以提高电力系统的运行效率。用电用户细分是电力企业实施客户管理中的重要方面，建立合理、高效的电力用户类型，不仅可以帮助电力企业识别用户群体的特征，更可以结合用户群体的特征，更人性的制定适合用户群体的供电以及电力用户方案，让电力用户获得更好的体验感。传统的人为主观聚类方法，工作效率低，数据潜在的规律和特征不能挖掘出来，聚类结果也往往不够精确。原始的K-means方法用于电力用户聚类，需要随机给定质心，或人为给定质心，电力用户聚类结果差异大、容易陷入局部最优。
技术实现思路
本专利技术为了解决上述技术问题提供一种基于遗传算法改进的K-means算法的用电用户聚类方法。本专利技术通过下述技术方案实现：一种基于遗传算法改进的K-means算法的用电用户聚类方法，包括以下步骤，A...

【技术保护点】
一种基于遗传算法改进的K‑means算法的用电用户聚类方法，其特征在于，包括以下步骤，A、对数据进行预处理并生成初始群体；B、计算数据的差异度作为初始种群的特征，并随机选取k个点作为聚类中心，根据聚类中心对数据进行聚类；C计算每个聚类的差异度；D、分别取每个聚类中心的坐标，聚类点平均值坐标，点的个数作为特征，对k个聚类结果特征进行交叉变异，得到的新的子代作为候选的聚类结果的指标；E、计算聚类结果的适应度；F、由聚类适应度计算每个个体被选择的概率pi，筛选这一轮被选择的个体Xi并生成队列Yi；G、对队列Yi进行交叉运算形成新的群体X，若迭代次数满足300次则终止进化过程；H、重复步骤C～F。

【技术特征摘要】
1.一种基于遗传算法改进的K-means算法的用电用户聚类方法，其特征在于，包括以下步骤，A、对数据进行预处理并生成初始群体；B、计算数据的差异度作为初始种群的特征，并随机选取k个点作为聚类中心，根据聚类中心对数据进行聚类；C计算每个聚类的差异度；D、分别取每个聚类中心的坐标，聚类点平均值坐标，点的个数作为特征，对k个聚类结果特征进行交叉变异，得到的新的子代作为候选的聚类结果的指标；E、计算聚类结果的适应度；F、由聚类适应度计算每个个体被选择的概率pi，筛选这一轮被选择的个体Xi并生成队列Yi；G、对队列Yi进行交叉运算形成新的群体X，若迭代次数满足300次则终止进化过程；H、重复步骤C～F。2.根据权利要求1所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法，其特征在于，所述数据预处理包括清理数据集中错误、数据格式不完整的数据。3.根据权利要求2所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法，其特征在于，所述清理的方法具体为：删除集中错误数据、采用插值法补齐格式不完整数据。4.根据权利要求1所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法，其特征在于，所述生成初始群体的方法为：对每个个体的染色体进行编码，编码为{X11、X21、…Xm1、X12、X22…Xm2、…X1k、X2k…Xmk}，其中，K为聚类中心的个数，m为每个个体的染色体的维度；每条染色体随机从数据集中抽取一个m维的数据；生成初始群体X。5.根据权利要求4所述的一种基于遗传算法改进的K-eans算法的用电用户聚类方法，...

【专利技术属性】
技术研发人员：刘捷，潘可佳，杨懿，杨开琼，张程，
申请(专利权)人：国网四川省电力公司信息通信公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人