一种基于遗传算法改进的K-means算法的用电用户聚类方法技术

技术编号:17878986 阅读:34 留言:0更新日期:2018-05-06 00:47
本发明专利技术公开了一种基于遗传算法改进的K‑means算法的用电用户聚类方法,包括:对数据进行预处理并生成初始群体;计算数据的差异度,并随机选取k个点作为聚类中心并聚类;计算每个聚类的差异度;分别取每个聚类中心的坐标,聚类点平均值坐标点的个数作为特征,对K个聚类结果特征进行交叉变异,得到的新的子代作为候选的聚类结果的指标;计算聚类结果的适应度;由聚类适应度计算每个个体被选择的概率pi,筛选这一轮被选择的个体Xi并生成队列Yi;对队列Yi进行交叉运算形成新的群体X,若迭代次数满足300次则终止进化过程。本方法通过遗传算法改进始质点的分布位置来优化K‑means的最终聚类结果,通过多次进化修改初始的聚类中心点,使用电用户聚类结果更为可靠。

A user clustering method based on improved K-means algorithm based on genetic algorithm

The invention discloses an electric user clustering method based on the improved K means algorithm based on genetic algorithm, including: preprocessing data and generating initial group; calculating the difference degree of data and randomly selecting k points as cluster centers and clustering; calculating the difference degree of each cluster; taking the sitting of each cluster center respectively. The number of the coordinates of the average value of the cluster points is characterized, and the characteristics of the K clustering results are crossed and mutable. The new progeny of the clustering results is used as the index of the candidate clustering results; the fitness of the clustering results is calculated; the probability of each individual selected by the clustering fitness is calculated by the clustering fitness, and the selected individual Xi is selected and generated. The queue Yi; crosses the queue Yi to form a new population X; if the number of iterations satisfies 300 times, the evolution process is terminated. This method optimizes the final clustering result of K means by improving the distribution position of the initial particle by genetic algorithm. The result is more reliable by modifying the initial cluster center points by multiple evolution.

【技术实现步骤摘要】
一种基于遗传算法改进的K-means算法的用电用户聚类方法
本专利技术涉及电力用户用电行为分析
,具体涉及一种基于遗传算法改进的K-means算法的用电用户聚类方法。
技术介绍
随着大数据时代的到来,电力营销数据也成为电力企业发展过程中的重要财富。针对用电用户数据进行聚类手段的挖掘,可以节能减排,可以提高电力系统的运行效率。用电用户细分是电力企业实施客户管理中的重要方面,建立合理、高效的电力用户类型,不仅可以帮助电力企业识别用户群体的特征,更可以结合用户群体的特征,更人性的制定适合用户群体的供电以及电力用户方案,让电力用户获得更好的体验感。传统的人为主观聚类方法,工作效率低,数据潜在的规律和特征不能挖掘出来,聚类结果也往往不够精确。原始的K-means方法用于电力用户聚类,需要随机给定质心,或人为给定质心,电力用户聚类结果差异大、容易陷入局部最优。
技术实现思路
本专利技术为了解决上述技术问题提供一种基于遗传算法改进的K-means算法的用电用户聚类方法。本专利技术通过下述技术方案实现:一种基于遗传算法改进的K-means算法的用电用户聚类方法,包括以下步骤,A、对数据进行预处理并本文档来自技高网...

【技术保护点】
一种基于遗传算法改进的K‑means算法的用电用户聚类方法,其特征在于,包括以下步骤,A、对数据进行预处理并生成初始群体;B、计算数据的差异度作为初始种群的特征,并随机选取k个点作为聚类中心,根据聚类中心对数据进行聚类;C计算每个聚类的差异度;D、分别取每个聚类中心的坐标,聚类点平均值坐标,点的个数作为特征,对k个聚类结果特征进行交叉变异,得到的新的子代作为候选的聚类结果的指标;E、计算聚类结果的适应度;F、由聚类适应度计算每个个体被选择的概率pi,筛选这一轮被选择的个体Xi并生成队列Yi;G、对队列Yi进行交叉运算形成新的群体X,若迭代次数满足300次则终止进化过程;H、重复步骤C~F。

【技术特征摘要】
1.一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,包括以下步骤,A、对数据进行预处理并生成初始群体;B、计算数据的差异度作为初始种群的特征,并随机选取k个点作为聚类中心,根据聚类中心对数据进行聚类;C计算每个聚类的差异度;D、分别取每个聚类中心的坐标,聚类点平均值坐标,点的个数作为特征,对k个聚类结果特征进行交叉变异,得到的新的子代作为候选的聚类结果的指标;E、计算聚类结果的适应度;F、由聚类适应度计算每个个体被选择的概率pi,筛选这一轮被选择的个体Xi并生成队列Yi;G、对队列Yi进行交叉运算形成新的群体X,若迭代次数满足300次则终止进化过程;H、重复步骤C~F。2.根据权利要求1所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,所述数据预处理包括清理数据集中错误、数据格式不完整的数据。3.根据权利要求2所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,所述清理的方法具体为:删除集中错误数据、采用插值法补齐格式不完整数据。4.根据权利要求1所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,所述生成初始群体的方法为:对每个个体的染色体进行编码,编码为{X11、X21、…Xm1、X12、X22…Xm2、…X1k、X2k…Xmk},其中,K为聚类中心的个数,m为每个个体的染色体的维度;每条染色体随机从数据集中抽取一个m维的数据;生成初始群体X。5.根据权利要求4所述的一种基于遗传算法改进的K-eans算法的用电用户聚类方法,...

【专利技术属性】
技术研发人员:刘捷潘可佳杨懿杨开琼张程
申请(专利权)人:国网四川省电力公司信息通信公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1