The invention discloses an electric user clustering method based on the improved K means algorithm based on genetic algorithm, including: preprocessing data and generating initial group; calculating the difference degree of data and randomly selecting k points as cluster centers and clustering; calculating the difference degree of each cluster; taking the sitting of each cluster center respectively. The number of the coordinates of the average value of the cluster points is characterized, and the characteristics of the K clustering results are crossed and mutable. The new progeny of the clustering results is used as the index of the candidate clustering results; the fitness of the clustering results is calculated; the probability of each individual selected by the clustering fitness is calculated by the clustering fitness, and the selected individual Xi is selected and generated. The queue Yi; crosses the queue Yi to form a new population X; if the number of iterations satisfies 300 times, the evolution process is terminated. This method optimizes the final clustering result of K means by improving the distribution position of the initial particle by genetic algorithm. The result is more reliable by modifying the initial cluster center points by multiple evolution.
【技术实现步骤摘要】
一种基于遗传算法改进的K-means算法的用电用户聚类方法
本专利技术涉及电力用户用电行为分析
,具体涉及一种基于遗传算法改进的K-means算法的用电用户聚类方法。
技术介绍
随着大数据时代的到来,电力营销数据也成为电力企业发展过程中的重要财富。针对用电用户数据进行聚类手段的挖掘,可以节能减排,可以提高电力系统的运行效率。用电用户细分是电力企业实施客户管理中的重要方面,建立合理、高效的电力用户类型,不仅可以帮助电力企业识别用户群体的特征,更可以结合用户群体的特征,更人性的制定适合用户群体的供电以及电力用户方案,让电力用户获得更好的体验感。传统的人为主观聚类方法,工作效率低,数据潜在的规律和特征不能挖掘出来,聚类结果也往往不够精确。原始的K-means方法用于电力用户聚类,需要随机给定质心,或人为给定质心,电力用户聚类结果差异大、容易陷入局部最优。
技术实现思路
本专利技术为了解决上述技术问题提供一种基于遗传算法改进的K-means算法的用电用户聚类方法。本专利技术通过下述技术方案实现:一种基于遗传算法改进的K-means算法的用电用户聚类方法,包括以下步骤,A ...
【技术保护点】
一种基于遗传算法改进的K‑means算法的用电用户聚类方法,其特征在于,包括以下步骤,A、对数据进行预处理并生成初始群体;B、计算数据的差异度作为初始种群的特征,并随机选取k个点作为聚类中心,根据聚类中心对数据进行聚类;C计算每个聚类的差异度;D、分别取每个聚类中心的坐标,聚类点平均值坐标,点的个数作为特征,对k个聚类结果特征进行交叉变异,得到的新的子代作为候选的聚类结果的指标;E、计算聚类结果的适应度;F、由聚类适应度计算每个个体被选择的概率pi,筛选这一轮被选择的个体Xi并生成队列Yi;G、对队列Yi进行交叉运算形成新的群体X,若迭代次数满足300次则终止进化过程;H、重复步骤C~F。
【技术特征摘要】
1.一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,包括以下步骤,A、对数据进行预处理并生成初始群体;B、计算数据的差异度作为初始种群的特征,并随机选取k个点作为聚类中心,根据聚类中心对数据进行聚类;C计算每个聚类的差异度;D、分别取每个聚类中心的坐标,聚类点平均值坐标,点的个数作为特征,对k个聚类结果特征进行交叉变异,得到的新的子代作为候选的聚类结果的指标;E、计算聚类结果的适应度;F、由聚类适应度计算每个个体被选择的概率pi,筛选这一轮被选择的个体Xi并生成队列Yi;G、对队列Yi进行交叉运算形成新的群体X,若迭代次数满足300次则终止进化过程;H、重复步骤C~F。2.根据权利要求1所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,所述数据预处理包括清理数据集中错误、数据格式不完整的数据。3.根据权利要求2所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,所述清理的方法具体为:删除集中错误数据、采用插值法补齐格式不完整数据。4.根据权利要求1所述的一种基于遗传算法改进的K-means算法的用电用户聚类方法,其特征在于,所述生成初始群体的方法为:对每个个体的染色体进行编码,编码为{X11、X21、…Xm1、X12、X22…Xm2、…X1k、X2k…Xmk},其中,K为聚类中心的个数,m为每个个体的染色体的维度;每条染色体随机从数据集中抽取一个m维的数据;生成初始群体X。5.根据权利要求4所述的一种基于遗传算法改进的K-eans算法的用电用户聚类方法,...
【专利技术属性】
技术研发人员:刘捷,潘可佳,杨懿,杨开琼,张程,
申请(专利权)人:国网四川省电力公司信息通信公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。