一种基于改进聚类算法的电网负荷数据挖掘方法技术

技术编号:37472084 阅读:15 留言:0更新日期:2023-05-06 09:54
本发明专利技术公开了一种基于改进聚类算法的电网负荷数据挖掘方法,所述方法包括:对待挖掘负荷历史数据进行染色体编码,得到染色体形式数据;划分染色体形式数据的初始种群;根据标准差分进化算法,对所述初始种群进行操作,输出最优的聚类中心;基于所述聚类中心,根据聚类算法,对待挖掘负荷历史数据进行聚类计算,输出聚类结果;根据聚类结果,挖掘待预测时期的负荷数据。本发明专利技术采用的动态自适应的交叉算法设计,有效地汲取了遗传算法优秀的全局搜索能力,克服了单纯K

【技术实现步骤摘要】
一种基于改进聚类算法的电网负荷数据挖掘方法


[0001]本专利技术涉及一种基于改进聚类算法的电网负荷数据挖掘方法,属于电力系统数据挖掘领域。

技术介绍

[0002]随着电网规模和电网容量的不断增大,电网调度控制的难度也随之增加。传统的分析与控制技术已经很难满足电网的安全稳定运行要求。如今,电网技术与人工智能、数据挖掘技术相结合,已经成为未来电网发展的主要趋势。数据挖掘技术可以从海量的电力数据中挖掘与电网安全稳定运行的相关知识,从而提高控制电网的能力。数据挖掘技术的核心在于机器学习方法,例如支持向量机、人工神经网络、深度学习等。数据挖掘方法能够在大量数据中去除噪声数据,提取出对目标有价值的信息,将数据挖掘应用在电网数据分析当中,通过分析电网中的设备,用电信息等数据,根据实际运行情况,分析出电网运行情况,为制定相关决策信息给出理论支持。一些研究人员提出采用SOM聚类算法对大数据进行降维处理,进行电网数据挖掘,实现数据的可视化挖掘。数据挖掘在电网的规划、评估、负荷预测及故障诊断等方面应用广泛,为电力系统的安全稳定运行提供了可靠保障。
[0003]K

means聚类算法采用迭代更新的思想,其基本思想为:首先指定需要划分的簇的个数k值,随机地选择k个初始数据对象作为初始聚类或簇的中心;然后计算其余的各个数据对象到这k个初始聚类中心的距离,并把数据对象划分到距离它最近的那个中心所在的簇类中;然后重新计算每个簇的中心作为下一次迭代的聚类中心。不断重复这个过程,直到各聚类中心不再变化时或者迭代达到规定的最大迭代次数时终止。迭代使得选取的聚类中心越来越接近真实的簇中心,所以聚类效果越来越好,最后把所有对象划分为k个簇;然而此类传统的K

means算法对聚类中心敏感,存在无法有效地确定K值、容易陷入局部最优等问题,从而导致挖掘的电网数据的价值密度低。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种基于改进聚类算法的电网负荷数据挖掘方法、系统、计算机设备及存储介质,其采用的动态自适应的交叉算法设计,有效地汲取了遗传算法优秀的全局搜索能力,克服了单纯K

means聚类算法容易陷入局部最优的难题,并且提升了算法收敛速度。最终实现了良好的聚类效果、精度高的聚类划分,并且具有较高的稳定性。
[0005]本专利技术的第一个目的在于提供一种基于改进聚类算法的电网负荷数据挖掘方法。
[0006]本专利技术的第二个目的在于提供一种基于改进聚类算法的电网负荷数据挖掘系统。
[0007]本专利技术的第三个目的在于提供一种计算机设备。
[0008]本专利技术的第四个目的在于提供一种存储介质。
[0009]本专利技术的第一个目的可以通过采取如下技术方案达到:
[0010]一种基于改进聚类算法的电网负荷数据挖掘方法,所述方法包括:
[0011]对待挖掘负荷历史数据进行染色体编码,得到染色体形式数据;
[0012]划分染色体形式数据的初始种群;
[0013]根据标准差分进化算法,对所述初始种群进行操作,输出最优的聚类中心;
[0014]基于所述聚类中心,根据聚类算法,对待挖掘负荷历史数据进行聚类计算,输出聚类结果;
[0015]根据聚类结果,挖掘待预测时期的负荷数据。
[0016]进一步的,在所述对待挖掘负荷历史数据进行染色体编码之前,还包括:
[0017]对待挖掘负荷历史数据进行归一化处理;
[0018]所述对待挖掘负荷历史数据进行染色体编码,得到染色体形式数据,包括:
[0019]根据浮点数编码方法,对待挖掘负荷历史数据进行编码处理,以转化为浮点数形式;
[0020]根据浮点数序列,构成染色体形式数据。
[0021]进一步的,所述划分染色体形式数据的初始种群,包括:
[0022]基于染色体形式数据,使用一维非线性混沌映射,生成混沌序列,进而得到种群;
[0023]根据反向学习方法,生成混沌序列个体的反向个体,进而得到反向种群;
[0024]根据适应度函数大小对合并的种群和反向种群进行降序排序,得到序列前半与种群规模相同的初始种群。
[0025]进一步的,所述适应度函数,如下式:
[0026]fitness=1/G
[0027][0028]其中,fitness表示适应度函数,G表示目标函数,m
j
(j=1,2,...,c)表示聚类中心,x
k
(k=1,2,...,n)表示合并后种群中的个体,n表示合并后种群的规模。
[0029]进一步的,所述对所述初始种群进行操作,输出最优的聚类中心,包括:
[0030]对所述初始种群进行选择操作、自适应交叉操作和变异操作;
[0031]将计算适应度函数所得到的最大适应度个体作为最优的聚类中心。
[0032]进一步的,在所述选择操作的过程中,个体x
i
的选择概率,如下式:
[0033][0034]其中,x
j
表示x
i
对应种群的父代种群中的个体,分母式为父代适应度函数的总和;
[0035]在所述自适应交叉操作的过程中,交叉概率P
c
,如下式:
[0036][0037]在所述变异操作的过程中,变异概率P
m
,如下式:
[0038][0039]上述两式中,f
max
表示种群中最大适应度值,f
avg
表示种群中平均适应度值;f

表示交叉的两个个体中较大的适应度值;f表示变异个体的适应度值;k1、k2、k3和k4取区间(0,1)的值。
[0040]进一步的,所述根据聚类结果,挖掘待预测时期的负荷数据,包括:
[0041]将聚类结果中的各个类设置为比较数列;
[0042]设待预测时期与各个类相关的数列为特征数列;
[0043]计算比较数列与特征数列之间的关联系数;
[0044]根据所述关联系数,计算比较数列和特征数列之间的关联度;
[0045]通过计算所述关联度,找出与待预测时期特征值相关联程度最大的类,从而挖掘待预测时期的负荷数据。
[0046]本专利技术的第二个目的可以通过采取如下技术方案达到:
[0047]一种基于改进聚类算法的电网负荷数据挖掘系统,所述系统包括:
[0048]编码单元,用于对待挖掘负荷历史数据进行染色体编码,得到染色体形式数据;
[0049]划分单元,用于划分染色体形式数据的初始种群;
[0050]迭代单元,用于根据标准差分进化算法,对所述初始种群进行操作,输出最优的聚类中心;
[0051]聚类单元,用于基于所述聚类中心,根据聚类算法,对待挖掘负荷历史数据进行聚类计算,输出聚类结果;
[0052]挖掘单元,用于根据聚类结果,挖掘待预测时期的负荷数据。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进聚类算法的电网负荷数据挖掘方法,其特征在于,所述方法包括:对待挖掘负荷历史数据进行染色体编码,得到染色体形式数据;划分染色体形式数据的初始种群;根据标准差分进化算法,对所述初始种群进行操作,输出最优的聚类中心;基于所述聚类中心,根据聚类算法,对待挖掘负荷历史数据进行聚类计算,输出聚类结果;根据聚类结果,挖掘待预测时期的负荷数据。2.根据权利要求1所述方法,其特征在于,在所述对待挖掘负荷历史数据进行染色体编码之前,还包括:对待挖掘负荷历史数据进行归一化处理;所述对待挖掘负荷历史数据进行染色体编码,得到染色体形式数据,包括:根据浮点数编码方法,对待挖掘负荷历史数据进行编码处理,以转化为浮点数形式;根据浮点数序列,构成染色体形式数据。3.根据权利要求1和2任一项所述方法,其特征在于,所述划分染色体形式数据的初始种群,包括:基于染色体形式数据,使用一维非线性混沌映射,生成混沌序列,进而得到种群;根据反向学习方法,生成混沌序列个体的反向个体,进而得到反向种群;根据适应度函数大小对合并的种群和反向种群进行降序排序,得到序列前半与种群规模相同的初始种群。4.根据权利要求3所述方法,其特征在于,所述适应度函数,如下式:fitness=1/G其中,fitness表示适应度函数,G表示目标函数,m
j
(j=1,2,...,c)表示聚类中心,x
k
(k=1,2,...,n)表示合并后种群中的个体,n表示合并后种群的规模。5.根据权利要求4所述方法,其特征在于,所述对所述初始种群进行操作,输出最优的聚类中心,包括:对所述初始种群进行选择操作、自适应交叉操作和变异操作;将计算适应度函数所得到的最大适应度个体作为最优的聚类中心。6.根据权利要求5所述方法,其特征在于,在所述选择操作的过程中,个体x
i
的选择概率,如下式:其中,x
...

【专利技术属性】
技术研发人员:龙云卢有飞刘璐豪梁雪青陈明辉张少凡邹时容赵宏伟吴任博张扬蔡燕春刘璇
申请(专利权)人:广东电网有限责任公司广州供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1