一种对负荷数据进行处理的优化方法技术

技术编号:17734353 阅读:71 留言:0更新日期:2018-04-18 11:40
本发明专利技术公开了一种对负荷数据进行处理的优化方法,通过计算聚类的有效性指标,在聚类数搜索范围内给出最优的聚类数目

An optimization method for processing load data

The invention discloses an optimization method for processing load data. By calculating the validity index of clustering, it gives the optimal number of clusters in the search range of clustering number.

【技术实现步骤摘要】
一种对负荷数据进行处理的优化方法
本专利技术涉及电力系统工程
,尤其涉及一种对负荷数据进行处理的优化方法。
技术介绍
电力负荷预测是电力系统日常运行中的一项重要工作,精确的负荷预测对电力系统经济、可靠的负荷调整和管理起着十分重要的作用。然而对历史负荷数据进行有效的处理,是负荷预测更加精确的前提。聚类分析作为数据挖掘中的一种重要无监督模式,大致可以分为以下几类方法:基于划分的聚类方法、基于层次的聚类方法、基于网格的聚类方法、基于密度的聚类方法等。其中,基于划分的聚类算法一般采用k-means算法,k-means算法是一种由于易行、高效等优点,在处理负荷历史数据中得到了广泛的应用。针对k-means算法受初始聚类中心的制约,易出现不稳定聚类结果的问题,有人提出一种基于差分进化的k-means算法。其中,差分进化算法作为一种基于种群差异的启发式搜索算法,作为一种优化算法,与遗传算法等优化算法类似,同样具有交叉、变异和选择等操作,差分进化算法的原理简单,收敛速度快,受控参数较少,全局寻优能力突出,并且其特有的差分变异操作可保证种群的多样性,可以使种群朝着更好的方向衍化。差分进化算法在进行优化搜索的过程中,采用实数编码形式,经过差分变异操作和一对一的竞争策略,降低了进化操作的复杂性。k-means算法首先基于差分进化算法,提出一种新的获得更好初始聚类中心的方法,但是基于差分进化的初始中心选择的基本思想是首先从数据样本中随机选取k个样本作为一组聚类中心,选取的初始聚类中心虽然相对于传统的k-means聚类选出的初始聚类中心要更加稳定。但是,未检验聚类结果的有效性且在处理负荷数据上并没有得到应用,故这些在处理负荷历史数据上并没有达到理想。为了得到稳定的聚类结果,提高聚类精度进行k-means聚类。因此,既要稳定选取的聚类中心,也要检验聚类结果是否有效。如果这两项均符合,从而提高了聚类的精度,对处理历史负荷数据更加准确,这对电力负荷预测有着重要的意义。
技术实现思路
本专利技术的目的是提供一种对负荷数据进行处理的优化方法,采取基于改进的差分进化k-means算法进行聚类分析,提高系统历史负荷数据的处理精度,同时满足实时性要求。本专利技术采用的技术方案为:一种对负荷数据进行处理的优化方法,包括以下步骤:A:建立检验聚类结果有效性的模型,得到历史负荷数据的最佳聚类结果;A1:建立检验聚类结果有效性的模型:假设数据集样本总数为N,则聚类数的有效搜索范围为内的整数,选择伪F-统计指标,即PFS指标,作为不同聚类结果的评价指标;PFS指标是来自方差分析的一个统计量,对于一个不为零的P维变量样本,其定义如下:其中,k为需要确定聚类中心的样本个数,tr(sWp)为样本类内散布矩阵的迹,tr(sBp)为样本类间散布矩阵的迹,随着k值的增大,tr(sBp)随之上升,tr(sWp)随之下降,PFS有效性指标在某一个k处达到最优,PFS值最大时对应最佳聚类结果;即当PFS值最大,对应的聚类数k达到最优,则选取k类输出,即对历史负荷数据分成k类处理;B:建立基于改进的差分进化的k-means聚类的模型;B1:初始化种群从样本数据中随机选取k个样本作为一组聚类中心,k的选择由步骤A中确定的最优k值为准,重复执行Np次,选取Np组聚类中心;Np为种群规模,代表Np个个体,并且每个Np个体中包含k个样本组成的一组聚类中心;定义一个Np×D的矩阵X来保存种群的数据,并采用实数编码方式,构造初始种群;其中,D用来表示优化问题的维数,也被称作每个个体的基因位,一组聚类中心相当于一个基因位;初始化种群时,取进化代数g=0,具体实数编码方式如下:Xj(0)=(xj1,xj2,...,xjk)(2)其中,j=1,2,...,Np,Xj(0)表示初始种群的第j个个体,xji(i=1,2,...,k)表示第j个个体的第k个基因;假设样本数据为d维,那么种群的每个个体是k×d=D维向量;B2:变异操作按照个体的基因位D进行变异操作,从当前种群Xj(g)中随机选取三个个体,分别为Xa(g),Xb(g),Xc(g),且a≠b≠c≠j,并根据公式(3)求得变异个体Vj(g')=(vj1(g'),vj2(g'),...vjD(g')),且g‘=g+1;种群中的每个个体的基因位如公式(3):vji(g+1)=xai(g)+α(xbi(g)-xci(g))(3)其中,i=1,2,...,k,α∈[0,1]为缩放系数;B3:交叉操作经过变异后的个体vji(g+1)和当前个体Xj(g)进行交叉操作,得到中间个体Mj(g+1)=(mj1(g+1),mj2(g+1),...,mjk(g+1)),那么该中间个体的第i个分量如公式(4)表示:其中CR为交叉概率,且CR∈[0,1],β为0-1间满足均匀分布且随机产生的一个数,γ为[1,k]之间随机产生的一个整数;B4:选择操作比较当前进化个体Xj(g)与其对应的中间试验个体Mj(g+1)的适度值,并采用贪婪算法择优选取一个个体进入下一代种群;择优选取的个体产生的新一代的种群X(g+1),即为改进的差分进化的k-means聚类的模型;C:步骤B中改进的k-means聚类算法在聚类数的搜索范围内,对各聚类结果进行聚类有效性指标的计算且聚类中心稳定,选择对应的PFS指标数值最大的聚类数作为最佳聚类个数,从而得到最佳负荷历史数据的处理方法本专利技术以处理历史数据为前提,考虑对大量数据处理、数据归一化等因素,首先建立检验聚类结果有效性的模型,确定历史负荷数据的最佳聚类结果;再将最佳聚类结果应用到差分进化的K-means聚类算法中,对历史数据进行预处理,基于差分进化的K-means聚类算法,形成改进的差分进化的k-means聚类算法,求解负荷历史数据模型,得到对负荷数据进行处理的结果并进行验证。本专利技术适应于电力系统规划、计划、用电、调度发展趋势,可以提高负荷预测的精度及调度精确性,用户用电更经济安全,实现负荷输出成本的最低。附图说明图1为本专利技术的具体流程图。具体实施方式如图1所示,本专利技术为对负荷数据进行处理的优化方法,包括以下步骤:A:建立检验聚类结果有效性的模型,得到历史负荷数据的最佳聚类结果;A1:建立检验聚类结果有效性的模型:假设数据集样本总数为N,则聚类数的有效搜索范围为内的整数,选择伪F-统计指标,即PFS指标,作为不同聚类结果的评价指标;PFS指标是来自方差分析的一个统计量,对于一个不为零的P维变量样本,其定义如下:其中,k为待确定聚类中心的样本个数,tr(sWp)为样本类内散布矩阵的迹,tr(sBp)为样本类间散布矩阵的迹,随着k值的增大,tr(sBp)随之上升,tr(sWp)随之下降,PFS有效性指标在某一个k处达到最优,PFS值最大时对应最佳聚类结果;即当PFS值最大,对应的聚类数k达到最优,则选取k类输出,即对历史负荷数据分成k类处理;B:建立基于改进的差分进化的k-means聚类的模型;B1:初始化种群从样本数据中随机选取k个样本作为一组聚类中心,k的选择由步骤A中确定的最优k值为准,重复执行Np次,选取Np组聚类中心;Np为种群规模,代表Np个个体,并且每个Np个体中包含k个样本组成的一组聚类中心;定义一个Np×D的矩阵X来保本文档来自技高网
...
一种对负荷数据进行处理的优化方法

【技术保护点】
一种对负荷数据进行处理的优化方法,其特征在于:包括以下步骤:A:建立检验聚类结果有效性的模型,得到历史负荷数据的最佳聚类结果;A1:建立检验聚类结果有效性的模型:假设数据集样本总数为N,则聚类数的有效搜索范围为

【技术特征摘要】
1.一种对负荷数据进行处理的优化方法,其特征在于:包括以下步骤:A:建立检验聚类结果有效性的模型,得到历史负荷数据的最佳聚类结果;A1:建立检验聚类结果有效性的模型:假设数据集样本总数为N,则聚类数的有效搜索范围为内的整数,选择伪F-统计指标,即PFS指标,作为不同聚类结果的评价指标;PFS指标是来自方差分析的一个统计量,对于一个不为零的P维变量样本,其定义如下:其中,k为需要确定聚类中心的样本个数,tr(sWp)为样本类内散布矩阵的迹,tr(sBp)为样本类间散布矩阵的迹,随着k值的增大,tr(sBp)随之上升,tr(sWp)随之下降,PFS有效性指标在某一个k处达到最优,PFS值最大时对应最佳聚类结果;即当PFS值最大,对应的聚类数k达到最优,则选取k类输出,即对历史负荷数据分成k类处理;B:建立基于改进的差分进化的k-means聚类的模型;B1:初始化种群从样本数据中随机选取k个样本作为一组聚类中心,k的选择由步骤A中确定的最优k值为准,重复执行Np次,选取Np组聚类中心;Np为种群规模,代表Np个个体,并且每个Np个体中包含k个样本组成的一组聚类中心;定义一个Np×D的矩阵X来保存种群的数据,并采用实数编码方式,构造初始种群;其中,D用来表示优化问题的维数,也被称作每个个体的基因位,一组聚类中心相当于一个基因位;初始化种群时,取进化代数g=0,具体实数编码方式如下:Xj(0)=(xj1,xj2,...,xjk)(2)其中,j=1,2,...,Np,Xj(0)表示初始种群的第j个个体,xji(i=1,2,...,k)表示第j个个体的第k个基因;假设样本数据为d维,那么种群的每个个体是k×...

【专利技术属性】
技术研发人员:李朝晖杨海晶石光马瑞滕卫军韩伟王骅龚人杰孙亮
申请(专利权)人:国网河南省电力公司电力科学研究院长沙理工大学国家电网公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1