一种电网供电可靠性水平聚类方法及系统技术方案

技术编号:21274076 阅读:32 留言:0更新日期:2019-06-06 08:17
本发明专利技术涉及一种电网供电可靠性水平聚类方法及系统,包括:选取影响供电可靠性的因素建立指标集;采用相关系数显著性校验从指标集中确定最终聚类指标;对最终聚类指标进行聚类分析,得到供电可靠性水平分类的聚类结果;根据所述聚类结果对描述供电可靠性水平的基础数据进行优化。本发明专利技术在聚类前对指标集就进行了一系列处理,对数据相关系数计算后进行了相关系数显著性校验并增加了辅助判别,即主成分析,不但降低维度,也在一定的程度上增加可信度。

【技术实现步骤摘要】
一种电网供电可靠性水平聚类方法及系统
本专利技术涉及一种聚类方法,具体涉及一种电网供电可靠性水平聚类方法及系统。
技术介绍
K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用误差平方和准则函数作为聚类准则函数。K-means算法属于非监督学习方法。此算法以k为参数,把n个对象分为k个簇,以使簇内具有较高的相似度,而且簇间的相似度较低。相似度的计算根据一个簇中对象的平均值(被看作簇的重心)来进行。此算法首先随机选择k个对象,每个对象代表一个聚类的质心。对于其余的每一个对象,根据该对象与各聚类质心之间的距离,把它分配到与之最相似的聚类中。然后,计算每个聚类的新质心。重复上述过程,直到准则函数收敛。K-means算法是一种较典型的逐点修改迭代的动态聚类算法,其要点是以误差平方和为准则函数。逐点修改类中心:一个象元样本按某一原则,归属于某一组类后,就要重新计算这个组类的均值,并且以新的均值作为凝聚中心点进行下一次象元素聚类;逐批修改类中心:在全部象元样本按某一组的类中心分类之后,再计算修改各类的均值,作为下一次分类的凝聚中心点。K-means算法对大数据集有较高的效率并且是可伸缩性的;时间复杂度近于线性,算法简洁、快速;而且适合挖掘大规模数据集等优点。但该算法也存在以下问题:1、该需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量大、维度多,算法的时间开销是非常大的。且当类与类之间相似度较小时,此方法效果较差。2、在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化。这个初始聚类中心的选择对聚类结果有较大的影响,一旦初始值选择的不好,可能无法得到有效的聚类结果,这也成为K-means算法的一个主要问题。对于该问题的解决,许多算法采用遗传算法(GA),例如文献中采用遗传算法(GA)进行初始化,以内部聚类准则作为评价指标,但是效果却不尽人意。
技术实现思路
为解决上述现有技术中的不足,本专利技术的目的是提供一种电网供电可靠性水平聚类方法及系统,在聚类数据量大、因子多时给出了实用化的处理,其有效性通过供电可靠性水平聚类问题的算例得到了验证。本专利技术的目的是采用下述技术方案实现的:本专利技术提供一种电网供电可靠性水平优化方法,其改进之处在于:选取影响供电可靠性的因素建立指标集;采用相关系数显著性校验从指标集中确定最终聚类指标;对最终聚类指标进行聚类分析,得到供电可靠性水平分类的聚类结果;根据所述聚类结果对描述供电可靠性水平的基础数据进行优化。进一步地:所述指标集按可靠性水平划分包括基础数据,所述基础数据包括区域特征、经济水平、负荷电量情况、网架结构及运行情况、设备情况和技术管理水平指标。进一步地:所述采用相关系数显著性校验从指标集中确定聚类指标,包括:对指标集中的基础数据进行预处理;对预处理后指标集中的指标采用主成分分析法进行相关系数显著性校验;形成最终聚类指标。进一步地:采用主成分分析法进行相关系数显著性校验,包括:确定预处理后指标集中第一主成分;依次确定第二主成分,第三主成分,第四主成分,……,第P个主成分,p表示指标集中的指标个数。进一步地:所述确定预处理后指标集中第一主成分包括:所述第一主成分指标用选取的第一个线性组合F1的方差Va(rF1)表示,当Va(rF1)最大时,第一个线性组合F1为第一主成分;所述第一线性组合为预处理后指标集中多个具有相关性的指标,重新组合成一组新的互相无关的综合指标进行线性组合得到的。进一步地:所述依次确定第二主成分,第三主成分,第四主成分,……,第P个主成分,包括:如果第一主成分F1不足以代表原来P个指标的信息,选取第二个线性组合F2,第一主成分F1已有的信息不出现在第二个线性组合F2中,用数学表达式表示为Cov(F1,F2)=0,则称第二个线性组合F2为第二主成分;依此类推构造出第三、第四,……,第P个主成分。进一步地:所述最终聚类指标为第一主成分、第二主成分、第三主成分、......、第P主成分的集合m。进一步地:所述对最终聚类指标进行聚类分析,得到供电可靠性水平分类的聚类结果包括:采用K-means算法的代价函数对最终聚类指标进行聚类分析,所述K-means算法的代价函数表示为:其中:μ1,...,μk为1,...,K个聚类中心,m表示最终聚类指标,表示第i个聚类指标所在类的中心,x(i)为聚类指标中的数据点,c(1),...c(m)为聚类指标中的数据点x(1),...,x(m)所在的类。进一步地:所述根据所述聚类结果对描述供电可靠性水平的基础数据进行优化,包括:将大于供电可靠性水平的基础数据3倍方差的基础数据予以剔除,使得所述K-means算法的代价函数最小化。进一步地:使得所述K-means算法的代价函数最小化,计算式如下:本专利技术还提供一种电网供电可靠性水平优化系统,其改进之处在于:包括:构建模块,用于选取影响供电可靠性的因素建立指标集;聚类指标确定模块,用于采用相关系数显著性校验从指标集中确定最终聚类指标;聚类分析模块,对最终聚类指标进行聚类分析,得到最优化的聚类指标;优化模块,用于根据所述最优化的聚类指标对描述电网供电可靠性水平的基础数据进行优化。进一步地:所述聚类指标确定模块,进一步包括:预处理子模块,用于对指标集中的基础数据进行预处理;校验子模块,用于对预处理后指标集中的指标采用主成分分析法进行相关系数显著性校验;形成子模块,用于形成最终聚类指标。进一步地:所述校验子模块,包括:第一主成分确定单元,用于确定预处理后指标集中第一主成分;第二主成分确定单元,用于依次确定第二主成分,第三主成分,第四主成分,……,第P个主成分,p表示指标集中的指标个数。进一步地:所述第一主成分确定单元,包括:第一选取子单元,用于第一主成分指标用选取的第一个线性组合F1的方差Va(rF1)表示,当Va(rF1)最大时,第一个线性组合F1为第一主成分;所述第一线性组合为预处理后指标集中多个具有相关性的指标,重新组合成一组新的互相无关的综合指标进行线性组合得到的。进一步地:所述第二主成分确定单元,包括:第二选取子单元,用于如果第一主成分F1不足以代表原来P个指标的信息,选取第二个线性组合F2,第一主成分F1已有的信息不出现在第二个线性组合F2中,用数学表达式表示为Cov(F1,F2)=0,则称第二个线性组合F2为第二主成分;第三主成分确定子单元,用于依此类推构造出第三、第四,……,第P个主成分。进一步地:所述最终聚类指标为第一主成分、第二主成分、第三主成分、......、第P主成分的集合m。与最接近的现有技术相比,本专利技术提供的技术方案具有的有益效果是:1、本专利技术选取影响供电可靠性的因素建立指标集;采用相关系数显著性校验从指标集中确定最终聚类指标;对最终聚类指标进行聚类分析,得到供电可靠性水平分类的聚类结果;根据所述聚类结果对描述供电可靠性水平的基础数据进行优化。在聚类前选取影响供电可靠性的因素建立指标集,并采用相本文档来自技高网
...

【技术保护点】
1.一种电网供电可靠性水平优化方法,其特征在于:选取影响供电可靠性的因素建立指标集;采用相关系数显著性校验从指标集中确定最终聚类指标;对最终聚类指标进行聚类分析,得到供电可靠性水平分类的聚类结果;根据所述聚类结果对描述供电可靠性水平的基础数据进行优化。

【技术特征摘要】
1.一种电网供电可靠性水平优化方法,其特征在于:选取影响供电可靠性的因素建立指标集;采用相关系数显著性校验从指标集中确定最终聚类指标;对最终聚类指标进行聚类分析,得到供电可靠性水平分类的聚类结果;根据所述聚类结果对描述供电可靠性水平的基础数据进行优化。2.如权利要求1所述的电网供电可靠性水平优化方法,其特征在于:所述指标集按可靠性水平划分包括基础数据,所述基础数据包括区域特征、经济水平、负荷电量情况、网架结构及运行情况、设备情况和技术管理水平指标。3.如权利要求2所述的电网供电可靠性水平优化方法,其特征在于:所述采用相关系数显著性校验从指标集中确定聚类指标,包括:对指标集中的基础数据进行预处理;对预处理后指标集中的指标采用主成分分析法进行相关系数显著性校验;形成最终聚类指标。4.如权利要求3所述的电网供电可靠性水平优化方法,其特征在于:采用主成分分析法进行相关系数显著性校验,包括:确定预处理后指标集中第一主成分;依次确定第二主成分,第三主成分,第四主成分,……,第P个主成分,p表示指标集中的指标个数。5.如权利要求4所述的电网供电可靠性水平聚类方法,其特征在于:所述确定预处理后指标集中第一主成分包括:所述第一主成分指标用选取的第一个线性组合F1的方差Va(rF1)表示,当Va(rF1)最大时,第一个线性组合F1为第一主成分;所述第一线性组合为预处理后指标集中多个具有相关性的指标,重新组合成一组新的互相无关的综合指标进行线性组合得到的。6.如权利要求5所述的电网供电可靠性水平聚类方法,其特征在于:所述依次确定第二主成分,第三主成分,第四主成分,……,第P个主成分,包括:如果第一主成分F1不足以代表原来P个指标的信息,选取第二个线性组合F2,第一主成分F1已有的信息不出现在第二个线性组合F2中,用数学表达式表示为Cov(F1,F2)=0,则称第二个线性组合F2为第二主成分;依此类推构造出第三、第四,……,第P个主成分。7.如权利要求6所述的电网供电可靠性水平优化方法,其特征在于:所述最终聚类指标为第一主成分、第二主成分、第三主成分、......、第P主成分的集合m。8.如权利要求7所述的电网供电可靠性水平优化方法,其特征在于:所述对最终聚类指标进行聚类分析,得到供电可靠性水平分类的聚类结果包括:采用K-means算法的代价函数对最终聚类指标进行聚类分析,所述K-means算法的代价函数表示为:其中:μ1,...,μk为1,...,K个聚类中心,m表示最终聚类指标,表示第i个聚类指标所在类的中心,x(i)为聚类指标中的数据点,c(1...

【专利技术属性】
技术研发人员:高波陈红森张鹏呂颖王宏刚芦晶晶于之虹胡建勇
申请(专利权)人:中国电力科学研究院有限公司国家电网公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1