【技术实现步骤摘要】
一种电力数据能耗分析预测方法
[0001]本专利技术涉及数据处理领域,具体涉及一种电力数据能耗分析预测方法。
技术介绍
[0002]近年来,经济的飞速发展和人口的快速增长,不管是居民用电,商业用电还是工业用电都显著的增长,为了平衡供电的需求和减少碳化物的排放,电力技术的发展都受到了密切关注。国内的电力系统的最为突出的作用就是提供质量好的电能,使得用户都能得到满足,因此能耗分析预测方法的研究变得尤其重要,在不断发展增加的信息和数据的时代,通过分析用户信息和电力数据的特征,进行能耗分析预测方法可以有利于电网系统的稳定运行以及对硬件设备的状态评估,而且准确的能耗分析预测方法,在一定程度上可以节约电能的损耗。
[0003]当前能耗分析的数据受到诸多因素的影响,如天气因素,节日属性,地区因素,设备系统状态等,这些都会导致预测的结果不理想,当前国内外对于能耗分预测的主要方法考虑时间序列和天气数据的预测模型可以提高预测效果,但如何将它们有效的结合并做出预测,是一直需要解决的问题,因此针对单一的预测算法模型存在着计算量大以及预测精度不高的问题。
[0004]为解决上述问题,本专利技术提出了一种改进的ISODATA算法和支持向量机回归结合算法。
技术实现思路
[0005]为了解决上述问题,本专利技术提出了一种电力数据能耗分析预测方法,包括以下步骤:
[0006]步骤1、采集用电数据,对用电数据进行预处理,将预处理后的数据分为训练集样本和预测集样本,构建支持向量机回归模型;
[0007]步 ...
【技术保护点】
【技术特征摘要】
1.一种电力数据能耗分析预测方法,其特征在于,包括以下步骤:步骤1、采集用电数据,对用电数据进行预处理,将预处理后的数据分为训练集样本和预测集样本,构建支持向量机回归模型;步骤2、将训练集样本进行聚类分析,得到具体的第一类别信息,具体包括以下步骤:步骤2.1:确定类别数目和类别中的聚类中心的位置,具体包括:(1)计算训练集样本中各样本元素之间的距离,将计算结果构成一个矩阵P(i,j)=||x
i
‑
x
j
||,i,j=1,2,...,M,求每列的平均值,将每列的平均值进行累加求平均距离令R2=2R1;其中,M为训练集样本元素的总数,x
i
表示第i个样本元素的坐标,x
j
表示第j个样本元素的坐标,|x
i
‑
x
j
|表示x
i
‑
x
j
的模即样本元素x
i
与样本元素x
j
之间的距离,||x
i
‑
x
j
||表示样本元素x
i
与样本元素x
j
之间的距离构成的矩阵;(2)以R1为半径,每个样本元素为圆心画圆,将每个圆内的样本元素分为一组,统计每个圆内样本元素数目,按照每组内样本元素总数目从大到小的顺序将样本元素按组进行排列,共有M组样本元素;(3)设第一组的圆心为第一个聚类中心C1,计算第二组的圆心与C1之间的距离,若此距离大于R2,将其作为第二个聚类中心C2,若此距离不大于R2,则继续计算下一组圆心与已经确定的聚类中心之间的距离,如果当前组的圆心与已经确定的聚类中心之间的距离全部大于R2,将其作为新的聚类中心,重复上述步骤,直到没有新的聚类中心产生;设上述过程中产生N0个聚类中心,则所有聚类中心构成的聚类中心集为其中,表示第1个至第N0个聚类中心;步骤2.2:对于训练集中的样本元素x
i
,i=1,2,3,...,M,计算每个样本元素到当前每个聚类中心的距离,将其分配到距离最小的聚类中心所对应的类别中;步骤2.3:判断上述的每个类别中元素数目是否小于N
min
;若小于N
min
则取消该类别,将该类别中的样本元素重新分配到与其距离最近的聚类中心所对应的类别,执行步骤2.4;若不小于N
min
则执行步骤2.5;所述N
min
表示每个类别需要的最少样本数目;所述与其距离最近的聚类中心不包括已被取消的类别的聚类中心;步骤2.4:对当前所有的聚类中心进行修正,修正公式有:其中,c
p
表示修正后的聚类中心的坐标,|c
p
|表示修正前的聚类中心的坐标的模;表示聚类中心c
p
所对应的类别中的第k个样本元素,表示聚类中心c
p
所对应的类别中的样本元素的坐标值对应相加,进行步骤2.5;步骤2.5:对当前所有类别进行分裂或合并操作:若当前类别数目小于等于进行分裂操作,具体包括:计算每个类别中所有样本元素在各自的维度下的方差,并选取每个类别的选取最大方差分量;若当前类别满足条件一或条件二,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。