当前位置: 首页 > 专利查询>江苏大学专利>正文

一种电力数据能耗分析预测方法技术

技术编号:34761948 阅读:7 留言:0更新日期:2022-08-31 19:02
本发明专利技术公开了一种电力数据能耗分析预测方法,包括以下步骤:对用电数据进行预处理,将预处理后的数据分为训练集样本和预测集样本,构建支持向量机回归模型;将训练集样本进行聚类分析,得到具体的第一类别信息;从第一类别集的各类别中按相同比例选取样本元素构成测试集样本,计算测试集样本到第一类别集各类别的聚类中心的距离,选取其中最小距离对应的类别为最终类别;利用最终类别的样本数据训练支持向量机回归模型,将预测集样本输入训练后的支持向量机回归模型,得到最终的能耗分析预测值。本发明专利技术在聚类执行前决定初始聚类中心及聚类数目,减少了大量计算的时间。减少了大量计算的时间。减少了大量计算的时间。

【技术实现步骤摘要】
一种电力数据能耗分析预测方法


[0001]本专利技术涉及数据处理领域,具体涉及一种电力数据能耗分析预测方法。

技术介绍

[0002]近年来,经济的飞速发展和人口的快速增长,不管是居民用电,商业用电还是工业用电都显著的增长,为了平衡供电的需求和减少碳化物的排放,电力技术的发展都受到了密切关注。国内的电力系统的最为突出的作用就是提供质量好的电能,使得用户都能得到满足,因此能耗分析预测方法的研究变得尤其重要,在不断发展增加的信息和数据的时代,通过分析用户信息和电力数据的特征,进行能耗分析预测方法可以有利于电网系统的稳定运行以及对硬件设备的状态评估,而且准确的能耗分析预测方法,在一定程度上可以节约电能的损耗。
[0003]当前能耗分析的数据受到诸多因素的影响,如天气因素,节日属性,地区因素,设备系统状态等,这些都会导致预测的结果不理想,当前国内外对于能耗分预测的主要方法考虑时间序列和天气数据的预测模型可以提高预测效果,但如何将它们有效的结合并做出预测,是一直需要解决的问题,因此针对单一的预测算法模型存在着计算量大以及预测精度不高的问题。
[0004]为解决上述问题,本专利技术提出了一种改进的ISODATA算法和支持向量机回归结合算法。

技术实现思路

[0005]为了解决上述问题,本专利技术提出了一种电力数据能耗分析预测方法,包括以下步骤:
[0006]步骤1、采集用电数据,对用电数据进行预处理,将预处理后的数据分为训练集样本和预测集样本,构建支持向量机回归模型;
[0007]步骤2、将训练集样本进行聚类分析,得到具体的第一类别信息,具体包括以下步骤:
[0008]步骤2.1:确定类别数目和类别中的聚类中心的位置,具体包括:
[0009](1)计算训练集样本中各样本元素之间的距离,将计算结果构成一个矩阵P(i,j)=||x
i

x
j
||,i,j=1,2,...,M,求每列的平均值,将每列的平均值进行累加求平均距离令R2=2R1;其中,M为训练集样本元素的总数,x
i
表示第i个样本元素的坐标,x
j
表示第j个样本元素的坐标,|x
i

x
j
|表示x
i

x
j
的模即样本元素x
i
与样本元素x
j
之间的距离,||x
i

x
j
||表示样本元素x
i
与样本元素x
j
之间的距离构成的矩阵;
[0010](2)以R1为半径,每个样本元素为圆心画圆,将每个圆内的样本元素分为一组,统计每个圆内样本元素数目,按照每组内样本元素总数目从大到小的顺序将样本元素按组进行排列,共有M组样本元素;
[0011](3)设第一组的圆心为第一个聚类中心C1,计算第二组的圆心与C1之间的距离,若
此距离大于R2,将其作为第二个聚类中心C2,若此距离不大于R2,则继续计算下一组圆心与已经确定的聚类中心之间的距离,如果当前组的圆心与已经确定的聚类中心之间的距离全部大于R2,将其作为新的聚类中心,重复上述步骤,直到没有新的聚类中心产生;设上述过程中产生N0个聚类中心,则所有聚类中心构成的聚类中心集为其中,表示第1个至第N0个聚类中心;
[0012]步骤2.2:对于训练集中的样本元素x
i
,i=1,2,3,...,M,计算每个样本元素到当前每个聚类中心的距离,将其分配到距离最小的聚类中心所对应的类别中;
[0013]步骤2.3:判断上述的每个类别中元素数目是否小于N
min
;若小于N
min
则取消该类别,将该类别中的样本元素重新分配到与其距离最近的聚类中心所对应的类别,执行步骤2.4;若不小于N
min
则执行步骤2.5;所述N
min
表示每个类别需要的最少样本数目;所述与其距离最近的聚类中心不包括已被取消的类别的聚类中心;
[0014]步骤2.4:对当前所有的聚类中心进行修正,修正公式有:其中,c
p
表示修正后的聚类中心的坐标,|c
p
|表示修正前的聚类中心的坐标的模;表示聚类中心c
p
所对应的类别中的第k个样本元素,表示聚类中心c
p
所对应的类别中的样本元素的坐标值对应相加,进行步骤2.5;
[0015]步骤2.5:对当前所有类别进行分裂或合并操作:
[0016]若当前类别数目小于等于进行分裂操作,具体包括:
[0017]计算每个类别中所有样本元素在各自的维度下的方差,并选取每个类别的选取最大方差分量;
[0018]若当前类别满足条件一或条件二,则将该类别分裂成两个子类别;所分裂的两个子类别对应的聚类中心的计算公式分别为:c
q1
=c
q
+最大方差分量,c
q2
=c
q

最大方差分量,分裂后迭代次数l
p
加1且类别数目加1;其中c
q
为被分裂的类别的聚类中心,c
q1
和c
q2
分别为所分裂的子类别对应的聚类中心;所述条件一为最大方差分量大于θ
s
且迭代次数为奇数,所述条件二为该类别所包含的样本元素数目大于等于2N
min
;所述θ
s
为类内各特征分量分布的相对标准差;
[0019]若当前类别数目大于等于2N0,进行合并操作,具体包括:计算当前所有类别的聚类中心之间的距离,两个不同聚类中心之间的距离小于最小设定距离d
min
,则将两个类别合并为新的类别,新的类别所对应的聚类中心得计算公式为:并为新的类别,新的类别所对应的聚类中心得计算公式为:合并后迭代次数l
p
减1且类别数目减1;其中,c
q

为合并的新的类别的聚类中心,N
q
′1和N
q
′2分别为第q

1个和第q

2个类别中的样本元素数目,c
q
′1和c
q
′2分别为第q

1个和第q

2个类别的聚类中心;
[0020]步骤2.6:重复上述步骤2.2至步骤2.6,直到迭代次数l
P
达到最大迭代次数L,停止迭代,得到第一类别集;
[0021]步骤3、从第一类别集的各类别中按相同比例选取样本元素构成测试集样本,计算测试集样本到第一类别集各类别的聚类中心的距离,选取其中最小距离对应的类别为最终类别;
[0022]步骤4、利用最终类别的样本数据训练支持向量机回归模型,将预测集样本输入训练后的支持向量机回归模型,得到最本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电力数据能耗分析预测方法,其特征在于,包括以下步骤:步骤1、采集用电数据,对用电数据进行预处理,将预处理后的数据分为训练集样本和预测集样本,构建支持向量机回归模型;步骤2、将训练集样本进行聚类分析,得到具体的第一类别信息,具体包括以下步骤:步骤2.1:确定类别数目和类别中的聚类中心的位置,具体包括:(1)计算训练集样本中各样本元素之间的距离,将计算结果构成一个矩阵P(i,j)=||x
i

x
j
||,i,j=1,2,...,M,求每列的平均值,将每列的平均值进行累加求平均距离令R2=2R1;其中,M为训练集样本元素的总数,x
i
表示第i个样本元素的坐标,x
j
表示第j个样本元素的坐标,|x
i

x
j
|表示x
i

x
j
的模即样本元素x
i
与样本元素x
j
之间的距离,||x
i

x
j
||表示样本元素x
i
与样本元素x
j
之间的距离构成的矩阵;(2)以R1为半径,每个样本元素为圆心画圆,将每个圆内的样本元素分为一组,统计每个圆内样本元素数目,按照每组内样本元素总数目从大到小的顺序将样本元素按组进行排列,共有M组样本元素;(3)设第一组的圆心为第一个聚类中心C1,计算第二组的圆心与C1之间的距离,若此距离大于R2,将其作为第二个聚类中心C2,若此距离不大于R2,则继续计算下一组圆心与已经确定的聚类中心之间的距离,如果当前组的圆心与已经确定的聚类中心之间的距离全部大于R2,将其作为新的聚类中心,重复上述步骤,直到没有新的聚类中心产生;设上述过程中产生N0个聚类中心,则所有聚类中心构成的聚类中心集为其中,表示第1个至第N0个聚类中心;步骤2.2:对于训练集中的样本元素x
i
,i=1,2,3,...,M,计算每个样本元素到当前每个聚类中心的距离,将其分配到距离最小的聚类中心所对应的类别中;步骤2.3:判断上述的每个类别中元素数目是否小于N
min
;若小于N
min
则取消该类别,将该类别中的样本元素重新分配到与其距离最近的聚类中心所对应的类别,执行步骤2.4;若不小于N
min
则执行步骤2.5;所述N
min
表示每个类别需要的最少样本数目;所述与其距离最近的聚类中心不包括已被取消的类别的聚类中心;步骤2.4:对当前所有的聚类中心进行修正,修正公式有:其中,c
p
表示修正后的聚类中心的坐标,|c
p
|表示修正前的聚类中心的坐标的模;表示聚类中心c
p
所对应的类别中的第k个样本元素,表示聚类中心c
p
所对应的类别中的样本元素的坐标值对应相加,进行步骤2.5;步骤2.5:对当前所有类别进行分裂或合并操作:若当前类别数目小于等于进行分裂操作,具体包括:计算每个类别中所有样本元素在各自的维度下的方差,并选取每个类别的选取最大方差分量;若当前类别满足条件一或条件二,...

【专利技术属性】
技术研发人员:张慧刘超朱弘历
申请(专利权)人:江苏大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1