System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于特征选择和降维聚类的两阶段短期电力负荷预测方法技术_技高网

基于特征选择和降维聚类的两阶段短期电力负荷预测方法技术

技术编号:40664283 阅读:4 留言:0更新日期:2024-03-18 18:58
本发明专利技术涉及一种基于特征选择和降维聚类的两阶段短期电力负荷预测方法,基于两阶段预测框架,第一阶段:基于MIC计算历史负荷和特征间的全局关系,得到优选特征集,采用机器学习模型对优选特征集进行预测,选择最优模型作为第一阶段的预测结果并按时间顺序标注预测点的日期标签;第二阶段:利用t分布随机近邻嵌入和k均值耦合的t‑kmeans方法进行日负荷降维和聚类,明确各用电模式待预测日期,再次采用MIC计算各个用电模式的历史负荷、天气和相似时间点的相关系数并进行特征选择,得到最优特征集,对每个用电模式分别建立机器学习模型和参数优化进行预测,选择最优模型作为预测结果,与第一阶段结果叠加为最终结果。

【技术实现步骤摘要】

本专利技术属于时序预测领域,涉及一种基于特征选择和降维聚类的两阶段短期电力负荷预测方法


技术介绍

1、短期电力负荷预测是指对未来较短时间内的电力负荷进行预测,其准确度对电力企业的经济效益和社会效益都有着重要的影响。因此,为了保障电力负荷供应的可靠性和稳定性,研究如何降低短期电力负荷预测的误差具有重大意义。

2、针对短期电力负荷预测的重要性,主要从3个方面分析当前存在的问题:

3、(1)影响因素的特征选择方法忽略了不同时间段的局部关系。短期电力负荷预测受历史负荷、时间、气象等多种因素的影响,因此为了提高预测精度,需要充分挖掘负荷和多种影响因素之间的关系,并选择最合适的特征集进行预测。大多数研究经过多次特征选择以筛选最佳特征集来提高预测准确率。然而,这些方法只考虑了历史负荷和多种因素的全局关系,并在不同的时间段用相同的方式利用它们。

4、(2)电力负荷的不稳定性、随机性、冗余性和非线性等特点导致预测误差的增大。为解决这些问题,降维和聚类算法在电力负荷预测中得到了广泛的应用。一些研究以每日的天气因素作为聚类标准,但这种聚类方式难以区分不同天气下相同的负荷数据;另外一些研究采用主成分分析(principal component analysis,pca)降维并以日负荷为依据进行聚类,该方法提升了负荷数据的稳定性,但pca在处理非线性数据时存在一定的局限性。

5、(3)结合聚类算法的预测方法依赖于待预测日的真实数据。当前研究大多通过计算待预测日的真实数据和聚类中心的距离,以确定待预测日的类别和日期信息,从而评估每一类预测模型的准确率。这些工作验证了聚类算法的优越性并能有效提高预测精度,但在实际应用中并不会提供待预测日的真实数据。


技术实现思路

1、有鉴于此,本专利技术的目的在于提供一种基于最大信息系数(maximal informationcoefficie-nt,mic)、t分布随机近邻嵌入(t-distributed stochastic neighborembedding,tsne)和k均值聚类(kmeans)耦合t-kmeans的两阶段短期电力负荷预测方法。

2、为达到上述目的,本专利技术提供如下技术方案:

3、一种基于特征选择和降维聚类的两阶段短期电力负荷预测方法,基于两阶段预测框架:

4、第一阶段预测框架:

5、s1:数据采集和处理:获取历史电力负荷数据集和对应的天气因素数据集,进行预处理,剔除异常数据,并划分测试集、训练集和验证集;

6、s2:特征生成:利用预处理完毕的历史电力负荷数据集生成相似时间点特征,扩充特征集;

7、s3:全局特征选择:采用最大信息系数mic计算整个数据样本的历史负荷、天气和相似时间点的相关系数并进行特征选择,得到优选特征集;

8、s4:模型初步预测:利用步骤s3的数据建立机器学习模型和参数优化,设定预测时间长度,根据评估指标选定最优模型作为第一阶段的预测结果,并按时间顺序标注预测点的日期标签,等待输入到第二阶段;

9、第二阶段预测框架:

10、s5:数据输入:将历史电力负荷数据集和第一阶段的预测结果输入第二阶段预测框架中;

11、s6:降维聚类:利用t分布随机近邻嵌入和k均值耦合的t-kmeans方法对步骤s5的数据进行日负荷降维和聚类,减少历史负荷数据维度,将原数据变为多个类中差异小,类外差异大且时间不一定连续的用电模式,计算评估指标并对其进行可视化分析;

12、s7:明确各用电模式待预测日期:利用步骤s4预测结果的日期标签,明确各用电模式实际预测时间长度以及预测日期,删除步骤s4的预测结果仅保留日期标签;

13、s8:局部特征选择:采用最大信息系数mic计算各个用电模式的历史负荷、天气和相似时间点的相关系数并进行特征选择,得到最优特征集;

14、s9:模型最终预测:利用步骤s8的数据,对每个用电模式分别建立机器学习模型和参数优化进行预测,选择评估指标最好的模型作为预测结果,由步骤s4和s7得到各用电模式的预测时间长度和预测日期并叠加为最终预测结果。

15、进一步,在步骤s1中,所有数据集为15分钟一次的样本统计,天气特征包括温度、湿度、能见度、体感温度、压力、风速和露点;训练集、验证集和测试集划分比例为7:2:1。

16、进一步,步骤s2中,获取到历史负荷各时间点前kd天个时间点的负荷数据

17、进一步,步骤s3具体包括以下步骤:

18、s31:利用s2的数据构建特征选择数据集,包括历史电力负荷天气因素和相似时间点特征t,其中l表示每天有n个样本量,一共有m天;w表示每天有u个样本量,一共有m天;

19、s32:采用最大信息系数mic分别计算历史负荷和影响因素的相关系数,把二维空间u和v分别划分为u和v段,形成一个u×v的网格g,不同的划分方法将会生成不同的g,mic计算公式为:

20、

21、式中,i*(ds,u,v)表示特征选择数据集ds在g下划分的最大互信息,b(n)是ds中网格划分的上限,当b(n)=n0.6时为最佳网格划分数;

22、根据mic的计算结果,若特征间的关联性较高则保留,否则剔除,从而得到全局关系的优选特征集d,结构如下:

23、

24、式中,d由l、优选相似时间点特征和优选天气特征组成,p和q为优选特征的个数。

25、进一步,步骤s4具体包括以下步骤:

26、s41:设计四种不同的特征输入方案,将其分别输入到长短记忆网络(long short-term memory,lstm)、随机森林(random forest,rf)和支持向量回归(support vectorregression,svr)模型中,验证特征选择的合理性;

27、s42:选用均方根误差(root mean square error,rmse)、平均绝对误差(meanabsolute error,mae)和平均绝对百分比误差(mean absolute percentage error,mape)作为负荷预测模型的评价指标,评价指标如下具体公式如下:

28、

29、

30、

31、式中,y为实际值,为预测值,n为总样本数量;

32、s43:选取评价指标最好的预测模型作为第一阶段预测结果k,并按时间顺序标注日期标签v:

33、

34、

35、式中,初步预测结果k表示一共预测e天,每天共有n个样本量;日期标签v表示预测结果所对应的日期信息标签。

36、进一步,步骤s5中,将历史电力负荷数据集和第一阶段的预测结果按照时间顺序一起输入到第二阶段预测框架中。

37、进一步,步骤s6具体包括以下步骤:

38、s61:将步骤s本文档来自技高网...

【技术保护点】

1.一种基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:基于两阶段预测框架:

2.根据权利要求1所述的基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:在步骤S1中,所有数据集为15分钟一次的样本统计,天气特征包括温度、湿度、能见度、体感温度、压力、风速和露点;训练集、验证集和测试集划分比例为7:2:1。

3.根据权利要求1所述的基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:步骤S2中,获取到历史负荷各时间点前kd天个时间点的负荷数据

4.根据权利要求1所述的基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:步骤S3具体包括以下步骤:

5.根据权利要求1所述的基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:步骤S4具体包括以下步骤:

6.根据权利要求1所述的基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:步骤S5中,将历史电力负荷数据集和第一阶段的预测结果按照时间顺序一起输入到第二阶段预测框架中。

7.根据权利要求1所述的基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:步骤S6具体包括以下步骤:

8.根据权利要求1所述的基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:步骤S7具体包括以下步骤:

9.根据权利要求1所述的基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:步骤S8中,再次使用MIC筛选经过步骤S5-S7后各用电模式中特征之间的相关性,从而得到最优特征集D*:

10.根据权利要求1所述的基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:步骤S9具体包括以下步骤:

...

【技术特征摘要】

1.一种基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:基于两阶段预测框架:

2.根据权利要求1所述的基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:在步骤s1中,所有数据集为15分钟一次的样本统计,天气特征包括温度、湿度、能见度、体感温度、压力、风速和露点;训练集、验证集和测试集划分比例为7:2:1。

3.根据权利要求1所述的基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:步骤s2中,获取到历史负荷各时间点前kd天个时间点的负荷数据

4.根据权利要求1所述的基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:步骤s3具体包括以下步骤:

5.根据权利要求1所述的基于特征选择和降维聚类的两阶段短期电力负荷预测方法,其特征在于:步骤s4具体包括以下步骤:

【专利技术属性】
技术研发人员:梁燕徐奔陈宣同李俊霖刘子悦皱浩然
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1