System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于回归树的用电量预测方法及系统技术方案_技高网
当前位置: 首页 > 专利查询>夏永年专利>正文

一种基于回归树的用电量预测方法及系统技术方案

技术编号:41143806 阅读:2 留言:0更新日期:2024-04-30 18:12
本发明专利技术提供了一种基于回归树的用电量预测方法,包括:步骤1:获取历史用电量数据;步骤2:对历史用电量数据进行预处理,获取预处理后的历史用电量数据;步骤3:构建用电量预测模型,并将预处理后的历史用电量数据输对用电量预测模型进行训练,获取训练后的用电量预测模型;步骤4:基于训练后的用电量预测模型获取用电量预测结果。本发明专利技术提高了用电量预测模型的训练效率,在用电量预测模型的构建中将PCA算法和GBDT算法结合,提高了用电量预测的精度和保留了信息的完整性。

【技术实现步骤摘要】

本专利技术属于用电量预测,更具体地说,是涉及一种基于回归树的用电量预测方法及系统


技术介绍

1、智能电网是未来电力系统变革的主要方向,随着建设规模逐渐扩大,智能电网形成了包括生产数据、营销数据,以及相关社会经济数据等在内的电力大数据。建立更加智能化、经济化、环保化、促进低碳发展化的电网也成为全球的共同目标。电力行业的发展也必须紧随智能电网的建设发展,正确的判断和预测未来的用电量变化趋势对于电力企业准确、科学、合理的进行规划,提高电力系统运行的稳定性和经济性具有至关重要的意义。

2、现有技术中用电量预测方法中实时性不强,即先行周期是预先确定的静态周期而不是动态更新的,在预测用电量时直接使用,导致一段时间之后,先行周期可能会出现比较明显的误差,从而给用电量带来误差。直接预测用电量导致预测结果的误差较大,剔除季节影响,用电量在每个时间周期的变化不会很明显,误差不能满足精度要求。


技术实现思路

1、本专利技术的目的在于提供一种基于回归树的用电量预测方法及系统,旨在解决现有技术中用电量预测精度低、实时性低的技术问题。

2、为实现上述目的,本专利技术采用的技术方案是:提供一种基于回归树的用电量预测方法,包括:

3、步骤1:获取历史用电量数据;

4、步骤2:对历史用电量数据进行预处理,获取预处理后的历史用电量数据;

5、步骤3:构建用电量预测模型,并将预处理后的历史用电量数据输对用电量预测模型进行训练,获取训练后的用电量预测模型;p>

6、步骤4:基于训练后的用电量预测模型获取用电量预测结果。

7、优选地,步骤2包括:

8、对所述历史用电量数据进行缺失值填充、异常值修正和数据标准化处理得到预处理后的历史用电量数据。

9、优选地,所述对历史用电量数据进行缺失值填充包括:

10、基于所述历史用电量数据获取出现缺失值的时间段和相应缺失值时间段相邻时间段的数据;

11、利用线性插值公式,基于缺失值的时间段相邻时间段的数据的均值,对缺失值进行填充得到缺失值填充后的历史用电量数据;

12、线性插值公式为:

13、

14、其中,i为出现缺失值的时间段,xi为缺失值填充后的用电量数据,xi-1为i-1时间段的用电量,xi+1为i+1时间段的用电量数据,i为缺失值的个数。

15、优选地,所述对历史用电量数据进行异常值修正包括:

16、基于缺失值填充后的历史用电量数据获取各个时间段历史用电量数据的均值;

17、基于各个时间段历史用电量数据的均值获取样本标准偏差;

18、若预设时间段内的历史用电量数据大于样本标准偏差,则为异常值,若小于样本标准偏差,则为正常值;

19、基于异常值修正公式对异常值进行修正,获取异常值修正后的历史用电量数据;

20、样本标准偏差的计算公式为:

21、

22、其中,σm为历史用电量数据的样本标准偏差,为各个时间段历史用电量数据的均值,xn为第n个时间段的历史用电量数据,m为历史用电量数据的数据个数;

23、异常值修正公式为:

24、

25、其中,为异常值修正后的历史用电量数据,为时间段m的历史用电量数据的均值,σm为样本标准偏差,为异常值。

26、优选地,对历史用电量数据进行数据标准化包括:

27、计算异常值修正后的历史用电量数据的平均差和标准差;

28、基于异常值修正后的历史用电量数据的平均差和标准差对异常值修正后的历史用电量数据进行数据标准化;

29、数据标准化计算公式为:

30、

31、其中,x′为数据标准化后的历史用电量数据,x为异常值修正后的历史用电量数据,μ为异常值修正后的历史用电量数据的平均值,σ为异常值修正后的历史用电量数据的标准差。

32、优选地,步骤3包括:

33、步骤3.1:基于主成分析法对预处理后的历史用电量数据进行降维;

34、步骤3.2:将降维后的历史用电量数据作为训练数据输入用电量预测模型;

35、步骤3.3:初始化用电量预测模型,获取用电量预测模型中的初始回归树;

36、步骤3.4:对初始回归树进行迭代运算,获取迭代运算完成的回归树;

37、步骤3.5:基于迭代运算完成的回归树获取用电量预测模型;

38、初始回归树计算公式为:

39、

40、其中,f0(x)为初始回归树,c为回归树损失函数的最小常数值,yi为第i棵弱回归树的预测值,n为常数。

41、优选地,步骤3.1包括:

42、步骤3.1.1:获取预处理后的历史用电量数据的n维特征和各个特征对应的特征值;

43、步骤3.1.2:对预处理后的历史用电量数据的n维特征值进行中心化,获取中心化后的历史用电量数据的n维特征;

44、步骤3.1.3:基于中心化后的历史用电量数据的n维特征获取历史用电量数据的协方差矩阵;

45、步骤3.1.4:基于历史用电量数据的协方差矩阵获取协方差矩阵的特征值和相对应的特征向量;

46、步骤3.1.5:将历史用电量数据的n维特征投影到特征向量上,获取降维后的历史用电量数据;

47、中心化计算公式为:

48、

49、其中,m为历史用电量数据的样本数量,为第i个特征中心化后的特征值,为第i个特征的特征值;

50、协方差矩阵的计算公式为:

51、

52、

53、其中,c为协方差矩阵,cov(x1,x1)为特征x1的方差,cov(x2,x2)为特征x2的方差,cov(x2,x1)为特征x2的协方差,cov(x1,x2)为特征x1的协方差,为历史用电量数据n维特征中的第一特征,中心化后的第一特征值,m为历史用电量数据的样本数量;

54、优选地,步骤3.4包括:

55、步骤3.4.1:利用迭代运算方法对初始回归树进行迭代运算得到迭代运算后回归树的残差拟合值;

56、步骤3.4.2:基于线性搜索法获取迭代运算后回归树节点区域的最小值;

57、步骤3.4.3:基于迭代运算后回归树的残差拟合值、迭代运算后的回归树节点区域的最小值获取迭代运算完成的用电量预测模型;

58、回归树残差拟合值的计算公式为:

59、

60、其中,rmi为回归树的残差拟合值,为梯度参数,yi为第i棵弱回归树的预测值,l(yi,f(xi))为损失函数,f(xi)为第i次迭代回归树拟合得到的结果;

61、回归树节点区域的最小值的计算公式为:

62、

63、其中,cmj为回归树节点区域的最小值,rmj为回归树的节点区域,c为回归树损本文档来自技高网...

【技术保护点】

1.一种基于回归树的用电量预测方法,其特征在于,包括:

2.根据权利要求1所述的一种基于回归树的用电量预测方法,其特征在于,所述步骤2包括:

3.根据权利要求2所述的一种基于回归树的用电量预测方法,其特征在于,所述对历史用电量数据进行缺失值填充包括:

4.根据权利要求2所述的一种基于回归树的用电量预测方法,其特征在于,所述对历史用电量数据进行异常值修正包括:

5.根据权利要求2所述的一种基于回归树的用电量预测方法,其特征在于,所述对历史用电量数据进行数据标准化包括:

6.根据权利要求1所述的一种基于回归树的用电量预测方法,其特征在于,所述步骤3包括:

7.根据权利要求6所述的一种基于回归树的用电量预测方法,其特征在于,所述步骤3.1包括:

8.根据权利要求6所述的一种基于回归树的用电量预测方法,其特征在于,所述步骤3.4包括:

9.根据权利要求1所述的一种基于回归树的用电量预测方法,其特征在于,所述步骤4包括:

10.一种基于大数据的用电量预测系统,其特征在于,包括:>...

【技术特征摘要】

1.一种基于回归树的用电量预测方法,其特征在于,包括:

2.根据权利要求1所述的一种基于回归树的用电量预测方法,其特征在于,所述步骤2包括:

3.根据权利要求2所述的一种基于回归树的用电量预测方法,其特征在于,所述对历史用电量数据进行缺失值填充包括:

4.根据权利要求2所述的一种基于回归树的用电量预测方法,其特征在于,所述对历史用电量数据进行异常值修正包括:

5.根据权利要求2所述的一种基于回归树的用电量预测方法,其特征在于,所述对历史用电量...

【专利技术属性】
技术研发人员:夏永年陈新生
申请(专利权)人:夏永年
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1