System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及用电量预测,尤其涉及一种基于随机森林算法预测用户用电量方法及系统。
技术介绍
1、城市居民生活用电水平是衡量城市现代化程度的重要指标之一,居民生活用电量水平的高低主要受城市的地理位置、人口规模、经济发展水平、居民收入、居民家庭生活消费结构及家用电器的拥有量、气候条件、生活习惯等诸多因素的制约。针对积累的大量用户用电数据,目前尚未对用户展开应用分析,而开展家庭用电能耗分析的反馈对于引导用户节能工作有非常积极的意义,通过分析用户多维用电情况,结合多项用电指标,以及相关影响因素,可向社会居民发送有效的用电建议,包括用电构成、用电走势等。通过完善家庭用电能耗分析反馈系统可以促进用户节能意识的提高,帮助用户更好地理解自己的用电情况,认识到能源资源的珍贵性,激励其采取节约用电的措施,引导其改变不良的用电习惯,减少不必要的能源消耗,从而实现节能减排的目标。
技术实现思路
1、为了克服现有技术的不足,本专利技术提供了一种基于随机森林算法预测用户用电量方法,实现了通过基于用电峰值时段、用电谷值时段、用电平值时段、用户用电量阶梯及用户用电量分布、用户用电量与季节之间的关联性,通过随机森林算法进行用户用电量预测。
2、为了实现上述专利技术目的,本本申请第一方面提供了一种基于随机森林算法预测用户用电量方法,包括以下步骤:
3、s101、基于用户用电量数据信息,确定用电峰值时段、用电谷值时段、用电平值时段,并寻找用电峰谷比异常值;
4、s102、基于用户用电
5、s103、基于皮尔逊相关系数对用户用电量数据信息,进行构建用户用电量与季节之间的关联性;
6、s104、基于k-均值聚类算法对用户用电量数据信息进行用电用户类型分类;
7、s105、基于用电峰值时段、用电谷值时段、用电平值时段、用户用电量阶梯及用户用电量分布、用户用电量与季节之间的关联性,通过随机森林算法进行用户用电量预测;
8、进一步的,用户用电量数据信息包括用户类型、用户地理区域、用户用电量、用户气温变化,用户用电量包括工作日日用电量、节假日用电量、月用电量、季度用电量、年用电量。
9、进一步的,基于用户用电量数据信息,确定用电峰值时段、用电谷值时段、用电平值时段,并寻找用电峰谷比异常值包括以下步骤:
10、基于用户用电量数据信息,确定用电峰值时段、用电谷值时段、用电平值时段;
11、基于用电峰值时段和用电谷值时段确定用电峰谷比,用电峰谷比=用电峰值时段/用电谷值时段;
12、基于用电峰谷比划分工作日日用电量用电峰谷比和季度用电量用电峰谷比;
13、采用标准差离群点检测算法对工作日日用电量用电峰谷比和季度用电量用电峰谷比进行寻找用电峰谷比异常值,标准差离群点检测算法的表达式如下所示:
14、
15、其中,zi为第i日的标准差分数,xi为i日的峰谷比,为峰谷比序列的平均值,σ为峰谷比序列的标准差,通过设置一个阈值来判断数据点是否为离群点。
16、进一步的,基于用户用电量数据信息,确定用户用电量阶梯及用户用电量分布包括以下步骤:
17、基于用户用电量数据信息,确定用户用电量阶梯;
18、基于用户用电量阶梯,确定用户数量最多的用电量阶梯、用户数量最少的用电量阶梯、不同的用户用电量阶梯所属地理区域及年度变化情况;
19、基于用户用电量阶梯确定用户用电量分布,并标记用电量高等级的用户用电量阶梯;
20、基于用户用电量分布确定用电量高等级的用户用电量阶梯所在的时间段,并确定不同用电量等级的用户用电量阶梯的月度用电量差异。
21、进一步的,基于皮尔逊相关系数对用户用电量数据信息,进行构建用户用电量与季节之间的关联性包括以下步骤:
22、基于皮尔逊相关系数构建用户用电量与夏季之间的关联性;皮尔逊相关系数的表达式如下所示:
23、
24、其中,x为气温,y为用电量,为气温序列均值,为用电量序列均值。
25、基于皮尔逊相关系数构建用户用电量与冬季之间的关联性;
26、基于皮尔逊相关系数构建用户用电量与春秋季之间的关联性;例如,春秋季用电与气温的相关分析:
27、基于用户用电量分别与夏季、冬季、春秋季之间的关联性,进行关联性等级判定。
28、进一步的,基于k-均值聚类算法对用户用电量数据信息进行用电用户类型分类包括以下步骤:
29、基于用户用电量数据信息随机选取k个初始聚类中心ci(1≤i≤k);
30、计算其余未选取的数据对象与聚类中心ci的欧式距离,确定离目标数据对象最近的聚类中心ci,并将数据对象分配到聚类中心ci所对应的簇中;
31、计算每个簇中数据对象的空间中数据对象与聚类中心间的欧式聚类,欧式聚类计算公式如下所示:
32、
33、其中,x为数据对象,ci为第i个聚类中心,m为数据对象的维度,xj,cij为x和ci的第j个属性值。
34、计算整个数据集的误差平方和,误差平方和计算公式如下所示:
35、
36、其中,sse的大小表示聚类结果的好坏,k为簇的个数。
37、进一步的,基于用电峰值时段、用电谷值时段、用电平值时段、用户用电量阶梯及用户用电量分布、用户用电量与季节之间的关联性,通过随机森林算法进行用户用电量预测包括以下步骤:
38、从用电峰值时段、用电谷值时段、用电平值时段、用户用电量阶梯及用户用电量分布、用户用电量与季节之间的关联性样本集中抽取训练集,抽取训练集的方式为每轮使用bootstraping方法抽取n个训练样集,进行k轮抽取,得到k个训练集;
39、每次使用一个训练集得到一个模型,k个训练集共得到k个模型;
40、将得到的k个模型采用投票的方式得到分类结果,并计算k个模型的均值作为最后的结果,以确定用户的未来预测用电量。
41、本申请第二方面提供了一种基于随机森林算法预测用户用电量系统,包括:
42、数据获取单元,用于获取用户用电量数据信息;
43、第一处理单元,用于基于用户用电量数据信息,确定用电峰值时段、用电谷值时段、用电平值时段,并寻找用电峰谷比异常值;
44、第二处理单元,用于基于用户用电量数据信息,确定用户用电量阶梯及用户用电量分布;
45、第三处理单元,用于基于皮尔逊相关系数对用户用电量数据信息,进行构建用户用电量与季节之间的关联性;
46、第四处理单元,用于基于k-均值聚类算法对用户用电量数据信息进行用电用户类型分类;
47、第五处理单元,用于基于用电峰值时段、用电谷值时段、用电平值时段、用户用电量阶梯及用户用电量分布、用户用电量与季节之间的关联性,通过随机森林本文档来自技高网...
【技术保护点】
1.一种基于随机森林算法预测用户用电量方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于电能量数据开展用户行为分析和用电特征分析方法,其特征在于,所述基于用户用电量数据信息,确定用电峰值时段、用电谷值时段、用电平值时段,并寻找用电峰谷比异常值包括以下步骤:
3.根据权利要求2所述的基于电能量数据开展用户行为分析和用电特征分析方法,其特征在于,所述标准差离群点检测算法的表达式如下所示:
4.根据权利要求1所述的基于电能量数据开展用户行为分析和用电特征分析方法,其特征在于,所述基于用户用电量数据信息,确定用户用电量阶梯及用户用电量分布包括以下步骤:
5.根据权利要求1所述的基于电能量数据开展用户行为分析和用电特征分析方法,其特征在于,所述基于皮尔逊相关系数对用户用电量数据信息,进行构建用户用电量与季节之间的关联性包括以下步骤:
6.根据权利要求1所述的基于电能量数据开展用户行为分析和用电特征分析方法,其特征在于,所述基于k-均值聚类算法对用户用电量数据信息进行用电用户类型分类包括以下步骤:
7.根据权
8.根据权利要求6所述的基于电能量数据开展用户行为分析和用电特征分析方法,其特征在于,所述误差平方和计算公式如下所示:
9.根据权利要求1所述的基于电能量数据开展用户行为分析和用电特征分析方法,其特征在于,所述基于用电峰值时段、用电谷值时段、用电平值时段、用户用电量阶梯及用户用电量分布、用户用电量与季节之间的关联性,通过随机森林算法进行用户用电量预测包括以下步骤:
10.一种基于随机森林算法预测用户用电量系统,用于实现权利要求1-9任意一项所述的基于电能量数据开展用户行为分析和用电特征分析方法,其特征在于,包括:
...【技术特征摘要】
1.一种基于随机森林算法预测用户用电量方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于电能量数据开展用户行为分析和用电特征分析方法,其特征在于,所述基于用户用电量数据信息,确定用电峰值时段、用电谷值时段、用电平值时段,并寻找用电峰谷比异常值包括以下步骤:
3.根据权利要求2所述的基于电能量数据开展用户行为分析和用电特征分析方法,其特征在于,所述标准差离群点检测算法的表达式如下所示:
4.根据权利要求1所述的基于电能量数据开展用户行为分析和用电特征分析方法,其特征在于,所述基于用户用电量数据信息,确定用户用电量阶梯及用户用电量分布包括以下步骤:
5.根据权利要求1所述的基于电能量数据开展用户行为分析和用电特征分析方法,其特征在于,所述基于皮尔逊相关系数对用户用电量数据信息,进行构建用户用电量与季节之间的关联性包括以下步骤:
6.根据权利要求1所述的...
【专利技术属性】
技术研发人员:何涌,杨舟,唐佳誉,李捷,吴一鸣,张智勇,韦航,
申请(专利权)人:广西电网有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。