一种基于用户聚类扩展数据的用电预测方法技术

技术编号:34343714 阅读:16 留言:0更新日期:2022-07-31 04:23
本发明专利技术涉及一种基于用户聚类扩展数据的用电预测方法,属于电力数据分析处理领域;该方法包括对用户用电时间序列特征利用EEMD对其进行分解,得到IMF序列;对分解结果采用PCA K

【技术实现步骤摘要】
一种基于用户聚类扩展数据的用电预测方法


[0001]本专利技术属于电力数据分析处理领域,涉及一种基于用户聚类扩展数据的用电预测方法。

技术介绍

[0002]用电量短期预测的准确性,既决定了批发电力和容量市场参与者的财务业绩,也决定了电力系统运行的可靠性。随着当前计算机技术的发展,更多的引入了人工神经网络(ANN)来提升电荷预测的准确性。学界普遍认为,使用神经网络解决预测问题是有效的,这当中自然也包括用电负荷时间序列预测问题。
[0003]由于深度学习模型能够在数据中捕获隐藏的、非线性的特征,许多类型的神经网络已用于用电负荷预测,例如,前馈神经网络、径向基函数网络、尖峰神经网络和循环神经网络等,其中,最流行的学习方法是反向传播算法。然而,与经典方法相比,这类方法在短期负荷预测问题上的应用研究还比较少,而且大多数工作只给出了模型框架及其结果的一般描述,这使得它们的实现相当困难。
[0004]此外,为了提高电荷预测模型的准确性,一些研究考虑了时间序列的逼近和分解。时间序列的分解是对趋势、周期性和随机波动的提取。这个过程中通常需要用到聚类方法来识别出时间序列的时差,K

means算法是一个很常用的聚类算法,而DTW(Dynamic time warping)则是一种很常用的时间序列相似度衡量方法。融合DTW和K

means是一种经典的时间序列聚类方法,虽然这种融合方法能够成功识别时间序列之间的时差,带来较好的分类结果,但是其时间开销大,复杂度高。融合PCA和K

means的方法虽然计算速度快,但聚类效果没有融合DTW和K

means的方法好,如果能够在该融合PCA和K

means方法基础上,提升效率的同时,避免样本数据受到时差影响,则可以更有利于聚类效果。
[0005]除此以外,所考虑的时间序列组件不一定存在于每个时间序列中。这些时间序列中可能没有存在趋势或周期性波动的组件,或两者兼而有之。有些文献考虑了时间序列本身,但没有考虑其他数据特征,在用电预测领域中,一般会对天气、交通等特征进行扩充,并以扩充后的数据特征来完成训练过程,但是这种方式缺乏用电用户之间关系的特征,导致模型训练能力不足,且因为没有多个特征依赖,也会使得模型预测随机性比较高。

技术实现思路

[0006]有鉴于此,本专利技术的目的在于提供一种基于用电时间序列用户聚类扩展数据的用电预测方法,其包含基于EEMD(经验模态分解法)、PCA(主成分分析)、CNN(卷积神经网络)和LSTM(长短期记忆人工神经网络)等技术,能够解决神经网络用电解数据不够、数据之间关联性、分开随机性序列和非随机性序列、小区用电预测的问题的问题。
[0007]传统技术中在获取的数据集基础上进行预测,一般只是将EEMD分解结果直接输入到预测模型中,而不考虑其他特征。而本专利技术认为同类用户有一定行为相似度,能够互相补充缺少的数据,所以本专利技术考虑了使用同类用户数据作为预测模型输入,本专利技术主要是通
过对EEMD分解结果使用两次K

Means聚类,第一次是用于获取用户的IMF序列的聚类结果,第二次是用于获取用户本身的聚类结果。根据第二次的用户聚类结果来对第一次聚类后的IMF序列进行扩展,将扩展后的结果作为CNN

LSTM模型的输入来训练该模型,从而提升该模型的预测效果;同时,本专利技术还为每类用户创建自己的数据帧,因而可以按照数据帧的格式来扩展用户数据,无论是训练阶段还是测试阶段,只需要对数据进行一次EEMD分解处理,能够节约相应的程序运行时间。
[0008]为达到上述目的,本专利技术提供如下技术方案:
[0009]一种基于用户聚类扩展数据的用电预测方法,该方法包括以下步骤:
[0010]S1:获取用户数据集,所述用户数据集包括各个时段的用户用电数据;并对所述用户的用电数据进行预处理,得到用户用电时间序列;
[0011]S2:利用经验模态分解法对所述用户用电时间序列进行分解,得到用户的IMF序列;
[0012]S3:对用户的IMF序列采用基于主成分分析的K

Means聚类方法降维,获取用户IMF序列的聚类结果,并将其作为更新后的用户数据集;
[0013]S4:对所述用户IMF序列的聚类结果采用基于主成分分析的K

Means聚类方法,获取用户聚类结果;
[0014]S5:根据所述用户聚类结果,对属于同类用户的IMF序列进行扩展,将同类用户的用电时间序列加到用户的IMF序列中;
[0015]S6:将扩展后的IMF序列作为再次更新后的用户数据集输入到卷积神经网络融合长短期记忆人工神经网络模型中,训练网络模型;
[0016]S7:将用户在当前时段的IMF序列及其同类用户在当前时段的用电时间序列输入到训练后的网络模型中,得到用户在下一时段的用电预测结果。
[0017]本专利技术的有益效果在于:
[0018]1)本专利技术充分利用用户用电数据,根据同类用户的历史用电数据获取当前用户的待测用电数据的预测值,为小区用户的用电预测提供辅助的依据;
[0019]2)本专利技术根据用电用户具有用电行为相似度的特性,利用同一类别下其他用户的用电数据来补充当前用户的用电数据,不仅有利于网络模型的训练,还有利于增强待测用电数据的完整性,从而提升网络模型的预测精度;
[0020]3)本专利技术充分使用了EEMD方法,对于PCA

K

means聚类方法提供了优化,并且预测模型里也使用分解结果,得到比较好的时间序列聚类结果,而且通过一次性EEMD预处理也节约了程序运行时间。
[0021]本专利技术的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
[0022]为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作优选的详细描述,其中:
[0023]图1是本专利技术实施例中一种基于用户聚类扩展数据的用电预测方法流程图;
[0024]图2是本专利技术实施例中用户数据集的更新流程示意图;
[0025]图3是本专利技术实施例中同类用户的数据帧结构示意图;
[0026]图4是本专利技术实施例中用电预测流程的示意图;
[0027]图5是本专利技术实施例中网络模型结构图。
具体实施方式
[0028]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0029]图1是本专利技术实施例中一种基于用户聚类扩展数据的用电预测方法流程图,如图1所示,所述预测方法包括:
[0030]S1:获取用户数据集,所述用户数据集包括各个时段的用户用电数据;并对所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用户聚类扩展数据的用电预测方法,其特征在于,所述方法包括以下步骤:S1:获取用户数据集,所述用户数据集包括各个时段的用户用电数据;并对所述用户的用电数据进行预处理,得到用户用电时间序列;S2:利用经验模态分解法对所述用户用电时间序列进行分解,得到用户的IMF序列;S3:对用户的IMF序列采用基于主成分分析的K

Means聚类方法降维,获取用户IMF序列的聚类结果,并将其作为更新后的用户数据集;S4:对所述用户IMF序列的聚类结果采用基于主成分分析的K

Means聚类方法,获取用户聚类结果;S5:根据所述用户聚类结果,对属于同类用户的IMF序列进行扩展,将同类用户的用电时间序列加到用户的IMF序列中;S6:将扩展后的IMF序列作为再次更新后的用户数据集输入到卷积神经网络融合长短期记忆人工神经网络模型中,训练网络模型;S7:将用户在当前时段的IMF序列及其同类用户在当前时段的用电时间序列输入到训练后的网络模型中,得到用户在下一时段的用电预测结果。2.根据权利要求1所述的一种基于用户聚类扩展数据的用电预测方法,其特征在于,在步骤S1中,预处理的方式包括:用平均值填充空值,将时间序列数据转换为小时单位。3.根据权利要求1所述的一种基于用户聚类扩展数据的用电预测方法,其特征在于,在步骤S2中,具体包括:S21:根据网络模型需要的准确度和经验模态分解法分解的有效性,设置出IMF分量的数量,以确定用户的IMF数据集的维度;S22:采用经验模态分解法,为每个用户用电时间序列重复添加白噪声,并将计算得到的IMF分量的平均值作为最终的结果;包括用户的历史IMF序列和用户的待测IMF序列。4.根据权利要求3所述的一种基于用户聚类扩展数据的用电预测方法,其特征在于,在步骤S3中,具体包...

【专利技术属性】
技术研发人员:熊安萍吴一格陈虹宇
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1