基于集成时间序列分析技术的电能表计量误差预测方法技术

技术编号:17879722 阅读:41 留言:0更新日期:2018-05-06 01:19
本发明专利技术公开了一种基于集成时间序列分析技术的电能表计量误差预测方法,包括:对计量误差及相关数据进行数据异常处理和数据概括;将处理后的计量误差数据依据时间特性划分为多份数据集;构建时间序列模型ARIMA和神经网络模型,并进行训练评估;集成所述时间序列模型ARIMA和神经网络模型,从而获得最终预测结果。本发明专利技术提供的于集成时间序列分析技术的电能表计量误差预测方法,较传统时间序列分析方法有了更强的预测能力;将时间序列模型与神经网络模型一起组成基模型,能够有效利用多个单模型的特点,提升预测能力和准确性。

Measurement error prediction method of electric energy meter based on integrated time series analysis technology

The invention discloses a measurement error prediction method of electric energy meter based on integrated time series analysis technology, which includes data anomaly processing and data generalization for measurement error and related data, and the measurement error data after processing are divided into multiple data sets according to the time characteristics, and the time series model ARIMA and neural network are constructed. The model is trained and evaluated, and the time series model ARIMA and neural network model are integrated to get the final prediction result. The method of measuring error prediction of electric energy meter based on integrated time series analysis technology has stronger prediction ability than traditional time series analysis method. The time series model and neural network model can make use of the characteristics of multiple single models to improve the prediction ability and accuracy.

【技术实现步骤摘要】
基于集成时间序列分析技术的电能表计量误差预测方法
本专利技术涉及电能表计量领域,具体涉及一种基于集成时间序列分析技术的电能表计量误差预测方法。
技术介绍
随着国民经济的不断发展和人们生活水平的不断提高,每年的用电量也在稳步增长。电能表计量的准确性与电力企业、用户的经济利益直接相关,长期以来电力运营单位对电能表计量误差的研究主要集中在事后的维修,电能表计量误差影响因素的分析等方面。而由于数据和分析技术的限制,对电能表计量误差的预测方面工作还较少。申请号为201610593828.1的专利技术专利申请公开了一种基于ITD和时间序列分析的计量误差计算方法,其误差预测的方式为:1)通过本征时间尺度分解(ITD)法将原计量误差时间序列数据分解成若干分量;2)针对各个分量序列进行单序列的时间序列建模(ARMA\ARIMA)和预测;3)最后将预测结果进行叠加获得电能表计量误差的未来预测值。这种方法依据计量误差数据本身的信号特征,对其进行分解和时间序列分析,虽然能够在一定程度上对计量误差进行预测,但仍然存在几方面的不足:1)主要利用的是数据本身的时频特征,没有加入外部影响特征的数据,模型缺少对影响计量误差的因素(及间接因素)的表达。2)经典的时间序列分析方法(如ARIMA)对数据本身统计特性要求较为严格,建模过程繁琐。3)单个预测模型对复杂的计量误差时序数据建模和预测能力较弱。
技术实现思路
针对现有技术的不足,本专利技术的主要目的在于:提出一种以时间序列分析和神经网络为基模型的集成学习方法,基于电能表监控设备采集的海量计量数据,以及外部社会经济活动数据为基础,实现对电能表计量误差的预测。为实现前述目的,本专利技术公开了一种基于集成时间序列分析技术的电能表计量误差预测方法,包括以下步骤:S1.对已采集的原始计量误差数据进行数据异常处理和数据概括,获得第i个电能表的计量误差数据序列为{ei,1,ei,2,L,ei,t},ei,t是第i个电能表在第t天的平均计量误差值;S2.将处理后的计量误差数据依据时间特性划分为多份数据集,所述多份数据集包括训练集和测试集;S3.构建时间序列预测模型ARIMA,使用所述训练集对所述ARIMA模型进行训练,获得最优时间序列模型,并使用所述最优时间序列模型预测未来h天的计量误差结果表示第t+h天的计量误差值;S4.结合电能表相关数据作为输入特征构建神经网络模型Nnet,预测未来h天的计量误差结果表示第t+h天的计量误差值;S5.根据所述预测结果和所述测试集,分别计算ARIMA模型和Nnet模型的均方根误差RMSEi,arima和RMSEi,nnet;S6.对所述ARIMA模型和所述Nnet模型进行集成学习,采用堆叠学习方法对预测结果进行加权,权重计算公式为:其中,最终,集成模型的预测结果为:优选地,所述对原始计量误差数据进行数据异常处理包括采用时序数据异常检测算法对计量误差原始数据的异常值进行检测并处理,方法如下:若ei,t,j(j∈{1,2,L,n})满足如下公式,则判断ei,t,j为异常数据,并将其从数据集中删除;若ei,t,k(k∈{1,2,L,n})满足如下公式,则判断ei,t,k为异常数据,并将其从数据集中删除;式中ei,t,k、ei,t,j表示第i个电能表在第t天中,第k/j个计量误差数据。优选地,所述数据概况包括对计量误差数据采用如下公式按天进行均值化处理:其中,ei,t是第i个电能表在第t天的平均计量误差值;ni,t是第i个电能表的第t天采集的有效计量误差数量;ei,t,k是第i个电能表在第t天的第k个计量误差数据。优选地,所述数据集采用以下方法划分:若第i个电能表的计量误差数据序列为{ei,1,ei,2,L,ei,t},验证的次数为nfolds,每次验证需要预测给定训练序列后h天的走势,训练集均从第1天开始,则训练集的长度分别为Ltrain={t-nfolds×h,t-(nfolds-1)×h,L,t-h},(nfolds∈N,nfolds≥2);则,训练集DTrain,lt={ei,1,ei,1,L,ei,lt},对应测试集DTest,lt,h={ei,lt+1,ei,lt+2,L,ei,lt+h},其中,lt∈Ltrain。优选地,步骤S4中所述电能表相关数据包括:法定节假日数据、工作日数据、周末数据。优选地,所述步骤S3具体包括:S31.在DTrain,lt数据集上构建ARIMA模型:式中,AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为差分次数,表示的是对ei,t进行d阶差分处理后的计量误差数据,是自回归部分需要求解的参数,θ1,θ2,L,θq是移动平均部分需要求解的参数;S32.生成p,q的候选集合{p1,L,pi,L,pm}、{q1,L,qk,L,qh},且qi,qk∈{0,1,L};d的候选集为dj∈{0,1,2};S33.采用grid搜索方法对p,d,q的每一个参数候选值进行遍历,对每一对(pi,dj,qk)得到ARIMA(pi,dj,qk)模型,求解参数和θ1,θ2,L,θq;S34.计算ARIMA(pi,dj,qk)的AIC值,计算公式如下:式中,为该模型的残差平方和,即:d为时间序列的样本数量,pi与qk分别为AR和MA的阶数;S35.比较AIC(i,j,k)的取值,选择min(AIC(i,j,k))对应的模型作为最优时间序列模型,记为BestArimai,lt;S36.利用BestArimai,lt模型预测接下来h天的计量误差结果,记为:predi,lt,h表示第i个电能表,在lt天后的h天中每天的计量误差值。优选地,所述步骤S4具体包括:S41.构建单隐藏层神经网络模型;S42.采用BP算法求解神经网络参数;S43.激活函数采用sigmoid函数,即S44.采用单步长递归预测的方法,预测第i个电能表在未来h天的计量误差:A.采用Nneti,lt预测第lt+1天的计量误差值得到B.将作为第lt+1天的计量误差估计值,用于生成预测lt+2天的特征,并预测重复以上A、B两步,直到完全得到h天的所有预测结果优选地,根据测试集数据DTest,lt,h,第i个电能表的ARIMA模型的均方根误差RMSEi,arima为:式中,nfolds为验证的次数,h为每次预测的时间间隔,为每次计量误差预测值,ei,lt+j为实际计量误差值,lt∈Ltrain。优选地,根据测试集数据DTest,lt,h,第i个电能表的Nnet模型的均方根误差RMSEi,nnet为:其中,nfolds为验证的次数,h为每次预测的时间间隔,为每次计量误差预测值,ei,lt+j为实际计量误差值,lt∈Ltrain。优选地,求解参数和θ1,θ2,L,θq的方法包括近似极大似然估计法、自回归逼近法。与现有技术相比,本专利技术的优点在于:本专利技术公开的一种基于集成时间序列分析技术的电能表计量误差预测方法,在海量数据的基础上,通过对电能表计量误差时序数据构建集成学习模型,预测电能表计量误差的未来趋势。其采用误差时序数据的时频特征、外部解释特征相结合的方式构建神经网络预测模型,较传统时间序列分析方法有了更强的预测能力;将时间序列模型与神经网络模型一起组成基模型,能够有效利用多个单模型的特点,提升预测本文档来自技高网...
基于集成时间序列分析技术的电能表计量误差预测方法

【技术保护点】
基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于,包括以下步骤:S1.对已采集的原始计量误差数据进行数据异常处理和数据概括,获得概况处理后第i个电能表的计量误差数据序列为{ei,1,ei,2,L,ei,t},ei,t是第i个电能表在第t天的平均计量误差值;S2.将处理后的计量误差数据依据时间特性划分为多份数据集,所述多份数据集包括训练集和测试集;S3.构建时间序列预测模型ARIMA,使用所述训练集对所述ARIMA模型进行训练,获得最优时间序列模型,并使用所述最优时间序列模型预测未来h天的计量误差结果

【技术特征摘要】
1.基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于,包括以下步骤:S1.对已采集的原始计量误差数据进行数据异常处理和数据概括,获得概况处理后第i个电能表的计量误差数据序列为{ei,1,ei,2,L,ei,t},ei,t是第i个电能表在第t天的平均计量误差值;S2.将处理后的计量误差数据依据时间特性划分为多份数据集,所述多份数据集包括训练集和测试集;S3.构建时间序列预测模型ARIMA,使用所述训练集对所述ARIMA模型进行训练,获得最优时间序列模型,并使用所述最优时间序列模型预测未来h天的计量误差结果表示第i个电能表第t+h天的计量误差值;S4.结合电能表相关数据作为输入特征构建神经网络模型Nnet,预测未来h天的计量误差结果表示第i个电能表第t+h天的计量误差值;S5.根据所述预测结果和所述测试集,分别计算ARIMA模型和Nnet模型的均方根误差RMSEi,arima和RMSEi,nnet;S6.对所述ARIMA模型和所述Nnet模型进行集成学习,采用堆叠学习方法对预测结果进行加权,权重计算公式为:其中,最终,集成模型的预测结果为:2.根据权利要求1所述的基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于,所述对原始计量误差数据进行数据异常处理包括采用时序数据异常检测算法对计量误差原始数据的异常值进行检测并处理,方法如下:若ei,t,j(j∈{1,2,L,n})满足如下公式,则判断ei,t,j为异常数据,并将其从数据集中删除;若ei,t,k(k∈{1,2,L,n})满足如下公式:则判断ei,t,k为异常数据,并将其从数据集中删除;式中ei,t,k、ei,t,j表示第i个电能表在第t天中,第k或第j个计量误差数据,n为计量误差数量。3.根据权利要求1所述的基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于,所述数据概况包括对计量误差数据采用如下公式按天进行均值化处理:其中,ei,t是第i个电能表在第t天的平均计量误差值;ni,t是第i个电能表的第t天采集的有效计量误差数量;ei,t,k是第i个电能表在第t天的第k个计量误差数据。4.根据权利要求1所述的基于集成时间序列分析技术的电能表计量误差预测方法,其特征在于,所述数据集采用以下方法划分:若第i个电能表的计量误差数据序列为{ei,1,ei,2,L,ei,t},验证的次数为nfolds,每次验证需要预测给定训练序列后h天的走势,训练集均从第1天开始,则训练集的长度分别为Ltrain={t-nfolds×h,t-(nfolds-1)×h,L,t-h},(nfolds∈N,nfolds≥2)则,训练集DTrain,lt={ei,1,ei,1,L,ei,lt},对应测试集DTest,lt,h={ei,lt+1,ei,lt+2,L,ei,lt+h},其中,lt∈Ltrain。5.根据权利要求1所述的...

【专利技术属性】
技术研发人员:贾兴林
申请(专利权)人:成都思晗科技股份有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1