一种基于改进极限学习机与分位数回归的光伏功率区间预测方法技术

技术编号:26765209 阅读:29 留言:0更新日期:2020-12-18 23:41
本发明专利技术涉及一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,获取初始历史样本单元集,经过数据清洗后,对各气象因素与光伏功率进行相关性分析,筛选出与光伏功率具有较高相关性的气象因素作为极限学习机预测模型输入变量;考虑预测区间覆盖率与归一化平均带宽,构建光伏功率预测区间评价指标;使用交叉验证法确定极限学习机隐层神经元个数,并使用光伏功率预测区间评价指标值表征粒子适应度,结合粒子群算法与分位数回归确定极限学习机参数最优值,完成光伏功率区间预测模型构建。本发明专利技术能够在满足可信度要求基础上,实现较高准确度的光伏功率不确定性预测,生成相应置信度下的光伏功率预测区间,具有实际应用价值。

【技术实现步骤摘要】
一种基于改进极限学习机与分位数回归的光伏功率区间预测方法
本专利技术涉及电力系统新能源预测
,特别是一种基于改进极限学习机与分位数回归的光伏功率区间预测方法。
技术介绍
随着能源短缺、环境污染等问题的加剧,在国家政策扶持下,储量丰富、环境友好的太阳能光伏在电网中的渗透率日益增加。然而,光伏出力的间歇性、波动性、随机性会对电网的安全稳定性造成威胁,光伏功率预测对电网规划与运行具有重要意义。目前,已有诸多针对光伏预测的研究及成果。根据建模方式不同,光伏预测方法可分为物理方法和数据驱动方法。物理方法以光伏组件出力特性、安装角度、转换效率等为基础,结合气象因素、地理条件,通过建立物理模型来计算光伏功率,其缺点是建模过程复杂、鲁棒性差;数据驱动方法分为统计学方法和元启发式学习方法,以大量历史数据的分析为基础。统计学方法对历史数据进行曲线拟合和参数估计,构建光伏功率与气象因素、历史出力之间的联系,例如时间序列法、灰色理论、模糊理论、时空关联法等;元启发式学习方法通过历史数据训练得到光伏预测模型,属于人工智能算法,其中神经网络应用最为广泛,包括径向基函数神经网络、小波神经网络、BP神经网络等,虽然易于实现,但是对参数选择较为敏感,且可能存在过学习、陷入局部最优等现象。根据结果形式不同,光伏预测可分为点预测和区间预测。点预测是目前大多数研究采用的方法,得到未来一段时间内光伏功率确定值,虽然直观,但无法表征光伏功率不确定性;区间预测可得到一定置信水平下光伏功率预测范围,可以比点预测提供更多信息,目前实现方法主要有Bootstrap法、贝叶斯神经网络、Delta法等,然而这些方法计算效率较低。鉴于现有研究不足,光伏功率预测方法还有待进一步改进。
技术实现思路
有鉴于此,本专利技术的目的是提供一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,通过极限学习机输入变量确定、参数优化,提升光伏功率区间预测的可信度与准确度。本专利技术采用以下方案实现:一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,包括以下步骤:步骤S1:从气象站与光伏电站获取初始历史样本单元集,经过数据清洗后,对气象数据与光伏功率进行相关性分析,确定(极限学习机)ELM预测模型输入变量;步骤S2:设定光伏功率预测区间额定置信水平,基于光伏功率预测区间评价指标,通过交叉验证法确定ELM结构,并使用ELM参数混合寻优算法确定ELM参数最优值,完成相应置信度水平下光伏功率区间预测模型构建。进一步地,步骤S1中所述初始历史样本单元集是指:以固定采样间隔,从气象站采集各历史时间点气象数据值,包括风向、风速、温度、相对湿度、平均海平面气压、降雨量和太阳辐照度,并从光伏电站采集相应时间点的光伏功率值;同一时刻的气象数据值与光伏功率值构成一个初始历史样本单元,所有初始历史样本单元构成初始历史样本单元集。进一步地,步骤S1中所述数据清洗的具体内容为:在初始历史样本单元集中剔除存在数据缺失或异常的样本单元;其中,数据缺失是指因包括节假日或设备停运检修因素导致某些时间点的数据为空;数据异常是指根据经验不可能出现的数据值,包括光伏功率负值或与季节不符的极端温度。进一步地,步骤S1中所述对气象数据与光伏功率进行相关性分析确定ELM预测模型输入变量的具体内容为:计算各气象因素时间序列与光伏功率时间序列Pearson相关系数,量化各气象因素与光伏功率之间关联程度大小;Pearson相关系数计算公式为式中,cov(·,·)表示协方差运算,x为待分析的气象因素时间序列,P为光伏功率时间序列;Pearson系数正负分别表示正相关和负相关,绝对值大小分别表示相关性高低;所述ELM包括输入层、单层隐层和输出层,选取与光伏功率相关性较高的n个气象因素,即与光伏功率Pearson相关系数绝对值达0.5的气象因素,将其作为ELM预测模型输入,同时可确定ELM输入层神经元个数为n。进一步地,步骤S2中所述光伏功率预测区间评价指标的具体内容为:光伏功率预测区间从可信度与准确度两个方面进行评价,可信度方面,预测区间覆盖率PICP(PredictionIntervalCoverageProbability,PICP)应达到预测区间额定置信水平PINC要求,即式中,Ns为待预测样本总数,为布尔型指示函数,当光伏功率目标值被预测区间覆盖时,反之为0;α为显著性水平,与PINC的关系为PINC=100(1-α)%;预测区间带宽越窄,区间预测准确度越高,预测区间归一化平均带宽PINAW(PredictionIntervalNormalizedAverageWidth,PINAW)为式中,为光伏功率最大值,和分别为光伏功率预测区间上限和下限;设置光伏功率预测区间评价指标为φ(ω,b)=-[PINAW(ω,b)+γ(ω,b)η|ACE(ω,b)|],式中,ω和b分别为ELM隐层输入权重矩阵和偏置矩阵;γ(ω,b)为布尔类型指示函数,当PICP不低于PINC时,γ(ω,b)=0,否则,γ(ω,b)=1;η为惩罚系数;平均覆盖率误差ACE(ω,b)是PINC和PICP的差值;当PICP达到置信水平要求时,φ(ω,b)仅由PINAW决定,否则,φ(ω,b)会很低,且PICP对适应度的影响比PINAW更大。进一步地,步骤S2中所述通过交叉验证法确定ELM结构的具体内容为:历史数据中同一时刻的n个气象因素与光伏功率构成一个历史样本单元,所有历史样本单元构成ELM训练集;设定隐层神经元个数初始值为1,将ELM训练集平均随机分为5份,分别为Set1、Set2、Set3、Set4和Set5,依次取其中4份作为交叉验证训练集进行训练,得到ELM光伏功率区间预测模型,并将剩余1份作为交叉验证测试集用于此模型区间预测结果评估,共进行5次;将5次评价指标取平均值,得到1个隐层神经元对应的预测区间评价指标均值。逐渐增加隐层神经元个数,重复上述过程,得到不同隐层神经元个数对应的预测区间评价指标均值,直至评价指标均值不再随着隐层神经元个数增加而增加,选取此时隐层神经元数量作为最优方案,确定ELM结构。进一步地,步骤S2中所述使用ELM参数混合寻优算法确定ELM参数最优值,完成光伏功率区间预测模型构建的具体内容为:使用粒子群算法即PSO(ParticleSwarmOptimization,PSO)算法和分位数回归相结合,确定ELM隐层输入权重与偏置最优值;输入ELM训练集,初始化PSO参数,具体包括粒子群规模、粒子初始位置、初始速度、位置范围、速度范围、惯性因子和加速度长度,其中,粒子位置与速度均含两个维度,分别对应ELM隐层输入权重ω和偏置b的寻优,在PSO每一次迭代中,得到粒子位置对应的ELM隐层输入权重ω和偏置b,采用分位数回归得到ELM隐层输出权重最优值与相应预测区间,计算粒子适应度φ(ω,b)=-[PINAW(ω,b)+γ(ω,b)η|ACE(ω,b)|],更新粒子个体与种群经过的历史最优位置,并更新粒子速度与位置,判断是否满足迭代停止条件,即连续十次迭本文档来自技高网
...

【技术保护点】
1.一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,其特征在于:包括以下步骤:/n步骤S1:从气象站与光伏电站获取初始历史样本单元集,经过数据清洗后,对气象数据与光伏功率进行相关性分析,确定ELM预测模型输入变量;/n步骤S2:设定光伏功率预测区间额定置信水平,基于光伏功率预测区间评价指标,通过交叉验证法确定ELM结构,并使用ELM参数混合寻优算法确定ELM参数最优值,完成相应置信度水平下光伏功率区间预测模型构建。/n

【技术特征摘要】
1.一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,其特征在于:包括以下步骤:
步骤S1:从气象站与光伏电站获取初始历史样本单元集,经过数据清洗后,对气象数据与光伏功率进行相关性分析,确定ELM预测模型输入变量;
步骤S2:设定光伏功率预测区间额定置信水平,基于光伏功率预测区间评价指标,通过交叉验证法确定ELM结构,并使用ELM参数混合寻优算法确定ELM参数最优值,完成相应置信度水平下光伏功率区间预测模型构建。


2.根据权利要求1所述的一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,其特征在于:步骤S1中所述初始历史样本单元集是指:以固定采样间隔,从气象站采集各历史时间点气象数据值,包括风向、风速、温度、相对湿度、平均海平面气压、降雨量和太阳辐照度,并从光伏电站采集相应时间点的光伏功率值;同一时刻的气象数据值与光伏功率值构成一个初始历史样本单元,所有初始历史样本单元构成初始历史样本单元集。


3.根据权利要求1所述的一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,其特征在于:步骤S1中所述数据清洗的具体内容为:在初始历史样本单元集中剔除存在数据缺失或异常的样本单元;其中,数据缺失是指因包括节假日或设备停运检修因素导致某些时间点的数据为空;数据异常是指根据经验不可能出现的数据值,包括光伏功率负值或与季节不符的极端温度。


4.根据权利要求1所述的一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,其特征在于:步骤S1中所述对气象数据与光伏功率进行相关性分析确定ELM预测模型输入变量的具体内容为:计算各气象因素时间序列与光伏功率时间序列Pearson相关系数,量化各气象因素与光伏功率之间关联程度大小;Pearson相关系数计算公式为式中,cov(·,·)表示协方差运算,x为待分析的气象因素时间序列,P为光伏功率时间序列;Pearson系数正负分别表示正相关和负相关,绝对值大小分别表示相关性高低;
所述ELM包括输入层、单层隐层和输出层,选取与光伏功率相关性较高的n个气象因素,即与光伏功率Pearson相关系数绝对值达0.5的气象因素,将其作为ELM预测模型输入,同时确定ELM输入层神经元个数为n。


5.根据权利要求1所述的一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,其特征在于:步骤S2中所述光伏功率预测区间评价指标的具体内容为:光伏功率预测区间从可信度与准确度两个方面进行评价,可信度方面,预测区间覆盖率PICP应达到预测区间额定置信水平PINC要求,即式中,Ns为待预测样本总数,为布尔型指示函数,当光伏功率目标值被预测区间覆盖时,反之为0;α为显著性水平,与PINC的关系为PINC=100(1-α)%;预测区间带宽越窄,区间预测准确度越高,预测区间归一化平均带宽PINAW为式中,为光伏功率最大值,和分别为光伏功率预测区间上限和下限;设置光伏功率预测区间评价指标为φ(ω,b)=-[PINAW(ω,b)+γ(ω,b)η|ACE(ω,b)|],式中,ω和b分别为ELM隐层输入权重矩阵和偏置矩阵;γ(ω,b)为布尔类型指示函数,当PICP不低于PINC时,γ(ω,b)=0,否则,γ(ω,b)=1;η为惩罚系数,平均覆盖率误差ACE(ω,b)是PINC和PICP的差值;当PICP达到置信水平要求时,φ(ω,b)仅由PINAW决定,否则,φ(ω,b)会很低,且PICP对适应度的...

【专利技术属性】
技术研发人员:蔡秀雯陈钢何华琴何珊陈炜松卢文成王毅峰许杭海林明熙陈健榕黄东明高领军邱梓峰马会军
申请(专利权)人:国网福建省电力有限公司泉州供电公司国网福建省电力有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1