基于模型不可知元学习方法的光储电网发电功率预测方法技术

技术编号:38144835 阅读:7 留言:0更新日期:2023-07-08 10:02
本发明专利技术公开了一种基于模型不可知元学习方法的光储电网发电功率预测方法,通过元学习技术解决在光储电网发电功率预测问题中,通过设计一个生成模型,结合任务特征,将所有设备的预测问题拆分成不同电站范围内的发电设备功率预测问题,通过元学习的方法,使得从一个任务中学到的元知识可以在不同任务之间转移,元知识在不同任务之间转换对发电功率预测起关键作用。本发明专利技术将与发电效率相关的动态时间序列特征和静态特征联合进行建模,学习一个具有代表性的模型初始化参数值,显著提升模型在新场景中的拟合速度和预测准确度。新场景中的拟合速度和预测准确度。

【技术实现步骤摘要】
基于模型不可知元学习方法的光储电网发电功率预测方法


[0001]本专利技术涉及光储电网发电
,更具体地说,涉及将工艺知识的统一结构化表示方法用于光储电网发电功率预测。

技术介绍

[0002]光储电网是一种大规模利用太阳能转化成电能的发电设备,在光储电网发电的场景中需要依据设备的发电功率确定设备的技术规格,存储设备的容量,传输设备的材料等一系列相关信息,同时也可以用于估算未来一段时间的收益判断投资的价值,因此准确的预测每个地区设备的发电量的能力尤为重要,在过去,目标发电量预测的准确性一方面取决于相关从业人员的个人经验,需要长期跟踪分析目标的情况,并根据气象数据,电站数据,设备数据进行分析;另一方面,架设光储蓄网的地理位置种类繁多,各自的发电功率趋势也有所不同,在考虑不同目标特征的同时还需要对相似类型的目标进行类比分析,这对人工预测而言是一项巨大的挑战。
[0003]预测未来发电功率的重要依据是该地区过去一段时间的发电效率数据,由于发电功率数据是以天为单位进行采集,并且沿时间方向具有一定的规律性,因此可以将问题抽象成为一个时间序列数据预测问题,使用过去的发电数据预测未来的发电功率趋势,目前在业务中较为常用的时间序列数据预测的方法可以分为两种,人工预测法和模型预测法,相比于使用计算机建模进行预测,人工预测法无论是速度还是总体上的预测准确度都有较大的差距,但是人工预测法同时也有难以替代的优势:首先对于有经验的从业者而言可以通过相同类型的序列模式快速推断出某种新的时间序列数据规律,其次对于某些模式变化较快的目标,可以通过从大量相同类型数据模式中学到的经验匹配到目标中,从而对看似没有规律的数据进行更准确的预测。对于模型预测法而言如何解决这些问题至关重要。根据使用的方法不同,模型预测法可以分为以下三个大方向:(1)直接建模法:通过历史数据趋势的特征总结出目标的规律,并将规律应用到未来的预测中(例如历史平均值法,滚动和平均法),该方法的优点是简单,直观,可解释性较强,并且可以加入人工对目标的数据特征分析的结果,缺点则是工作量较大,依旧需要对不同类型的目标分类进行分析,同时由于模型的复杂度最低,难以考虑到复杂的环境变化情况,所以准确率也难以保证。(2)机器学习法:将历史数据通过机器学习模型进行训练(如LDA,线性回归,决策树,随机森林,梯度提升树等方法),通过目标的特征(设备数据,电站数据,气象数据等)学习过去不同目标的规律,以未来目标的特征预测目标的发电效率,相比于直接建模法该方法的主要优势如下:首先机器学习模型可以将目标的种类特征,功能特征作为目标数据的一部分,在学习的过程中可以同时考虑相似目标的模式;其次,机器学习模型可以同时学习所有目标的特征,相比于需要人工分析的直接建模法节省了大量的人力;第三,部分机器学习模型(如随机森林,决策树)在提升模型准确性的同时保留了一定的可解释性。但是从宏观角度分析该类方法依旧存在可以优化的方向,首先机器学习模型虽然复杂度有所提升,但是针对复杂的情况,多元化的场景仍旧无法满足所有预测的需求;其次,机器学习模型的泛化能力较差,在一个数
据集上训练出的模型容易产生过拟合,针对具有不同的特征任务效果会有明显的下降;第三,在进行机器学习模型训练的过程中难以同时考虑过程中复杂的特征和时序信息,在进行数据处理的过程中通常会将时间信息作为一个特征输入(例如在随机森林模型训练过程中通常会加入当前日期之前一段时间日均发电效率滚动求和作为一个特征维度),对于发电效率有比较明显周期性特点的地区而言这种方法对时间序列的学习能力较差。(3)深度学习方法:近年来,以神经网络引擎为基础的深度学习方法也逐渐被应用到各项时序预测任务中去,如使用RNN对推特上的用户消费行为进行预测,在预测任务中比较常用的方法基本都是能够学习时序特征的神经网络模型(例如循环神经网络,长短期记忆神经网络等),选择合适的模型可以学习到模式中更深层的规律,在准确性上大大领先前两种方法,但是这种方法的缺点也比较明显:首先,基于损失函数引导的深度学习模型趋于在所有任务中尽可能取得最好的效果,但这也意味着针对某一个特定的任务,用同一种模型预测不同的目标依旧存在泛化能力不足的情况,难以捕捉到不同目标之间的模式区别;第二,通过目标过去一段时间的发电效率预测未来的发电效率走势,在面对新目标(刚铺设电站的地区)时效果不佳,难以从短期收集到的数据中捕捉到目标的模式。

技术实现思路

[0004]为了解决以上的问题,本专利技术提出的技术以效果最好的深度学习方法为基础,通过模型不可知元学习的方法将每一组具有相似特征的目标作为一个单独的“元任务”进行分析,使不同任务中可以学习到的预测经验作为“元知识”应用到其他的任务中,将本专利技术的目标从:训练出一个在每个元任务中都能表现优秀的模型;调整为:训练出一个自动能够生成针对每个元任务都能取得最好效果的模型的方法。本专利技术一种基于模型不可知元学习方法的光储蓄网发电功率预测技术,一方面可以从不同环境特征的发电设备中总结不同任务中通用的潜在规律,并用于其他地区中的发电功率情况,另一方面可以将于发电功率相关的静态、动态多元异构数据综合考虑,更全面的预测其发电功率规律趋势。
[0005]本专利技术的关键点是通过元学习技术解决在光储电网发电功率预测问题中,通过设计一个生成模型,结合特定任务的特征,将所有设备的预测问题拆分成不同电站范围内的发电设备功率预测问题,通过元学习的方法,使得从一个任务中学到的元知识可以在不同任务之间转移,这是通过共享参数实现的,元知识在不同任务之间转换对发电功率预测起关键作用。
[0006]本专利技术欲保护的点是解决发电功率预测问题中有限的参考样本和复杂的时空模式两种问题,针对任务特定的时空特征进行学习,同时将与发电效率相关的动态时间序列特征和静态特征联合进行建模,学习一个具有代表性的模型初始化参数值,显著提升模型在新场景中的拟合速度和预测准确度。
[0007]为了达到上述目的,本专利技术提供一种基于模型不可知元学习方法的光储电网发电功率预测方法,包括如下步骤:
[0008]S1.数据基本信息
[0009]在发电功率预测任务中,规定输入的样本X为发电功率的特征,包括动态特征和静态特征两种;动态特征为时序数据,包括设备数据和气象数据两种;其中设备数据是包括设备过去一段时间内的电池电压V、电池充电电流A、电池功率W、散热器温度℃、电池充电状态
以及逆变器状态;
[0010]气象数据包括过去一段时间内该设备所处位置的温度℃、湿度%m3/m3、CO2浓度ppm、蒸发mm、气压hPa、辐射W/m2、风向
°
、降雨量日累计mm,日照时长h,辐射间隔累计MJ/m2,光照度KLux在内数据特征;
[0011]静态特征则中设备数据包含电池类型、软件主版本号、所属设备、设备名称共4项,电站数据包含额定输出功率、逆变器充电状态共2项特征;
[0012]预测标签y为该区域内设备未来一段时间内的发电量趋势;
[0013]全体的数据集服从分布p(D
G
),本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于模型不可知元学习方法的光储电网发电功率预测方法,其特征在于,包括如下步骤:S1.数据基本信息在发电功率预测任务中,规定输入的样本X为发电功率的特征,包括动态特征和静态特征两种;动态特征为时序数据,包括设备数据和气象数据两种;其中设备数据是包括设备过去一段时间内的电池电压V、电池充电电流A、电池功率W、散热器温度℃、电池充电状态以及逆变器状态;气象数据包括过去一段时间内该设备所处位置的温度℃、湿度%m3/m3、CO2浓度ppm、蒸发mm、气压hPa、辐射W/m2、风向
°
、降雨量日累计mm,日照时长h,辐射间隔累计MJ/m2,光照度KLux在内数据特征;静态特征则中设备数据包含电池类型、软件主版本号、所属设备、设备名称共4项,电站数据包含额定输出功率、逆变器充电状态共2项特征;预测标签y为该区域内设备未来一段时间内的发电量趋势;全体的数据集服从分布p(D
t
),整体输入数据结构可以用来表示,其中t代表其中的时间节点,T
i
代表第i次记录事件,我们的目的是找到一个从X
i
到y
i
∈p(D
t
)的映射,其中p(D
t
)是所有任务所属的空间范围;S2.线性特征提取使用线性自回归捕获输入样本X线性的时间依赖关系,并获得一个粗粒度但稳定的时序表征关系,模型参数为ω
a
,包括自回归系数W
a
和偏置值b,y
a
(X
t
,ω
a
)代表线性模型预测得到的结果,h
t
代表t时刻的目标效率,AR模型可以用如下公式表示:y
a
(h
t
,ω
a
)=W
a
[h1…
h
t
‑1]+b在该场景,AR模型可以用于捕捉目标线性增长或下降的趋势;输入X为用于预测的发电效率时序数据,得到的线性预测结果y
a
作为特征融合的输入之一;S3.周期性特征提取使用skip

LSTM[13]提取不同周期性的非线性模式特征,x
t
表示t时刻的输入样本值,h
t
代表t时刻的目标效率对不同跳跃间隔的时间序列数据进行建模,以学习多个周期模式,并输出不同间隔的嵌入模型,skip

LSTM的表述如下:其中p代表间隔的时间周期,p=1用于挖掘天颗粒度的特征,p=7用于挖掘周颗粒度的特征,p=30用于挖掘月颗粒度的特征,得到的包含不同周期规律的预测结果作为特征融合的输入之一;S4.线性特征和周期性特征的融合输入为S2和S3的输出,y
a
与y
l
,经过一个多层感知机F将两个信息融合:X

=F
ω,L
(y
a
,y
l
)其中ω为模型中的可训练参数,L为损失函数。经过这一步得到的数据作为元学习模型的输入X


S5.子任务划分将全部数据X

随机分割成和源域和目标域,作为元学习模型的训练集和测试集,是两个互补的子任务的集合,在该任务中,我们发现电站的发电功率趋势与其地理位置和中央电站设备情况有一定相关性,因此以电站为单位进行子任务划分,每一个子任务的范围是一个中央电站周围的光伏发电设备的发电功率预测,其中每一个子任务中都包含自己的输入数据和预测结果,再将每一个独立的元任务输入,输出数据{(X

i
,y
i
)}分割成任务内部的训练集和测试集源域上的样本需要在有监督学习的情况下推进更新,再将结果应用到目标域上测试效果;S6.基础模型的选择选择CNN或LSTM作为元学习的优化目标,针对基础模型的训练过程如下:CNN序列模型训练:在CNN模型中结构可分为三层,嵌入层,卷积层和多层感知机层,对一维向量的卷积操作可以挖掘其延时间维度t的数据模式,从而捕捉的时间序列中的特征,其中的可训练参数包括:嵌入层的权值矩阵...

【专利技术属性】
技术研发人员:闫行一金博魏小鹏
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1