基于自动化机器学习的多变量光伏发电功率预测方法与装置制造方法及图纸

技术编号:36811533 阅读:34 留言:0更新日期:2023-03-09 00:47
本发明专利技术公开了一种基于自动化机器学习的多变量光伏发电功率预测方法与装置,所述方法包括步骤为:步骤1、准备光伏发电数据;步骤2、对数据进行特征预处理和特征选择;步骤3、构造模型搜索空间,包括需要搜索的模型、以及模型基本结构;步骤4、模型优化,具体为对模型空间和超参数进行搜索,每次搜索的结果为一个完整的模型结构及其超参数配置;步骤5、使用训练数据训练模型,并对模型进行评估,根据评估结果选择最优的模型与超参数,最后输出训练完成的最佳模型;步骤6、通过最佳模型对多变量光伏发电功率进行预测。本发明专利技术可以对混合类型的数据进行数据填补,在属性具有缺失、属性值波动性较大的光伏数据集上能够取得较好预测效果。较大的光伏数据集上能够取得较好预测效果。较大的光伏数据集上能够取得较好预测效果。

【技术实现步骤摘要】
基于自动化机器学习的多变量光伏发电功率预测方法与装置


[0001]本专利技术涉及自动化机器学习,具体是一种基于自动化机器学习的多变量光伏发电功率预测方法与装置。

技术介绍

[0002]随着“双碳”发展目标实施,大力发展光伏发电等新能源技术具有与时俱进的重要战略意义。光伏发电是太阳能新能源的一种重要的应用技术,具有随机性和因昼夜引起的间歇性的特点,易受太阳辐射、温度、风速等天气因素影响。大规模的光伏发电并网可能导致电网电压剧烈波动,给电力系统的运行和调节带来很大的挑战。因此精准的光伏发电功率预测,能够使得电力系统调度中心可以更好地安排调度计划,并及时调整系统工作状态可以降低储能容量和运营成本,对电网系统的平稳运行具有重要意义。
[0003]目前很多人工智能算法在光伏发电功率预测工作中已经得到了较好的应用。但是人工智能算法在其他领域的应用往往需要领域专家与算法工程师合作进行,很大程度限制了人工智能算法的应用范围,具有一定的难度。
[0004]自动化机器学习是一种基于神经架构搜索的自动化机器学习工具,它能够使领域专家自动构建机器学习程序,而无需太多人工智能方面的专业知识。因为它可以帮助几乎没有机器学习知识的人构建高质量的自定义模型,从数据特征工程、到模型的搭建、超参数选择等过程都是自动化进行。如今已被广泛的应用于农业、工业等领域。AutoTS是一种应用于时间序列数据研究中的自动化机器学习框架。由于其提出的时间较短,目前还未发现在光伏发电功率预测工作中的应用研究。

技术实现思路

[0005]本专利技术的目的在于提供一种基于自动化机器学习的多变量光伏发电功率预测方法与装置,实现对混合类型的数据进行数据填补,以及对属性具有缺失、属性值波动性较大的光伏数据实现较好的预测。
[0006]本专利技术采取的技术方案如下:
[0007]第一方面,本专利技术提供一种基于自动化机器学习的多变量光伏发电功率预测方法,其包括以下步骤:
[0008]步骤1、准备光伏发电数据;
[0009]步骤2、对数据进行特征预处理和特征选择;
[0010]步骤3、构造模型搜索空间,包括需要搜索的模型、以及模型基本结构;
[0011]步骤4、模型优化,具体为对模型空间和超参数进行搜索,每次搜索的结果为一个完整的模型结构及其超参数配置;
[0012]步骤5、使用训练数据训练模型,并对模型进行评估,根据评估结果选择最优的模型与超参数,最后输出训练完成的最佳模型;
[0013]步骤6、通过最佳模型对多变量光伏发电功率进行预测。
[0014]进一步的,所述步骤1中,准备的光伏发电数据按照比例8:1:1分为三部分,80%作为训练集,10%作为验证集,10%作为测试集进行训练。
[0015]进一步的,所述步骤2中,特征预处理包括使用missforest算法对缺失数据进行填补,具体为:先将数据分为四部分,分别为变量的观测值,变量的缺失值,变量以外的观测值以及变量缺失值以外的其余观测值;然后对变量的缺失值进行预测,使用均值填充法,按照变量的缺失率从小到大排序,先对缺失率小的变量使用随机森林回归从而填补该变量的缺失值,随后一直迭代,直到最新的一次填补结果与上一次的填补结果不再变化或变化很小时停止。
[0016]进一步的,迭代指标是迭代时损失值变化的大小,公式如下所示:
[0017][0018]其中,ΔN是迭代指标,j代表当前迭代的轮次,X
new
代表最新一次填补结果,X
old
代表上一次填补结果。
[0019]进一步的,所述步骤2中,预处理之后再对包括时间、辐照度、温度、湿度、风向、风速、压强、实际辐照度以及发电功率在内的多维数据进行特征选择,将冗余无用的特征筛选掉。
[0020]进一步的,使用F分数进行评估,公式如下所示:
[0021][0022]其中,i代表第i个特征,代表第i个特征的阳性样本的平均特征值,代表第i个特征的阴性样本的平均特征值,代表第i个特征的平均特征值,k是对于具体第i个特征的第k个实例,分母为阳性样本与阴性样本的特征值的方差之和;
[0023]根据F分数大小选择时间、辐照度、历史发电功率作为主要特征进行光伏发电功率的预测任务。
[0024]进一步的,基于Prophet、SARIMAX以及XGBoost三种模型对搜索空间进行构造,然后进行模型结构和参数的优化,公式如下所示:
[0025]f
*
=argminCost(F(θ
*
),D
val
)
[0026]θ
*
=argminLoss(F(θ),D
train
)
[0027]其中,f
*
为最优的神经网络模型,θ
*
为最优的学习参数,F为神经网络搜索空间,D
val
和D
train
分别是输入数据的训练以及验证部分,成本和代价函数为Cost(.,.),模型损失函数为Loss(.,.);
[0028]先将数据训练部分以及神经网络搜索空间进行优化,找到最低损失的学习参数,然后将数据验证部分和找到的最优学习参数的模型根据成本代价函数找到最优的神经网络模型。
[0029]进一步的,采用模拟退火算法作为优化算法自动选择模型结构和超参数,具体为:先计算初始解并生成计算目标函数,随后扰动生成新解并计算新的目标函数,将两次得到
的目标函数值相减得到参数的变化量,若变化量为正,则按照Metrapolis准则接受新解;若为负,则直接接受新解;接着判断是否达到迭代次数,若未达到,返回上一步;若达到,则判断是否满足终止条件,若未满足,缓慢降低参数值并重置迭代次数;若满足,结束算法,从而得到最优参数。
[0030]进一步的,采用均方根误差RMSE作为评估指标,公式如下所示:
[0031][0032]其中,y和分别代表真实值以及预测值,i和n分别代表当前进行的轮数与总共的轮数。
[0033]第二方面,本专利技术还提供一种基于自动化机器学习的多变量光伏发电功率预测装置(系统),其包括:
[0034]获取模块,用于获取待预测区域的光伏发电数据;
[0035]预测处理模块,用于将待预测区域的光伏数据输入到预先训练好的最佳预测模型中,并输出该区域的光伏发电功率。
[0036]第三方面,本专利技术还提供一种基于自动化机器学习的多变量光伏发电功率预测模型构建装置,其包括:
[0037]数据处理单元,用于对光伏发电数据进行特征预处理和特征选择;
[0038]模型构造单元,用于构造模型搜索空间,包括需要搜索的模型、以及模型基本结构;
[0039]模型优化单元,用于对模型空间和超参数进行搜索,每次搜索的结果为一个完整的模型结构及其超参数配置;
[0040]模型训练单元,用于使用训练数据训练模型,
[0041]模型评估单元,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自动化机器学习的多变量光伏发电功率预测方法,其特征在于包括以下步骤:步骤1、准备光伏发电数据;步骤2、对数据进行特征预处理和特征选择;步骤3、构造模型搜索空间,包括需要搜索的模型、以及模型基本结构;步骤4、模型优化,具体为对模型空间和超参数进行搜索,每次搜索的结果为一个完整的模型结构及其超参数配置;步骤5、使用训练数据训练模型,并对模型进行评估,根据评估结果选择最优的模型与超参数,最后输出训练完成的最佳模型;步骤6、通过最佳模型对多变量光伏发电功率进行预测。2.根据权利要求1所述的一种基于自动化机器学习的多变量光伏发电功率预测方法,其特征在于,所述步骤1中,准备的光伏发电数据按照比例8:1:1分为三部分,80%作为训练集,10%作为验证集,10%作为测试集进行训练。3.根据权利要求1所述的一种基于自动化机器学习的多变量光伏发电功率预测方法,其特征在于,所述步骤2中,特征预处理包括使用missforest算法对缺失数据进行填补,具体为:先将数据分为四部分,分别为变量的观测值,变量的缺失值,变量以外的观测值以及变量缺失值以外的其余观测值;然后对变量的缺失值进行预测,使用均值填充法,按照变量的缺失率从小到大排序,先对缺失率小的变量使用随机森林回归从而填补该变量的缺失值,随后一直迭代,直到最新的一次填补结果与上一次的填补结果不再变化或变化很小时停止。4.根据权利要求3所述的一种基于自动化机器学习的多变量光伏发电功率预测方法,其特征在于,迭代指标是迭代时损失值变化的大小,公式如下所示:其中,ΔN是迭代指标,j代表当前迭代的轮次,X
new
代表最新一次填补结果,X
old
代表上一次填补结果。5.根据权利要求1所述的一种基于自动化机器学习的多变量光伏发电功率预测方法,其特征在于,所述步骤2中,预处理之后再对包括时间、辐照度、温度、湿度、风向、风速、压强、实际辐照度以及发电功率在内的多维数据进行特征选择,将冗余无用的特征筛选掉。6.根据权利要求5所述的一种基于自动化机器学习的多变量光伏发电功率预测方法,其特征在于,使用F分数进行评估,公式如下所示:其中,i代表第i个特征,代表第i个特征的阳性样本的平均特征值,代表第i个特征的阴性样本的平均特征值,代表第i个特征的平均特征值,k是对于具体第i个特征的第
k个实...

【专利技术属性】
技术研发人员:戚成飞杨晓波刘岩毕超然王耀宇易忠林程杰马鲁晋魏彤珈杨晓坤郑思达熊洪樟李文文高帅郭皎姜振宇易姝娴
申请(专利权)人:国网冀北电力有限公司计量中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1