基于特征提取与优化算法的新能源组合预测方法及系统技术方案

技术编号:38399556 阅读:21 留言:0更新日期:2023-08-07 11:12
本发明专利技术为一种基于特征提取与优化算法的新能源组合预测方法及系统,包括获取实际预测点的历史新能源数据,并将其提供给预过滤模型,预过滤模型对数据集执行清洗、集成、修正、异常值移除、规范化和结构化操作,形成预测数据集;预测数据集被送入FE模型,所述FE模型包括混合特征选择模型和提取模型去除冗余、不相关和不明确的新能源数据特征,并选择最相关的特征;处理好的数据分为训练数据样本和测试数据样本,构建训练和测试样本,提供给基于SVR的预测模型,采用mFFO算法选择并调整预测模型的SVR超参数,预测未来的高比例新能源。提高计算效率和解决降维问题,具有快速、准确和稳定的性能。性能。性能。

【技术实现步骤摘要】
基于特征提取与优化算法的新能源组合预测方法及系统


[0001]本专利技术属于新能源组合
,具体地而言为一种基于特征提取与优化算法的新能源组合预测方法及系统。

技术介绍

[0002]在智能电网中,准确的高比例新能源预测对于操作和规划管理等战略决策,维护调度,能量转换,安全和需求监测评估以及确保可靠供电是至关重要的。相比之下,高比例新能源预测过高或过低都会给智能电网战略决策引入各种挑战。
[0003]高比例新能源预测过高的带来的挑战是建立额外旋转备用,导致提高运营成本。相反,高比例新能源预测低估会造成可靠性、电能质量、安全和监控方面的问题。因此,准确和精确的高比例新能源预测对于新型电力系统可持续、安全、可靠运行是必要的。
[0004]为了评估高比例新能源预测的价值,目前研究根据预测时间范围将新能源预测问题分为三类:长期、中期和短期。然而,在这三类预测问题中,主要关注短期高比例新能源预测,包括日前或周前的新能源估计。这些方法可分为三类:(1)经典方法,(2)智能方法,和(3)混合方法。经典方法包括基于卡尔曼滤波的方法、基于回归的方法、状态空间模型、指数平滑法、自回归综合移动平均法(ARIMA)和box

Jenkins模型。经典的统计方法识别并获得电力消耗模式,然后将时间序列方法应用于所获得的模式,以提供未来的测量。然而,这些方法在线性分析中表现良好,在非线性时间序列预测中表现最差。为了更好地处理非线性时间序列新能源预测,提出了基于人工智能的方法。这些方法不需要复杂的数学建模,可以有效地处理新能源时间序列数据。基于人工智能的方法包括可用于高比例新能源预测的人工神经网络(ANN)、机模型学习模型、支持向量机(SVM)、深度学习模型和专家系统。
[0005]在预测方法中,智能方法在高比例新能源预测中受到了广泛的关注。在智能方法中,人工神经网络被认为是很有前途的预测工具,广泛应用于各种新能源预测应用中。然而,人工神经网络存在网络建设问题、历史依赖性、连接权重估计和过度拟合问题等弱点。因此,支持向量机成为克服人工神经网络局限性的创新解决方案。支持向量机分别使用经验风险和结构风险最小化原则来最小化训练和泛化误差。它在高维空间中线性求解非线性问题,以达到全局最优,避免局部最优。SVM的良好性能为其在文本分类、模式识别、图像识别和分类等不同领域的成功应用铺平了道路。然后,将开发的SVM模型扩展为回归问题的估计,即支持向量回归(SVR)。SVR在金融、管理科学、大气科学和高比例新能源预测等多种应用中具有优异的预测性能。SVR模型的预测精度在很大程度上取决于超参数的选择和调整(c,σ,ε).因此,在SVR模型中,超参数的优化和适当调整是一个具有挑战性的问题。
[0006]然而,一种方法并非在所有工况都适用(准确性、收敛速度、稳定性),因为每种方法都有其自身的缺陷和固有的局限性。例如,非线性和季节性行为无法通过基于线性回归的模型学习。灰色模型特定于指数增长趋势。专家系统依赖于强大的知识库,智能方法依赖于随机权重、偏差、阈值和超参数调整。这些问题影响高比例新能源预测,并导致性能不稳定。这些缺点使得一种方法无法同时实现所有目标(准确性、收敛速度、稳定性)。为了克服
个别方法带来的问题和局限性,可以将启发式、元启发式和仿生等几种优化算法与单个模型集成,以构建混合模型。其目的是通过优化单个模型的随机权重初始化、偏差、阈值和超参数调整,实现高精度并克服最终预测结果的不稳定性。
[0007]新型组合预测模型是智能解决方案,其充分利用了单个模型的理想特性,以确保卓越的性能。例如,基于改进的差分进化(IDE)和小波神经网络(WNN)开发了用于高比例新能源预测的混合模型;开发支持向量机和排斥粒子群优化(RPSO)算法的级联框架,用于高比例新能源预测。同样,混沌磷虾群(CKH)算法和SVR的集成模型也被用于时间序列预测;基于差分进化(DE)和SVR开发混合模型,通过调整SVR参数来提高预测精度。该模型优于典型的SVR、反向传播ANN和回归模型;SVR和果蝇算法相结合的模型,以解决参数选择问题,提高能耗预测精度。同样,萤火虫优化(FFO)算法与SVR模型相结合,通过优化超参数调整确保准确的新能源预测。上述混合模型在通过适当调整SVR超参数来提高预测精度方面是有前途和有价值的。然而,传统研究方法要么专注于优化随机权重和偏差初始化,要么专注于适当的超参数设置和选择。此外,这些模型都没有同时考虑精度、稳定性和收敛速度。
[0008]然而,仅考虑一个方面(随机权重和偏差初始化的优化或适当的超参数设置和选择)和一个标准(准确性或稳定性或收敛速度)是不够的。因此,需要一种鲁棒的混合模型来克服现有模型存在的问题,同时以较快的收敛速度提高预测精度和稳定性。

技术实现思路

[0009]本专利技术所要解决的技术问题在于提供一种基于特征提取与优化算法的新能源组合预测方法,提高计算效率和解决降维问题。
[0010]本专利技术另一方面还提供一种基于特征提取与优化算法的新能源组合预测系统。
[0011]本专利技术是这样实现的,
[0012]一种基于特征提取与优化算法的新能源组合预测方法,该方法包括:
[0013]获取实际预测点的历史新能源数据,形成预测数据集;
[0014]基于特征提取模型,在所述预测数据集选择最相关的特征;
[0015]将所述最相关的特征分为训练数据样本和测试数据样本,构建训练和测试样本;
[0016]基于训练和测试样本,采用mFFO算法选择并调整预测模型的支持向量机超参数,预测未来的高比例新能源。
[0017]进一步地:所述特征提取模型包括混合特征选择模型和提取模型,用于去除冗余、不相关和不明确的新能源数据特征;
[0018]所述混合特征选择模型包括基于RAF的α评估模型和基于REF的β评估模型,采用基于RAF的α评估模型的RAF方程,使用OOB数据计算特征重要性,特征重要性计算后,重要特征存储在ω
r

j
],其中,OOB数据为袋外数据样本,用于确定特征重要性,RAF方程为:
[0019][0020]α评估模型和β评估模型特征重要性更新如下:
[0021][0022][0023]D为数据训练集,C表示一种级别,d
*
是这级中的随机一项,函数diff(D,r1,r2)计算属性差异diff在r1和r2之间,ω
F
和ω
r
分别是基于RAF和基于REF的特征重要性,diff函数的数学模型为:
[0024][0025]将基于RAF的特征重要性ω
r
和基于REF的特征重要性ω
F
标准化为:
[0026][0027][0028]标准化后采用式(7)进行特征选择:
[0029][0030]κ为特征选择控制阈值;所述提取模型的提取过程包括:
[0031]特征选择过程的输出作为径向基核主成分分析的输本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于特征提取与优化算法的新能源组合预测方法,其特征在于,该方法包括:获取实际预测点的历史新能源数据,形成预测数据集;基于特征提取模型,在所述预测数据集选择最相关的特征;将所述最相关的特征分为训练数据样本和测试数据样本,构建训练和测试样本;基于训练和测试样本,采用mFFO算法选择并调整预测模型的支持向量机超参数,预测未来的高比例新能源。2.按照权利要求书1所述的基于特征提取与优化算法的新能源组合预测方法,其特征在于,所述特征提取模型包括混合特征选择模型和提取模型,用于去除冗余、不相关和不明确的新能源数据特征;所述混合特征选择模型包括基于RAF的α评估模型和基于REF的β评估模型,采用基于RAF的α评估模型的RAF方程,使用OOB数据计算特征重要性,特征重要性计算后,重要特征存储在ω
r

j
],其中,OOB数据为袋外数据样本,用于确定特征重要性,RAF方程为:α评估模型和β评估模型特征重要性更新如下:α评估模型和β评估模型特征重要性更新如下:D为数据训练集,C表示一种级别,d
*
是这级中的随机一项,函数diff(D,r1,r2)计算属性差异diff在r1和r2之间,ω
F
和ω
r
分别是基于RAF和基于REF的特征重要性,diff函数的数学模型为:将基于RAF的特征重要性ω
r
和基于REF的特征重要性ω
F
标准化为:标准化为:标准化后采用式(7)进行特征选择:κ为特征选择控制阈值;所述提取模型的提取过程包括:特征选择过程的输出作为径向基核主成分分析的输入:X=(x1,x2,x3,,,,x
N
)
T
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)x
i
是与高比例新能源特征有关的i
th
变量;
特征值和特征之间的相关性通过下式计算:λ
e
=V
F*
e,λ≥0&e∈F*
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)V是X的协方差矩阵,F*表示特征空间,λ表示特征值,其中,V
F*
为:为:为:表示输入数据到要素空间的映射,<s,y>计算x和y的内积,特征值和特征之间的相关性数学建模为:λ=0时,e数学建模为:β
i
表示x
i
的系数,的形式是未知的,内核函数如下:特征值和特征之间的相关性数学建模和e数学建模的组合形式的数学模型为:假设j∈[1,N],β=(β1,β2,β3,......,β
N
)
T
,将上式(15)联合内核函数重新建模为:λNKβ=K2β
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(16)通过选取特征向量并对特征向量进行归一化为:e数学建模放入归一化表达式(17),并联合公式(16)得到公式(18):将公式(18)带入公式(19)得到降维后的特征向量:
3.根据权利要求1所述的基于特征提取与优化算法的新能源组合预测方法,其特征在于:所述预测模型采用SVR回归函数将输入和输出之间的映射描述为:ω和b分别是要优化/调整的权重和偏差;采用经验风险函数的数学模型如下:R
e
(f)是经验风险函数,以及Φ
E
表示密集损失函数,其中密集损失函数为:利用密集损失函数得到一个最优超平面,该超平面将训练数据分割成具有最大分离距离的线性可分离子集,目标函数被视为最小化函数:其中c表示第一项和第二项之间的权衡参数,通过设置两个分离数据之间的最大距离来压缩较大权重,并使用密集损失函数来减小f(x)和y之间的误差,目标函数受以下约束。通过目标函数以及约束得到SVR回归函数的系数。4.根据权利要求3所述的基于特征提取与优化算法的新能源组合预测方法,其特征在于:采用mFFO算法选择并调整预测模型的支持向量机超参数的具体步骤包括:步骤1:mFFO算法的参数初始化;步骤2:创建萤火虫的初始种群,每只萤火虫都有一个向量,向量有三个元素,三个元素包括:c,ε和σ:X
i
=[σ
i

i
,c
i
]步骤3:确定适应度函数,并使用误差函数MAPE作为目标函数;步骤4:根据误差函数MAPE的最佳值选择最佳萤火虫;步骤5:更新萤火虫的种群,为新生成的群体确定误差函数MAPE,在种群中,使用较低的误差函数MAPE值更新萤火虫位置,否则,请保持萤火虫之前的位置;步骤6:用最好的萤火虫更新位置;步骤7:检查停止标准,如果满足终止条件,停止;否则,返回步骤5;其中,所述更新萤火虫的种群以及更新萤火虫的位置包括:设置萤火虫数目n,最大吸引度β0,光强吸收系数γ,步长因子α,最大迭代次数或搜索精度ε;随机初始化萤火虫的位置,计算萤火虫的目标函数值作为各自最大萤光亮度I0;计算群体中萤火虫的相对亮度I和吸引度β,根据相对亮度决定萤火虫的移动方向;更新萤火虫的空间位置,对处在最佳位置的萤火虫进行随机扰动;根据更新后萤火虫的位置,重新计算萤火虫的亮度;当满足搜索精度或达到最大搜索次数则转下一步;否则,搜索次数增加1,转第三步,进行下一次搜索;输出全局极值点和最优个体值。
5.根据权利要求4所述的基于特征提取与优化算法的新能源组合预测方法,其特征在于:假设在每次迭代中的萤火虫群体中是最好的个体,是最差的个体,在萤火虫种群中的i
th
萤火虫,再随机选择三只萤火虫X
q1
,X
q2
和X
q3
.q1≠q2≠q3≠i.这两个新的个体被创建为:X
muate1
=X
q1

×
(q2

q3)Δ是介于0和1之间的随机数,利用X
mutate1
和X
mutate2
,五只萤火虫的生成如下:,五只萤火虫的生成如下:,五只萤火虫的生成如下:,五只萤火虫的生成如下:,五只萤火虫的生成如下:,五只萤火虫的生成如下:k1:k5,ψ和ξ表示介于[0,1]之间的随机变量;所述步长因子α监视并控制在0到1之间随机拾取的每个萤火虫的移动。所述步长因子α进行多次迭代生成,每代的不同启发式函数为:itr表示从1到k
max
的迭代次数。6.根据权利要求5所述的基于特征提取与优化算法的新能源组合预测方法,其特征在于:所述误差函数MAPE为:7.一...

【专利技术属性】
技术研发人员:唐俊刺王冠夫冯占稳姜枫蔡壮乔路丽刘广利刘盛琳宋丽崔嘉李子涵杜玉婷李春晖姜宇高深
申请(专利权)人:国网辽宁省电力有限公司国家电网有限公司沈阳工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1