一种具备可解释性的数据驱动电力系统暂态稳定评估方法技术方案

技术编号:37435475 阅读:11 留言:0更新日期:2023-05-06 09:07
本发明专利技术公开了一种具备可解释性的数据驱动电力系统暂态稳定评估方法,涉及人工智能技术在电力系统中的应用领域。本发明专利技术应用数据驱动思想、特征降维去噪、样本增强的数据预处理方法、可解释性原理,研究电力系统暂态稳定评估方法及其可解释性分析;总体方案包括离线训练及在线训练两部分,其中离线训练包括样本生成、模型训练及可解释分析,为保障电力系统安全稳定提供新的辅助分析和决策支持手段。包括基于电力系统安全状态、警戒状态、紧急状态和崩溃状态的样本特征提取技术;基于合成少数过采样原理SMOTE的样本数据增强技术;基于改进机器学习的暂态稳定评估及损失函数构建方法;基于模型决策和数据特征的可解释原理;本发明专利技术在多个方面在重大进步。在多个方面在重大进步。在多个方面在重大进步。

【技术实现步骤摘要】
一种具备可解释性的数据驱动电力系统暂态稳定评估方法


[0001]本专利技术涉及人工智能技术在电力系统中的应用领域,具体为一种具备可解释性的数据驱动电力系统暂态稳定评估方法。

技术介绍

[0002]电力系统的暂态稳定分析是保障电力系统正常运行的基础。“双碳”目标下,随着高比例新能源电力电子设备的大规模并网以及远距离特高压交直流输电的推广普及,电源结构发生了重大变化(周孝信,陈树勇,鲁宗相,黄彦浩,马士聪,赵强.能源转型中我国新一代电力系统的技术特征[J].中国电机工程学报,2018,38(07):1893

1904+2205.),电网安全稳定特性更加复杂、控制难度加大,电力系统的安全稳定面临着严峻考验。随着电力电子设备的大量涌现,电网的暂态过程仿真分析模型日益复杂,新能源发电则使得电网潮流分布的变化和转移更加迅速。这些都对基于时域仿真的暂态稳定评估方法提出了挑战,且对于大规模系统物理模型建模困难(胡伟,郑乐,闵勇,董昱,余锐,王磊.基于深度学习的电力系统故障后暂态稳定评估研究[J].电网技术,2017,41(10):3140

3146.),其相对固化的逻辑难以满足当下电力系统的需求。
[0003]随着广域量测技术的成熟和人工智能技术的发展,基于人工智能方法的电力系统在线暂态稳定评估为大电网的智能分析与控制提供了一条崭新途径(黄明增,胡雅涵,文云峰,李玲芳,肖友强.融合JMIM和NGBoost的电力系统暂态稳定评估方法[J].电力系统自动化,2021,45(08):155<br/>‑
165.)。机器学习解决的关键问题是能自动从简单的原始特征中提取出复杂抽象的特征,具有强大的非线性表达和模型识别能力。一方面,对历史数据的分析有助于了解电网运行的故障特性,另一方面在线数据的分析有助于掌握电网实际运行状态,以构建或校正暂态稳定评估模型。但数据方法的性能高度依赖于数据规模和质量,而获取实际电网获取这些传输数据时必然会遭受到不同噪声的干扰,同时数据方法由于缺乏对物理知识的理解性和对结果的解释性,使其可靠性大幅降低而受限于在核心领域的应用。常用数据驱动的暂态稳定分析方法包括机器学习(叶圣永,王晓茹,刘志刚,等.基于支持向量机增量学习的电力系统暂态稳定评估[J].电力系统自动化,2011,35(11):15

19)、迁移学习(申锦鹏,杨军,李蕊,等.基于改进域对抗迁移学习的电力系统暂态稳定自适应评估[J/OL].电力系统自动化:1

13[2022

11

09])和深度学习(高昆仑,杨帅,刘思言,等.基于一维卷积神经网络的电力系统暂态稳定评估[J].电力系统自动化,2019,43(12):18

26.)等在内的多种机器学习算法都取得了良好的应用效果,但也存在特征不合理、模型准确率低以及可解释性差等仍待解决的问题。图1为现阶段暂态稳定评估中存在的问题。
[0004]具体而言,选择高度凝练且具有代表性的输入特征是数据驱动电力系统暂态稳定方法的首要条件。目前的研究大多依靠先验知识选择影响暂态过程的因素作为特征,但一方面无法保证选择的全面性,另一方面特征间冗余度高,易造成高维空间样本的维数灾难,且对于实际中样本不均衡问题没有深入研究。文献(Gomez,F.R.,Rajapakse,A.D.,Annakkage,U.D.,Fernando,I.T..Support Vector Machine

Based Algorithm for Post

Stability Assessment Based on Big Data and the Core Vector Machine.[J].IEEE Trans.Smart Grid,2016,7(5))基于长短时记忆网络构建了时间自适应的暂态稳定评估系统,且能平衡准确率和训练速度之间的矛盾。文献(邵美阳,吴俊勇,李宝琴,张若愚.基于两阶段集成深度置信网络的电力系统暂态稳定评估[J].电网技术,2020,44(05):1776

1787.)通过概率输出机制组合不同结构的深度置信网络,并以模型决策概率来衡量结果的可信度。然而,深度学习模型需要大量的样本以建立优异的映射关系,对样本依赖性强。区别于深度学习,集成学习对样本依赖性低,且具有较高的精度。文献(戴远航,陈磊,张玮灵,闵勇,李文锋.基于多支持向量机综合的电力系统暂态稳定评估[J].中国电机工程学报,2016,36(05):1173

1180.)构建了基于集成支持向量机的暂态稳定评估模型,通过计算距离最优分类面的远近程度进行可信度评价。但是,仅对输出结果进行简单的平均处理,无法有效解决对噪声敏感度高以及对大样本数据适应性低等支持向量机的固有缺陷。然而,普遍未考虑到样本类别的不平衡,并默认所有样本的训练权重相同,使机器学习模型对不同状态的学习能力存在较大差异,某些样本由于随机性无法被模型训练到,且模型无法从分类错误的样本中得到改进,降低了模型的泛化能力。
[0006]数据驱动机模型的黑箱性质限制了其在实际电力系统中的应用。暂态功角稳定的在线评估对可解释性的要求是一方面快速准确地给出决策依据,另一方面挖掘影响暂态过程的关键因素,为调度人员提供可理解的评估结果。在可解释性方面,端到端的学习策略使以神经网络为代表的深度学习成为数据驱动下的黑箱模型(Collaris Dennis,Van Wijk Jarke.StrategyAtlas:Strategy Analysis for Machine Learning Interpretability.[J].IEEE transactions on visualization and computer graphics,2022,PP),一方面,对输出结果无法给出决策依据降低了模型的可信度,缺乏物理原理支撑,人们难以探究模型从数据中挖掘的隐含知识,对于更新领域知识和指导实践无法起到作用;另一方面,深度学习的工作过程无法感知,无法评判其合理性,降低了模型的可靠性。基于机器学习的可解释方法主要有三种,且主要集中在图像识别、语言处理、医疗诊断层面:首先是建立本身具备可解释性的模型(成科扬,王宁,师文喜,詹永照.深度学习可解释性研究进展[J].计算机研究与发展,2020,57(06):1208

1217),如线性模型、决策树(Mangalathu Sujith,Karthikeyan Karthika,Feng De

Cheng,Jeon Jong

Su.Machine

learning interpretability techniques for seismic performance assessment of infrastructure systems[J].Engineering Structures,2022,25本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种具备可解释性的数据驱动电力系统暂态稳定评估方法,其特征在于:包括如下步骤:阶段1:基于数据与知识融合的样本,特征加强:

样本生成:在PSASP软件中仿真搭建IEEE39节点系统,为体现新能源对系统暂态稳定性的影响,将若干火力发电机替换为风力发电机,再将另外的一台火力发电机替换为光伏发电机,构造发电机组、负荷在允许范围内变化的潮流方式和不同故障方式的暂态场景;提取包含母线、发电机、交流线、负荷信息的运行特征与具有物理意义的统计学组合特征,其中选择运行特征的目的是全面涵盖反映暂态过程的物理信息,直接由WAMS采集得到;组合特征的目的是将同类运行特征经过数学运算合并归一,达到减小特征维度并有助于挖掘影响暂态过程的本质因素;

标签构造:分析样本经过暂态过程后,系统中各机组之间的功角经过第一或第二振荡周期是否失步,若任意两台发电机功角不失步且作同步衰减振荡,则该样本为正常状态,否则为不正常状态;在正常状态中,进行全网N

1校验,若对所有N

1故障系统仍能保持同步稳定运行,则系统具有足够的稳定裕度,相应的样本处于安全状态,用标签1表示;若至少有一种N

1故障失稳,则相应样本处于警戒状态,用标签2表示;在不安全状态中,通过能量原理,即振荡时有功功率是否过零点,进而判断系统是否非发生同步振荡解列,若系统未发生解列则该样本为紧急状态,用标签3表示,反之则为崩溃状态,用标签4表示;

样本加强:为解决样本类别不均衡的问题,使用随机欠采样方法修剪多数类中的样本数量,利用SMOTE原理为少数类别创建尽可能多的合成样本,以平衡类别分布;为解决噪声干扰问题,采用改进的分段聚焦近似PAA方法,首先将样本按标签分为四组,在每组中计算平均特征值,对相同状态标签分组采用等时间间隔的分段聚焦近似拟合,并筛除距离平均值较远的拟合值;

特征加强:为降低特征维度,采用递归特征消除方法获得最佳评估特征数量,并依据相关系数进行特征筛选,在保持高准确率的同时使尽量少的特征用于模型训练,避免模型过拟合问题,并提高训练速度;阶段2:数据驱动的暂态稳定评估:

模型构建:在python的sklearn环境下搭建随机森林模型,对目标函数进行改进,如公式(1)所示:其中N为样本总数,L为损失函数,R(h)为正则项,表示各基础分类器的平均决策路径长度,ε为正则系数;

模型优化:对模型制定评估指标,从结构和参数上对模型进行改良,使之对数据集达到尽量准确的拟合效果;改变系统稳态运行条件、故障条件、仿真模型及评估模型,将选择的特征集在不同条件下进行评估,判断是否能达到同样的性能;将最终的评估模型进行可视化,形成图像,其中X代表特征,gini为基尼系数,越小代表分类越彻底,samples代表样本数,values代表每一类...

【专利技术属性】
技术研发人员:武宇翔牛哲文韩肖清赵津蔓闫博阳
申请(专利权)人:太原理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1