区域级电网多源异构数据处理及特征分析方法及设备技术

技术编号：40903915 阅读：8 留言：0更新日期：2024-04-18 14:35

本发明专利技术涉及电力系统阻塞预警技术，具体涉及区域级电网多源异构数据处理及特征分析方法及设备，该方法包括对区域级电网多源异构数据进行处理：数据校验与修改；历史数据对时与重采样；数据标准化与整合。还包括对区域级电网阻塞场景的特征进行选择：基于Pearson相关系数的特征选择；基于Spearman相关系数的特征选择；基于Relief‑F算法的特征选择；形成区域级电网阻塞场景特征指纹库；通过数据指纹库判断未来阻塞场景。该方法在电力系统的大量特征中筛选出与阻塞相关或有利于阻塞预测的特征，有效地提炼出有效信息，有利于提升分析、预测的效率和准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及电力系统阻塞预警，尤其涉及区域级电网多源异构数据处理及特征分析方法及设备。

技术介绍

1、电力系统表现出数据量庞大、变量错综复杂的特性，这些特点显著影响了电力系统的分析和预测模型的建立。在电力系统迅猛发展的背景下，传统的基于专家经验的分析模式逐渐无法满足日益增长的需求。与此相比，基于数据驱动的方法更能有效地应对新型电力系统的数据复杂性。然而，数据驱动方法的建立需要整合大量的数据，以构建具备强大预测能力的模型，从而使得对数据的处理变得尤为关键。区域级电网的数据特征显示出规模庞大、类型丰富的特点。在不同省级电网部门之间，信息化建设常常是独立进行的，缺乏统一的标准与规范，导致形成了各自独立的“信息孤岛”。这些“信息孤岛”之间的数据呈现出时空特性复杂且异构性严重的特点，因此需要解决多源异构信息的收集、清洗、校核和融合等问题。随着电力系统规模和复杂度的不断增加，数据量和特征数量也在迅速膨胀。这导致在电力系统的建模和预测过程中，数据的维度过高，存在大量冗余特征和干扰数据，进而影响了预测和决策的准确性和效率。因此，迫切需要对电力系统的数据进行必要的特征选择，通过对原始数据进行筛选和降维，挑选出对模型预测和分类最为关键的特征。这一步骤对于提高模型的可解释性和应用性来说至关重要，有助于更有效地应对新型电力系统面临的挑战。

技术实现思路

1、本专利技术提供区域级电网多源异构数据处理及特征分析方法，用以解决现有技术中在电力系统的建模和预测过程中，数据的维度过高，存在大量冗余特征和干扰数据，

2、本专利技术提供区域级电网多源异构数据处理及特征分析方法，包括区域级电网多源异构数据的处理和区域级电网阻塞场景的特征选择；具体步骤如下：

3、步骤1、区域级电网多源异构数据的处理；

4、步骤1.1、数据校验与修正；

5、步骤1.2、历史数据对时与重采样；

6、步骤1.3、数据标准化与整合；

7、步骤2、区域级电网阻塞场景的特征选择；

8、步骤2.1、基于pearson相关系数的特征选择；

9、步骤2.2、基于spearman相关系数的特征选择；

10、步骤2.3、基于relief-f算法的特征选择；

11、步骤2.4、形成区域级电网阻塞场景特征指纹库。

12、根据本专利技术提供的区域级电网多源异构数据处理及特征分析方法，步骤1.1所述数据校验与修正包括以下步骤：

13、1)预处理；

14、取得原始数据文件后，需要考虑数据的格式、数据类型、数据的完整性和一致性等问题。本专利技术分别从以下几个方面考虑数据的预处理方法：

15、(1)数据格式校验：使用数据验证规则来检查数据是否符合预期的格式和范围，包括数据长度、数据格式、数据范围等方面的校验。

16、(2)数据一致性校验：对于多源数据的集成，需要确保数据的一致性，包括数据单位、数据命名、数据格式等方面的校验。

17、(3)数据类型检查：对于某些数据，需要确保其数据类型的正确性，通过设置数据检查器来完成数据类型的检查，比如数字、日期等。

18、(4)重复数据处理：使用去重算法删除冗余数据。

19、(5)异常值检测：通过统计分析和机器学习算法等方法，识别和处理异常值。例如，可以使用箱线图等方法来识别异常值，箱线图中的箱子表示数据的四分位数(q1、q2、q3)，箱子的长度代表数据的中间50％。在箱子的上下各画一条线，代表数据中的最大值和最小值，如果数据中有一些点超出了两条线之间的区域，则可以认为这些点为异常值。

20、2)基于样条插值的数据修正方法；

21、样条插值方法可以将数据分成多个小段，每个小段内使用一个低次多项式来逼近数据。这种方法可以平滑地拟合数据，并且可以通过调整节点数量和节点位置来控制拟合的精度。

22、三次样条具有连续二阶导数，其曲线光滑性好，三次样条插值的原理如下：假设在数据点(xi,yi)(i＝0,1,2,…,n)中，xi均匀分布在区间[a,b]内。在每个子区间[xi,xi+1]上，插值函数si(x)可以表示为一个三次多项式：

23、si(x)＝ai+bi(x-xi)+ci(x-xi)2+di(x-xi)3(xi<x<xi+1)

24、其中，ai,bi,ci和di是待求解的系数。

25、为了保证插值函数在节点xi处连续，需要满足：

26、si(xi)＝yi

27、为了保证插值函数在节点xi处一阶导数连续，需要满足：

28、si(xi+1)＝si+1(xi+1)

29、si′(xi+1)＝si+1′(xi+1)

30、为了保证插值函数在节点xi处二阶导数连续，需要满足：

31、si″(xi+1)＝si+1″(xi+1)

32、此外，由于插值函数的端点处没有给定的导数值，需要进一步加上边界条件。最常用的边界条件是自然边界条件，即令插值函数的二阶导数在端点处为0：

33、s0″(x0)＝sn″(xn)

34、为了求解这些未知系数，需要解一个4n元线性方程组。具体地，可以将所有系数放在一个向量c＝(a0,b0,c0,d0,a1,b1,c1,d1,…,an-1,bn-1,cn-1,dn-1)中，然后利用以上的等式和边界条件构造一个4n×4n的系数矩阵a，并将方程组ac＝y求解即可。其中y＝(y0,y1,…,yn-1)是给定的数据点的函数值。

35、根据本专利技术提供的区域级电网多源异构数据处理及特征分析方法，步骤1.2所述历史数据对时与生采样包括以下步骤：

36、1)基于相关性分析的数据对时方法；

37、由于数据采集对时不同步且在传输、导入系统等过程存在着时延，原始数据的时间戳往往无法保持同步。数据之间的时间不一致，造成分析和预测的偏差。基于相关性分析方法进行寻找历史数据中的时间对齐关系，相关性系数较大的数据之间具有较强的时间对齐关系。基于相关性分析的历史数据对时步骤为：

38、(1)选取数据：首先从历史数据中选取需要对齐的数据，并将它们转化为时序数据格式，以便进行后续处理。

39、(2)划分时间窗口：选取一定长度的时间窗口，并确定窗口的步长。时间窗口的长度和步长的选择需要根据具体数据的特点来决定。

40、(3)计算相关性系数：在每个时间窗口内，计算不同数据之间的相关性系数。常用的相关性系数有皮尔逊相关系数、斯皮尔曼相关系数等。

41、(4)确定对齐关系：根据相关性系数的大小，确定不同数据之间的时间对齐关系。通常，相关性系数较大的数据之间具有较强的时间对齐关系。

42、(5)对齐数据：根据确定的时间对齐关系，对数据进行对齐，使得不同的时间窗口的起点在同一时间点上。...

【技术保护点】

1.区域级电网多源异构数据处理及特征分析方法，其特征在于，包括对区域级电网多源异构数据进行处理和对区域级电网阻塞场景的特征进行选择；

2.根据权利要求1所述区域级电网多源异构数据处理及特征分析方法，其特征在于，数据校验与修改包括：

3.根据权利要求1所述区域级电网多源异构数据处理及特征分析方法，其特征在于，历史数据对时与重采样包括以下步骤：

4.根据权利要求1所述区域级电网多源异构数据处理及特征分析方法，其特征在于，数据标准化与整合包括：

5.根据权利要求1所述区域级电网多源异构数据处理及特征分析方法，其特征在于，区域级电网阻塞场景的特征选择包括以下步骤：

6.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至5任一项所述区域级电网多源异构数据处理及特征分析方法。

7.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述区域级电网多源异构数据处理及特征分析方法。

8.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述区域级电网多源异构数据处理及特征分析方法。

...

【技术特征摘要】

1.区域级电网多源异构数据处理及特征分析方法，其特征在于，包括对区域级电网多源异构数据进行处理和对区域级电网阻塞场景的特征进行选择；

2.根据权利要求1所述区域级电网多源异构数据处理及特征分析方法，其特征在于，数据校验与修改包括：

3.根据权利要求1所述区域级电网多源异构数据处理及特征分析方法，其特征在于，历史数据对时与重采样包括以下步骤：

4.根据权利要求1所述区域级电网多源异构数据处理及特征分析方法，其特征在于，数据标准化与整合包括：

5.根据权利要求1所述区域级电网多源异构数据处理及特征分析方法，其特征在于，区域级电网阻塞场景...

【专利技术属性】
技术研发人员：汪旸，廖思阳，赖宏毅，徐箭，王雄伟，柯德平，黄莹，贾龙文，
申请(专利权)人：国家电网有限公司华中分部，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人