处理电力负荷监测稀疏数据的关键特征选择方法和装置制造方法及图纸

技术编号:35566555 阅读:17 留言:0更新日期:2022-11-12 15:50
本发明专利技术公开了处理电力负荷监测稀疏数据的关键特征选择方法和装置,通过对电力负荷监测稀疏数据进行特征选择,降低后续对数据集分析的计算量,提高工作效率;选出其中的关键特征,剔除其中无关特征及冗余特征,有利于提升机器学习训练与预测的准确性;高维的异构数据存在的大量冗余,在电力系统各典型场景的特征分析中能够找准场景与其关联特征之间的关系,不仅在实际分析时具有针对性,还会显著缩短处理的时间;通过关键特征选择方法与装置的相互配合,解决了电力数据样本获取难度大,具有实时性,在采集、传输、存储等诸多环节可能遇到系统故障或外部干扰,导致数据缺失的问题;可以通过残缺数据准确分析,做出正确的运行决策。做出正确的运行决策。做出正确的运行决策。

【技术实现步骤摘要】
处理电力负荷监测稀疏数据的关键特征选择方法和装置


[0001]本专利技术涉及电力负荷数据挖掘领域的特征选择领域,具体为处理电力负荷监测稀疏数据的关键特征选择方法和装置。

技术介绍

[0002]近年来随着电网数字经技术的广泛应用,高比例电力电子设备大规模接入电网时,海量多源异构数据也随之产生。高维的异构数据存在大量冗余,在电力系统各典型场景的特征分析中不能找准场景与其关联特征之间的关系,不仅在实际分析时缺乏针对性,还会显著增加处理的时间。此外,电力数据样本获取难度大,具有实时性,在采集、传输、存储等诸多环节可能遇到系统故障或外部干扰,导致数据缺失。通过残缺数据无法准确分析,做出正确的运行决策。
[0003]如公开号CN110084408A所述的一种电能质量数据的处理方法,包括:分块步骤:接收计算机公用网络或电能质量监测平台获取的电能质量数据,所述电能质量数据包括空间信息、时间信息和事件信息,按照所述空间信息将所述电能质量数据分组,所述空间信息相同的所述电能质量数据分到同一组,再将每组电能质量数据按照时间间隔进行划分;清洗步骤:根据所述分块步骤获取分块后的电能质量数据,利用分块融合方法对所述电能质量数据进行清洗;分析步骤:采用统计模型对所述清洗步骤得到的电能质量数据进行分析。提供高速的电能质量数据处理方法,并将电能质量数据与不同位置的环境信息建立起因果联系,并实现电能质量数据处理分析结果的可视化。
[0004]又如公开号WO2022074400A1所述的一种用于通过使用机器学习技术来处理与电力网或其他电气设备相关的测量数据并从电气测量数据提供异常事件检测的方法和系统。根据第一方面,一种处理高分辨率电气测量数据的方法可以包括获得与从电网系统或其他电气设备测量的电气或其他参数的时间序列数据相关的高分辨率电气测量数据,其中时间序列data包括第一组数据点。时间序列数据可以被转换为特征向量格式数据,其中时间序列数据被分组成多个数据集,每个数据集代表第一组数据点的子集。可以执行统计数据聚类方案以从特征向量格式数据生成不同的聚类模式作为聚类数据,聚类数据包括与第一电气趋势相关的第一集群和与不同于第二电气趋势的第二集群相关的第二集群。第一电气趋势,其中集群数据包括异常数据模式,该异常数据模式是第一集群或第二集群的一部分,并且异常数据模式远离其各自的集群中心。异常事件检测可以至少部分地基于异常数据集群数据包括与第一电气趋势相关的第一集群和与不同于第一电气趋势的第二电气趋势相关的第二集群,其中集群数据包括异常数据模式,该异常数据模式是第一或第二电气趋势的一部分聚类,并且异常数据模式远离其各自的聚类中心。异常事件检测可以至少部分地基于异常数据集群数据包括与第一电气趋势相关的第一集群和与不同于第一电气趋势的第二电气趋势相关的第二集群,其中集群数据包括异常数据模式,该异常数据模式是第一或第二电气趋势的一部分聚类,并且异常数据模式远离其各自的聚类中心。异常事件检测可以至少部分地基于异常数据。
[0005]综上所述,本专利技术实际要解决的技术问题在于:
[0006]1)高维的异构数据存在大量冗余,在电力系统各典型场景的特征分析中不能找准场景与其关联特征之间的关系,不仅在实际分析时缺乏针对性,还会显著增加处理的时间;
[0007]2)电力数据样本获取难度大,具有实时性,在采集、传输、存储等诸多环节可能遇到系统故障或外部干扰,导致数据缺失;
[0008]3)通过残缺数据无法准确分析,做出正确的运行决策。

技术实现思路

[0009]针对现有技术的不足,本专利技术提供了处理电力负荷监测稀疏数据的关键特征选择方法和装置,以解决上述问题。
[0010]为实现以上目的,本专利技术通过以下技术方案予以实现。
[0011]处理电力负荷监测稀疏数据的关键特征选择方法,包括以下步骤:获取电力负荷监测稀疏数据F,并形成监测数据输入稀疏流特征,构建缓冲矩阵B;将所述缓冲矩阵B投入预训练好的隐特征填充模型,计算缺失值并填补为完整矩阵对所述完整矩阵开展流特征选择,存入最优特征子集BSF。
[0012]优选的,所述获取电力负荷监测稀疏数据F在M行N列,包括故障前的稳态特征数据及故障后的暂态特征数据,所述构建缓冲矩阵B在M行Bs列,用于缓存新到达的稀疏流特征,其中Bs<<N。
[0013]优选的,当缓冲矩阵满后,将缓冲矩阵B投入预训练好的隐特征填充模型,随机生成PM
×
k及QN
×
k,令R=B,并通过柯西损失优化目标函数。预测矩阵将预测值填充在缺失位置,获得完整矩阵
[0014][0015]其中λp,λq为对应P、Q的正则化参数,γ为常数,ΩM
×
N为指示矩阵,当R中相应位置有监测值为1,否则为0。
[0016]优选的,对完整矩阵开展流特征选择,对中特征模拟实时情况逐条分析,对新到达的特征,首先进行相关性分析,使用Fisher

z检验计算特征与标签的相关性并返回p值,通过模糊隶属度函数调动显著性水平α,使α在 0.01~0.1间波动;
[0017]判断p<α是否成立,若成立,则该特征进行冗余性分析;
[0018]否则判断α<p<0.1是否成立,如果成立,该新特征进入模糊相关性分析;
[0019]否则该新特征将被丢弃。
[0020]优选的,冗余性分析,对p值小于α的新特征进行冗余性分析。主要分成两步:首先通过Fisher

z检验计算新特征与最优特征子集BSF(初始化为空)中的现存特征间的冗余性,如果冗余,则新特征将被丢弃,否则将新特征加入BSF中;其次计算BSF中现存特征间是否因新特征的到达而变得冗余,如果冗余则丢弃掉该特征;
[0021]优选的,模糊相关性分析,对既不独立也不相关的特征进行模糊相关性分析,通过
近邻粗糙集计算其依赖度,加入模糊相关特征子集FSF中并排序。直至没有新特征流入,将FSF中排名前|BSF|/2的加入BSF;上述步骤重复进行,直至没有新特征流入,最终输出BSF。
[0022]本专利技术还提供了处理电力负荷监测稀疏数据的关键特征选择装置包括数据缓冲模块、数据补全模块、流特征选择模块,三者依次连接,
[0023]数据缓冲模块:用于电力负荷监测稀疏数据的获取,并将实时的数据缓存进缓冲矩阵;
[0024]数据补全模块:用于将稀疏的缓冲矩阵投入预训练好的隐特征模型,计算缺失值并填补为完整矩阵;
[0025]流特征选择模块:对完整矩阵开展特征选择,将结果存入最优特征子集,所述流特征选择模块包括相关性分析单元、冗余性分析单元、模糊相关性分析单元、存储单元。
[0026]优选的,所述数据缓冲模块中,实时稀疏数据的获取包括故障前的稳态特征数据及故障后的暂态特征数据。用于缓冲实时稀疏数据的缓冲矩阵的列远小于整个电力负荷数据集的列。
[0027]优选的,所述数据补全本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.处理电力负荷监测稀疏数据的关键特征选择方法,其特征在于:包括获取电力负荷监测稀疏数据F,并形成监测数据输入稀疏流特征,构建缓冲矩阵B;将所述缓冲矩阵B投入预训练好的隐特征填充模型,计算缺失值并填补为完整矩阵对所述完整矩阵开展流特征选择,存入最优特征子集BSF。2.根据权利要求1所述的处理电力负荷监测稀疏数据的关键特征选择方法,其特征在于:所述获取电力负荷监测稀疏数据F在M行N列,包括故障前的稳态特征数据及故障后的暂态特征数据,所述构建缓冲矩阵B在M行Bs列,用于缓存新到达的稀疏流特征,其中Bs<<N。3.根据权利要求1所述的处理电力负荷监测稀疏数据的关键特征选择方法,其特征在于:将所述缓冲矩阵B投入预训练好的隐特征模型,计算缺失值并填补为完整矩阵缺失值的计算步骤为:步骤一:随机生成PM
×
k及QN
×
k,令R=B,并通过柯西损失优化如下目标函数:其中λp,λq为对应P、Q的正则化参数,γ为常数,ΩM
×
N为指示矩阵,当R中相应位置有监测值为1,否则为0;步骤二:预测矩阵将预测值填充在缺失位置,获得完整矩阵4.根据权利要求1所述的处理电力负荷监测稀疏数据的关键特征选择方法,其特征在于:对所述完整矩阵开展流特征选择,其步骤包括:步骤一:相关性分析:当新特征流入时,通过Fisher

z检验计算特征相关性,并返回p值,令α表示模糊相关的显著性水平,如果p<α,则进入冗余性分析,如果α<p<0.1,则进行模糊相关性分析,否则该特征被丢弃;步骤二:冗余性分析:对进入冗余性分析的新特征,分别计算其是否与BSF中已存在的特征冗余,如果是则丢弃新特征,否则将新特征加入BSF;以及是否使BSF中原有特征变冗余,如果是则丢弃掉原有特征;步骤三:模糊相关性分析:对进行步骤三的新特征,计算其与标签的依赖度,加入到模糊相关特征子集FSF,并排序,在没有新特征流入后,对之排序,取前BSF大小的一半存入BSF;以上步骤重复进行直到没有新特征流入,最终输出BSF。5.根据权利要求1~4任意一项所述的处理电力负...

【专利技术属性】
技术研发人员:汤向华王栋吴迪施雄杰张丽娟汪家钰俞天鹤罗飞陈飞龙
申请(专利权)人:国网江苏省电力有限公司南通市海门区供电分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1