一种针对电网数据的关键特征选择方法技术

技术编号:35780246 阅读:20 留言:0更新日期:2022-12-01 14:25
本发明专利技术提供一种针对电网数据的关键特征选择方法。所述针对电网数据的关键特征选择方法包括:电网数据,所述电网数据包括以下步骤:S1.利用电力系统的潮流特征量建立特征描述集;S2.利用K-means聚类算法根据计算节点的数量对所有特征进行聚类;S3.特征选择的核心内容是评价函数的制定;S4.在分布式节点上合并所选要素。本发明专利技术提供的针对电网数据的关键特征选择方法具有精度高、耗时少、稳定性好的优点,这种分布式特征选择算法可以在一定程度上缓解电力系统运行大数据中的维数灾难问题,快速准确地挖掘出电网运行的薄弱点,帮助电网运行人员掌握电网安全运行特征,避免电网运行事故发生的优点。事故发生的优点。事故发生的优点。

【技术实现步骤摘要】
一种针对电网数据的关键特征选择方法


[0001]本专利技术属于电网数据的关键特征选择
,尤其涉及一种针对电网数据的关键特征选择方法。

技术介绍

[0002]由于智能电网的不断扩展,历史数据量庞大,维度众多。在针对历史数据进行分析建模时,若将全部属性作为模型的输入,不但增加计算难度,而且将引发维度灾难,造成模型过拟合,降低泛化能力。因此,在建模前,需要进行降维处理。目前特征选择算法在电力系统的应用研究不多。过滤器式特征选择算法因计算复杂度较低而倍受青睐,然而这类算法主要基于各输入特征间的相互关系来实现特征空间裁减,忽视了输入与输出之间的映射关系。嵌入式特征选择算法以输入特征集的分类性能来衡量该特征子集的优劣,可获得一个理论上最优的特征集,但分类算法的选择成为另一个关键问题,此外过于庞大的搜索空间也容易导致智能型寻优算法陷入局部最优。电网数据往往是数据量超过传统的数据处理,大数据的数据源众多,从中选择关键特征就尤为重要。
[0003]因此一些论文和专利提出基于深度学习算法的电网数据补全方法。申请号CN 111401783 A提出一种电本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种针对电网数据的关键特征选择方法,其特征在于,包括:电网数据,所述电网数据包括以下步骤:S1.利用电力系统的潮流特征量建立特征描述集;S2.利用K

means聚类算法根据计算节点的数量对所有特征进行聚类;S3.特征选择的核心内容是评价函数的制定;S4.在分布式节点上合并所选要素。2.根据权利要求1所述的针对电网数据的关键特征选择方法,其特征在于:所述电网数据的计算如下:(1).对于某一时间段的实际运行状态和仿真状态,利用电力系统的潮流特征量建立特征描述集F,公式如下:F={f1,f2,

,f
n
}上述公式中,其中n是特征的数量,f
i
是样本的第i个特征,在特征聚类完成之后,在单个计算节点上,在F
sub
上进行分布式特征选择,特征选择过程通常包括子集生成、评价函数、停止标准和验证过程。3.根据权利要求2所述的针对电网数据的关键特征选择方法,其特征在于:所述特征选择是从大量原始特征中,选择有效特征并降低特征维数的有效算法,首先从特征全集中生成特征子集,然后用评价函数对特征子集进行评价,再将评价结果与停止标准进行比较,如果评价结果满足标准,则该过程停止,否则它继续生成下一组特征子集并执行特征选择。4.根据权利要求1所述的针对电网数据的关键特征选择方法,其特征在于:所述K

means聚类算法可根据计算节点的数量对所有特征进行聚类,所述K

means聚类算法是一种典型的基于距离的聚类算法,它以距离作为相似性的评价指标,即两个对象越接近,相似性越大,选择欧氏距离作为衡量两个特征之间相似性的指标,公式如下:d
ij
=||f
i

f
j
||上述公式中,其中d
ij
表示两个特征之间的欧几里德距离,该类由紧密间隔的对象组成,并且最终的训练目标是获得紧凑且独立的类,在聚类过程中,需要手动指定聚类类别的数量,并使用每个类别中所有对象的平均值作为该类的聚类中心,公式如下:上述公式中,其中C
k
是第k个类的聚类中心,n
k
是第k个类中聚类对象的个数f
i
是第k个类中的第i个对象;随机选择任...

【专利技术属性】
技术研发人员:葛亚明赵玉林戴上李艺丰周航王余阳李蓝青王博仑
申请(专利权)人:南京通衡信息科技有限公司葛亚明
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1