【技术实现步骤摘要】
一种继电保护装置缺陷数据修正方法
本专利技术涉及继电保护装置缺陷分析
,尤其涉及一种综合考虑实际运维条件和用于决策树分析的继电保护装置缺陷数据修改方法。
技术介绍
继电保护系统作为保证电网安全的第一道防线,构成该防线的装置数目日益增长,总体呈现出种类繁多、型号各异的特征。然而,因外界干扰、部件老化、设计缺失等因素,继电保护装置发生缺陷在所难免,继而引起装置失效从而影响继电保护系统可靠性,威胁电网安全。近年来,大型电力系统互联及其频繁发生的大事故表明,大停电事故往往和继电保护设备的不正确动作相关,值得注意的是,继电保护装置缺陷作为不正确动作行为的引起因素之一,缺陷数据分析的工作重要性日益凸显。目前,继电保护行业已经积累了大量的继电保护装置缺陷信息数据。伴随着缺陷数据量的增长,传统数据分析方法开始向机器学习算法过渡,这为缺陷数据的分析提供了新的思路。在众多机器学习算法中,决策树算法作为一种对高维数据进行分类的数据挖掘方法,可提供由若干节点和分支构成的树状图形,形象直观地描述可能出现的层次及状态。但是,该类缺陷分析技 ...
【技术保护点】
1.一种继电保护装置缺陷数据修正方法,其特征在于,所述方法包括:/n步骤1、缺陷定级结果相异数据筛选;/n将缺陷属性与缺陷定级结果对应后,筛选缺陷属性集赋值结果一致但定级结果相异数据作为待处理对象;/n步骤 2、对待修正数据生成定级分类树,有分类规则支撑的数据按分类结果统一;/n无分类规则支撑的根据实际运维中对缺陷定级要求及消除缺陷规定进一步确定数据修正方法;/n步骤3、对不同定级结果分布情况下的数据修正,与原始数据对比修正前后缺陷定级结果分布情况。/n
【技术特征摘要】
1.一种继电保护装置缺陷数据修正方法,其特征在于,所述方法包括:
步骤1、缺陷定级结果相异数据筛选;
将缺陷属性与缺陷定级结果对应后,筛选缺陷属性集赋值结果一致但定级结果相异数据作为待处理对象;
步骤2、对待修正数据生成定级分类树,有分类规则支撑的数据按分类结果统一;
无分类规则支撑的根据实际运维中对缺陷定级要求及消除缺陷规定进一步确定数据修正方法;
步骤3、对不同定级结果分布情况下的数据修正,与原始数据对比修正前后缺陷定级结果分布情况。
2.根据权利要求1所述综合考虑实际运维条件和用于决策树分析的继电保护装置缺陷数据定级修改方法,其特征在于,基于决策树算法中“信息熵”和“信息增益”选择缺陷属性,得到赋值矩阵后选取待处理数据,具体包括:
首先,根据决策树学习算法,以信息增益为准则来选择缺陷属性,
建立度量样本集合纯度指标“信息熵”:
(1)
式中,D为样本集合,pk为第k类样本所占的比例,Ent(D)的值越小,则D的纯度越高;
在此基础上,计算用属性a对样本集D进行划分所获得的“信息增益”:
(2)
式中,假定离散属性a有V个可能的取值{},若使用a来对样本集D进行划分,则会产生V个分支结点,其中第个分支结点包含了D中所有在属性a上取值为av的样本,记为Dv;
根据式(1)计算出Dv的信息熵,再考虑到不同分支结点所包含的样本数不同,给分支结点赋予权重/,即样本数越多的分支结点的影响越大;
信息熵益越大,意味着使用属性a来进行划分所获得的“纯度越大”;
因此,通过以下方法选择适用于决策树算法的缺陷属性:第一步,遍历所有缺陷数据包含属性,优先去除描述缺陷现象、缺陷持续时间和缺陷消除情况的属性;保留具有不同分支的属性将其统称为有效属性;第二步,计算各有效属性的信息增益并进行排序,从中选择处于前6位的缺陷属性;
其次,将所选择的属性分别进行赋值;
具体的,从自然数0开始,由小到大对每一属性中所涉及到的分支属性进行赋值,直至每个属性的分支属性赋值完毕为止;
得到赋值属性矩阵,其中m为缺陷数据条数,n为所选择属性个数;
随后,对缺陷等级属性按照0对应危急缺陷、1对应一般缺陷及2对应严重缺陷的赋值方法进行赋值;
形成m条缺陷数据的结果矩阵;
将与合并得到新的矩阵即为包含缺陷属性与缺陷定级结果的数值矩阵;
最后,对进行分析获得需要修正的数据;
具体的,按照行数将矩阵C分为m行的行向量,自第1行开始获取该属性集对应的缺陷定级结果分布情况,若与之一致的缺陷属性集仅出现一种定级结果,将包含该属性集的全部行向量集中作为有效数据;若与之一致的缺陷属性集出现两种或两种以上定级结果,将包含该属性集的全部行向量集中作为待修正数据;
遍历整个矩阵后再从第2行开始重复以上过程,直到遍历所有缺陷属性集为止;
以此方法得到所有待修正的数据。
3.根据权利要求2所述对待修正数据生成定级分类树,有分类规则支撑的数据按分类结果统一;
无分类规则支撑的根据实际运维中对缺陷定级要求及消除缺陷规定确定数据修正方法;...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。