【技术实现步骤摘要】
一种基于XGBoost模型的继电保护缺陷文本定级方法
[0001]本专利技术涉及继电保护装置缺陷分析
,尤其涉及一种基于XGBoost模型的继电保护缺陷文本定级方法。
技术介绍
[0002]近年来,电网规模日趋庞大,继电保护装置数量也发生了跨越式的增长。受设计缺陷、部件老化、外界环境干扰等因素的影响,继电保护装置难免会发生缺陷,继而影响继电保护系统可靠性,威胁电网安全。值得注意的是,不同严重等级的缺陷对二次设备系统稳定运行乃至对整个电网运行可靠性的影响不同。同时,在目前的实际生产中,装置的缺陷定级主要是依靠运维人员,根据现场状况参考缺陷定级手册自主决定。受个人主观因素的限制,难免出现缺陷定级不准确的现象,从而影响消缺工作的进展。继电保护装置作为保障电网安全稳定运行的第一道防线,有必要从分析缺陷、消除缺陷的角度出发,结合人工智能领域的新型数据分析模型,探究适用于准确定级继电保护装置缺陷严重程度的方法,提高继电保护的正确动作率,更好的保护电网安全。
技术实现思路
[0003]本专利技术的目的是提供一种基于X ...
【技术保护点】
【技术特征摘要】
1.一种基于XGBoost模型的继电保护缺陷文本定级方法,所述方法包括:步骤1、继电保护缺陷文本结构组成及特征分析;步骤2、基于词典的继电保护缺陷日志处理模型构建;步骤3、缺陷数据的文本向量化表达与特征提取;步骤4、引入集成学习XGBoost模型,构建保护装置缺陷定级分类器。2.根据权利要求1所述一种基于XGBoost模型的继电保护缺陷文本定级方法,其特征在于,在所述步骤1中,针对某网数据库存储的继电保护缺陷记录信息的组成结构,根据其特征划分为结构化数据和非结构化数据;本专利将从非结构化数据入手,从非结构化信息中提取有效特征作缺陷分类;继电保护缺陷记录信息由2部分组成:1).有属性标签表征的规范型数据;2).无属性标签表征的短文本数据,即缺陷日志,称为非规范型数据;规范型数据具有便于计算机保存管理和编译的特点,目前有关继电保护数据研究方面的工作:状态检修、可靠性评估、关联规则获取、缺陷定级等都集中在此类数据;而缺陷日志这类半结构化文本数据虽蕴含着丰富的历史状态、检修举措及效果信息,但受限于多歧义、难切分、模糊性的特点,尚未得到挖掘;有鉴于此,本节基于某区域电网继电保护设备缺陷日志,分析日志格式,总结挖掘难点问题,并建立了数据处理模型。3.根据权利要求1所述一种基于XGBoost模型的继电保护缺陷文本定级方法,其特征在于,在所述步骤2中基于词典的继电保护缺陷日志处理模型构建;工作包括噪音数据去除、分词处理和数据分类,具体地:本课题词典的构建流程主要如下:基于正则表达式的停用词识别方法,实现了缺陷文本中无关字词的剔除;采用机器与人工相结合的方法,构建了继电保护缺陷文本分词词典;采用潜在语义分析和决策树分类方法,实现了缺陷文本中的同义词合并;整合了停用词表、分词词典、同义词表各...
【专利技术属性】
技术研发人员:薛安成,陶畅,景子洋,欧阳明浩,邓雄耀,洪海雁,王书鸿,
申请(专利权)人:华北电力大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。