【技术实现步骤摘要】
电力运检故障文本分类方法及系统和设备
[0001]本专利技术涉及电力运检故障文本分类方法及系统和设备,属于电力运检故障分类
技术介绍
[0002]电站和输电设备的运行操作、维护检修以及改造换代等工作,每年会产生大量不同类型的数据,比如停电记录清单等结构化数据、故障报告等半结构化数据和运行规程等非结构化数据。由于电力运检领域数据多样化、复杂化、孤岛化,运检人员查找资料耗时较长,运检工作对专家经验依赖较大。因此,提升变电站运检工作的数字化、智能化具有十分重大意义。
[0003]在运检人员发现设备异常时,按工作规范要求需填写故障报告,描述故障实际情况,并归纳故障类型。虽然运检部门有详细的故障归类导则文件,但很多现场运检人员并没有看过或者并不清楚导则文件的内容,所以常常发生故障类型与故障描述不对应的情况,对后续专家检修以及之后电力数据整理与规范造成很大影响。因此,根据运检工作人员对故障的描述,智能辅助系统能够自动填写故障类型或给出故障类型置信度,对实际运检生产具有重要作用。
[0004]文本分类是自然语言处 ...
【技术保护点】
【技术特征摘要】
1.电力运检故障文本分类方法,其特征在于,包括以下内容:获取电力运检故障文本;构建规则提取模型,对电力运检故障文本进行知识提取,得到特征词:构建故障文本网图模型,对特征词进行处理,得到故障文本网图;构建图卷积神经网络模型,利用图卷积神经网络,对故障文本网图进行迭代训练,得到文本特征矩阵;其中,文本特征矩阵包括若干行特征向量;特征向量的维度为故障类别数,特征向量的每个值为对应故障类别的置信概率;选取特征向量中的最大值,作为分类置信概率;将分类置信概率对应的故障类别,作为该电力运检故障文本的类别,完成电力运检故障文本的分类。2.如权利要求1所述的电力运检故障文本分类方法,其特征在于,电力运检故障文本包括训练集、验证集、待分类电力运检故障文本集。3.如权利要求1所述的电力运检故障文本分类方法,其特征在于,规则提取模型的构建方法如下:构建专用电气词汇表;利用专用电气词汇表,对自然语言处理NLP工具的语料库进行扩充;利用自然语言处理NLP工具对电力运检故障文本进行分词,得到电力运检故障文本词汇;对电力运检故障文本词汇,进行清洗和去除停用词,得到一串特征词,从而构建规则提取模型;其中,特征词为由电力运检故障文本中的若干电力运检故障文本词汇组成的对应集合。4.如权利要求1所述的电力运检故障文本分类方法,其特征在于,故障网网图模型为:G=(V,E),V(|V|=n)是节点的集合,E是无向边的集合,|V|为节点数量,节点数量是电力运检故障文本数与特征词数量之和;故障文本网图模型的构建方法如下:根据特征词和电力运检故障文本,构建节点;根据节点三种类型,构建节点间无向边;根据电力运检故障文本中特征词的词频统计结果、共现词信息,计算无向边的权重,即边权值;根据节点间边权值,构建邻接矩阵表示故障文本网图模型的结构特征。5.如权利要求4所述的电力运检故障文本分类方法,其特征在于,邻接矩阵利用无向边的权重进行构建;无向边包括无向边一、无向边二、无向边三、无向边四;无向边一为电力运检故障文本与电力运检故障文本之间的边,其权重为边权一;无向边二为电力运检故障文本与特征词之间的边,其权重为边权二;无向边三为特征词与特征词之间的边,其权重为边权三;无向边四,用于加快模型收敛速度,其权重为边权四,所述边权四的取值直接为1。
6.如权利要求5所述的电力运检故障文本分类方法,其特征在于,边权一为电力运检故障文本之间的文本相似度,其通过TextRank算法计算得到;边权二为特征词对于所属电力运检故障文本的重要程度,其通过词频
‑
倒排文档频次TF
‑
IDF算法得到;边权三为两个特征词间的关联度,其利用共现词信息,使用固定大小的滑动窗口在电力运检故障文本的语料库中进行收集,然后用逐点交互信息法PMI计算特征词与特征词间的边权值,得到两个特征词间的关联度。7.如权利要求6所述的电力运检故障文本分类方法,其特征在于,边权一的计算公式如下:其中,i、j为两个电力运检故障文本,w是同时出现在两个电力运检故障文本中的词;边权二的计算公式如下:其中,i是特征词,j是电...
【专利技术属性】
技术研发人员:蔺家骏,李晨,闫玮丹,郭炳延,杨智,金凌峰,齐冬莲,闫云凤,金汪奥博,于兵,林浩凡,邵先军,郑一鸣,韩亚东,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。