当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于BERT的电网现场作业风险自动评级方法及装置制造方法及图纸

技术编号:37969198 阅读:8 留言:0更新日期:2023-06-30 09:44
本发明专利技术提出了一种基于BERT的电网现场作业风险自动评级方法及装置。本发明专利技术根据分级表与历史库两类电网现场作业文本特点,通过文本增强、冗余文本删除、风险等级纠错等处理方法提升文本质量,并在BERT单文本主题分类模型上实现更加优秀的分类效果。本发明专利技术能够充分利用分级表与历史库文本,并对其进行质量提升,因此,能够有效的减少人工工作量,降低数据质量要求,提高现场作业风险等级自动评级结果的准确性。同时,本发明专利技术所提出的文本增强、风险等级纠错等方法具有泛用性,能够应用于其他的深度学习模型中。学习模型中。学习模型中。

【技术实现步骤摘要】
一种基于BERT的电网现场作业风险自动评级方法及装置


[0001]本专利技术属于电力系统,具体地说是一种基于BERT的电网现场作业风险自动评级方法及装置。

技术介绍

[0002]生产安全是电力系统运行与发展的基本保障,事关我国经济发展与国民生命安全。为确保不发生生产作业现场人身伤亡事故、恶性误操作事件以及运维检修管理责任的设备故障跳闸或临停事件,国家电网公司于2022年1月下发了进一步加强生产现场作业风险管控工作的通知,在原有的作业安全风险管控规定的基础上进行了修订与补充,给出了各类现场作业风险管控实施细则,制定了作业风险分级表以及对应的风险分级依据。
[0003]作业风险分级表(后文简称分级表)是在综合考虑人身风险、设备重要程度、运维操作风险、作业管控难度以及工艺技术难度等因素情况下将作业风险等级从高到低细分为I级至V级。然而,实际的现场作业(后文简称历史库)内容丰富,往往会出现上述文件中未涵盖或部分涵盖的作业内容,此时需要人工参照同电压等级下相近的作业范围和作业内容来确定风险等级。
[0004]受限于经验与专业知识的差异,实际作业风险等级被错误分类的情况难以完全避免,这影响了现场作业的安全性与经济性,为此产生了实际作业风险等级智能评级的需求。若能探索文本挖掘技术实现这一需求,不仅能够协助一线工作人员迅速确定当前实际作业的风险等级,避免误评级的发生,而且能提高业务人员的专业水平。因此,对电网现场作业文本挖掘技术进行探索,具有重要意义。
[0005]目前,部分学者尝试通过图像等其它数据进行数据挖掘,完成电力安全风险辨识,但尚未存在以文本数据为对象的风险研究。此外,电力领域文本挖掘的研究虽已得到重视,但仍存在改进空间。从挖掘的文本内容看,目前的研究主要集中于电力设备缺陷文本、电力调度预案、电力调度信息等文本,缺少对于现场作业文本的研究。从挖掘的文本对象看,目前的电力文本分类相关研究往往只注重历史文本,舍弃了指导、规范性质的标准与规范文件,即只使用历史文本作为样本集训练分类模型,然后使用训练完成的模型对新输入的文本进行分类。该种研究方法将极度依赖历史文本的质量,当历史文本存在覆盖范围不足、准确性不高等问题时,模型的分类效果将会大幅下降。因此,如何实现历史文本与标准导则的结合也应当是电力领域文本分类研究中需要考虑的重要因素之一。

技术实现思路

[0006]本专利技术所要解决的技术问题是电网现场作业风险的自动评级的问题,即如何通过深度学习方法利用电网现场作业文本数据实现对现场作业风险等级的自动评级的问题。
[0007]基于此本专利技术提出了一种基于BERT的电网现场作业风险自动评级方法及装置。
[0008]本专利技术的第一方面提供了一种基于BERT的电网现场作业风险自动评级方法。
[0009]首先,对分级表文本进行文本增强,将其转化为与历史库文本内容相近的文本。
[0010]接着,对历史库文本进行冗余文本删除、历史库风险等级纠错,提升其文本质量。
[0011]然后,使用文本增强后的分级表文本与文本质量提升后的历史库文本构建起相对完整的样本集,并使用该样本集对BERT模型进行训练。
[0012]最后,使用训练后的BERT模型实现对电网现场作业风险等级的自动评级。
[0013]本专利技术的第二方面提供了一种基于BERT的电网现场作业风险自动评级装置。
[0014]分级表文本增强模块,用于对分级表文本进行文本增强,将其转化为与历史库文本内容相近的文本。
[0015]历史库文本质量提升模块,用于对历史库文本进行冗余文本删除、历史库风险等级纠错,提升其文本质量。
[0016]BERT模型训练模块,使用文本增强后的分级表文本与文本质量提升后的历史库文本构建起相对完整的样本集,并使用该样本集对BERT模型进行训练。
[0017]评级模块,使用训练后的BERT模型实现对电网现场作业风险等级的自动评级。
[0018]本专利技术的有益效果:本专利技术能够充分利用分级表与历史库文本,并对其进行质量提升,因此,能够有效的减少人工工作量,降低数据质量要求,提高现场作业风险等级自动评级结果的准确性。同时,本专利技术所提出的文本增强、风险等级纠错等方法具有泛用性,能够应用于其他的深度学习模型中。
附图说明
[0019]图1为BERT单文本主题分类模型;
[0020]图2为模型训练流程图;
[0021]图3为本专利技术装置结构示意图。
具体实施方式
[0022]本专利技术的核心技术构思:根据分级表与历史库两类电网现场作业文本特点,通过文本增强、冗余文本删除、风险等级纠错等处理方法提升文本质量,并在BERT(Bidirectional Encoder Representations from Transformers)单文本主题分类模型上实现更加优秀的分类效果。
[0023]其中,BERT模型是2018年由谷歌公司所提出的一种自然语言处理模型,在情感分析、文本分类、实体信息识别等任务中取得最佳成绩,是自然语言处理发展史上里程碑式的模型成就,因此本专利技术选取BERT的单文本主题分类模型作为深度学习的模型选择,该模型的结构如图1所示。模型以单条文本T
toki
(i=1,2,

,n)作为输入,在句首添加特定标记符[CLS],在句尾添加特定分割符[SEP]。以自然语言形式表示的输入需要进行编码,通过标记词嵌入、分段词嵌入以及位置词嵌入得到输入的向量化表示E
CLS
、E
i
(i=1,2,

,n)、E
SEP
。将向量化表示的输入传入双向Transformer结构,借助多抽头自注意力机制获取每个字对应的隐藏向量T
CLS
、T
i
(i=1,2,

,n)、T
SEP
。模型的输入通过特定标记符的隐藏向量T
CLS
进行综合表征,其计算公式如下:
[0024]P
sen
=softmax(T
CLS
W
T
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0025]其中,P
sen
表示输入的作业文本的风险等级预测值;T
CLS
是综合表示输入文本语义的特定标识符[CLS]在BERT模型中的最终隐藏状态;W表示全连接层权重系数矩阵。
[0026]而电网现场作业的风险等级评定实际为一个多分类问题,因此,输出P
sen
为一个5维向量,其元素分别表示输入文本的风险等级评定为I~V级的概率值,选取最大值对应的等级作为预测等级。
[0027]本专利技术的技术方案为:首先,对分级表文本进行文本增强,将其转化为与历史库文本内容相近的文本;接着,对历史库文本进行冗余文本删除、风险等级纠错,提升其文本质量;然后,使用文本增强后的分级表文本与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于BERT的电网现场作业风险自动评级方法,其特征在于该方法包括以下步骤:首先,对分级表文本进行文本增强,将其转化为与历史库文本内容相近的文本;接着,对历史库文本进行冗余文本删除、历史库风险等级纠错,提升其文本质量;然后,使用文本增强后的分级表文本与文本质量提升后的历史库文本构建起相对完整的样本集,并使用该样本集对BERT模型进行训练;最后,使用训练后的BERT模型实现对电网现场作业风险等级的自动评级。2.根据权利要求1所述的一种基于BERT的电网现场作业风险自动评级方法,其特征在于:还包括读入分级表文本,所述分级表文本主要包含作业类别、电压等级、作业范围、作业内容和作业风险等级。3.根据权利要求2所述的一种基于BERT的电网现场作业风险自动评级方法,其特征在于:所述对分级表文本增强是指将概括性文字转换为与实际现场作业文本接近的内容;采用以下两种方式进行增强:方式一:将风险表作业内容进行以分号与“/”为标志的拆分,将涉及多个作业对象或操作内容的文本转化为多条涉及单个作业对象的单个操作内容;方式二:将作业内容中的A、B、C、D、E类检修转化为具体的操作内容。4.根据权利要求1所述的一种基于BERT的电网现场作业风险自动评级方法,其特征在于:还包括读入历史库文本,所述的历史库文本主要包括电压等级、作业开始时间、作业结束时间、作业内容、作业类别、是否停电和作业风险等级等内容。5.根据权利要求4所述的一种基于BERT的电网现场作业风险自动评级方法,其特征在于:所述冗余文本删除具体是:首先根据历史库中的作业开始时间与结束时间将文本切分为若干组;然后对每一组内的作业内容文本使用中...

【专利技术属性】
技术研发人员:王慧芳虞佳淼张亦翔
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1