配电网故障处置知识图谱构建方法及装置制造方法及图纸

技术编号:35101372 阅读:16 留言:0更新日期:2022-10-01 17:08
本发明专利技术提供了配电网故障处置知识图谱构建方法及装置,方法包括:步骤1.通过配电网的调控系统获取配网设备台账数据、调度规程数据、配网缺陷库数据和故障处置数据四种数据,并进行预处理;步骤2.将前三种数据整理为三元组形式;步骤3.对第四种数据进行标注,得到每条数据中的多个命名实体以及多个实体类型,并得到标注后的故障处置数据集;步骤4.将标注后的故障处置数据集作为模型训练数据集,采用预训练的方法构建BERTwithDic

【技术实现步骤摘要】
配电网故障处置知识图谱构建方法及装置


[0001]本专利技术属于电力调度运维
,具体涉及配电网故障处置知识图谱构建方法及装置。

技术介绍

[0002]电力信息物理融合的深入使得配电网的故障形态日益复杂,目前已有的电网调控系统如SCADA、DMS以及D5000等以采集、监控和分析为主,积累了大量多源异构文本数据,而配电网故障处置主要依赖于调控人员的主观决策。借助知识图谱技术将配网故障文本数据抽取提炼为知识,并将这些知识组织成结构化、可视化的表示形式,辅助调控人员进行故障处置决策。
[0003]现有的电网知识图谱构建方法大多需要大量标注数据进行实体识别模型的训练,而配电网中故障处置数据的体量较小、标注成本较高,无法支撑常规深度学习模型的训练。并且,现有的电网知识图谱,无法有效识别配电网领域下夹带数字及符号的复杂专业实体,而且难以有效提取文本复杂特征。

技术实现思路

[0004]本专利技术是为了解决上述问题而进行的,目的在于提供基于BERTwithDic

BiLSTM

CRF模型的配电网故障处置知识图谱构建方法及装置,能够实现配电网领域复杂专业实体的高效识别。
[0005]本专利技术为了实现上述目的,采用以下方案:
[0006]<方法>
[0007]本专利技术提供的配电网故障处置知识图谱构建方法,其特征在于,包括:
[0008]步骤1.通过配电网的调控系统获取配网设备台账数据、故障处置数据、调度规程数据和配网缺陷库数据,并对数据进行数据清洗预处理;
[0009]步骤2.将预处理后的配网设备台账数据、配网缺陷库数据、调度规程数据整理为三元组形式;
[0010]步骤3.对预处理后的故障处置数据进行标注,得到每条数据中的多个命名实体以及多个实体类型,并得到标注后的故障处置数据集;
[0011]步骤4.将步骤3标注后的故障处置数据集作为模型训练数据集,采用预训练的方法构建BERTwithDic

BiLSTM

CRF实体识别模型并进行微调训练,BERTwithDic

BiLSTM

CRF实体识别模型包括:BERT层、Word2Vec词嵌入层、双向长短时记忆记忆网络层BiLSTM、特征串联层Concatenate、全连接层Dense、条件随机场层CRF,从而有效识别配电网领域的复杂专业实体,然后根据预先设定好的实体间关系将故障处置数据整理为三元组形式;
[0012]步骤5.将步骤2得到的三元组形式的配网设备台账数据、配网缺陷库数据、调度规程数据整理和步骤4得到的三元组形式的故障处置数据作为配电网文本数据,通过图数据库对配电网文本数据进行存储和可视化,构建配电网故障处置知识图谱。
[0013]优选地,本专利技术提供的基于BERT模型的配电网故障处置知识图谱构建方法,还可以具有如下特征:在步骤4中,利用构建的电力领域字典,基于Word2Vec模型提取其中的词典特征表示;输入文本经过分词处理,利用Word2Vec训练得到的词向量矩阵对输入序列进行词嵌入Embedding,得到词典特征表示向量序列D=[d1,d2,

,d
n
];电力领域词典中包括电力专业词汇和配网设备台账数据中的设备名称;然后,将BERT层的输出序列T和词典特征表示向量序列D进行特征拼接,得到拼接特征表示E=[e1,e2,

,e
n
],将其输入到BiLSTM层,捕获文字基于上下文的语言特征,输出考虑文字上下文信息的向量序列O=[o1,o2,

,o
n
]。
[0014]优选地,本专利技术提供的基于BERT模型的配电网故障处置知识图谱构建方法,还可以具有如下特征:在步骤1中,配电网相关数据集为data
k
(x,y),表示配电网数据集中的第k类中第x条数据第y个属性下的数据值,k∈[1,L],x∈[1,M],y∈[1,N],L为配电网相关数据类型的数量,M为某类数据下数据的总条数,N为某条数据的属性数量。
[0015]优选地,本专利技术提供的基于BERT模型的配电网故障处置知识图谱构建方法,还可以具有如下特征:在步骤2中,针对配网设备台账数据,以设备名称作为实体,其余部分作为附加属性,根据不同设备间的现实链接关系按照如下方式整理为三元组形式:
[0016]C1=(data1(x1,y),R,data2(x2,y)),
[0017]式中,data1(x1,y)为设备1,data2(x2,y)为设备2,R为根据设备现实链接关系指定的设备间关系;
[0018]针对配网缺陷库数据,以缺陷名称作为实体,其余部分作为附加属性,根据缺陷和缺陷设备间的所属关系整理为如下三元组形式:
[0019]C2=(data2(x1,y),R,data1(x1,y)),
[0020]式中,data2(x1,y)为缺陷1,data1(x1,y)为缺陷1所指向的设备1,R为根据缺陷和缺陷设备的所属关系指定的关系;
[0021]针对调度规程数据,采用关键词+短文本的方法整理为如下三元组形式:
[0022]C3=(data3(x1,y1),R,data3(x1,y2)),
[0023]式中,data3(x1,y1)为调度规程数据1中的关键词,data3(x1,y2)为调度规程数据1中关键词下的短文本,R为根据编写规则设定的文本间关系。
[0024]优选地,本专利技术提供的基于BERT模型的配电网故障处置知识图谱构建方法,还可以具有如下特征:在步骤5中,基于图数据库对配电网文本数据构建了设备拓扑知识图谱、故障预案知识图谱、缺陷库知识图谱和调度规程知识图谱,并且故障预案知识图谱和缺陷库知识图谱分别以故障线路和缺陷线路为关联属性链接到设备拓扑知识图谱。
[0025]<装置>
[0026]进一步,本专利技术还提供能够自动实现上述<方法>的配电网故障处置知识图谱构建装置,其特征在于,包括:
[0027]数据获取部,通过配电网的调控系统获取配网设备台账数据、故障处置数据、调度规程数据和配网缺陷库数据,并对数据进行数据清洗预处理;
[0028]处理部,将预处理后的配网设备台账数据、配网缺陷库数据、调度规程数据整理为三元组形式;
[0029]标注部,对预处理后的故障处置数据进行标注,得到每条数据中的多个命名实体以及多个实体类型,并得到标注后的故障处置数据集;
[0030]模型构建部,将标注后的故障处置数据集作为模型训练数据集,采用预训练的方法构建BERTwithDic

BiLSTM

CRF实体识别模型并进行微调训练,BERTwithDic

BiLSTM

CRF本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.配电网故障处置知识图谱构建方法,其特征在于,包括:步骤1.通过配电网的调控系统获取配网设备台账数据、故障处置数据、调度规程数据和配网缺陷库数据,并对数据进行数据清洗预处理;步骤2.将预处理后的配网设备台账数据、配网缺陷库数据、调度规程数据整理为三元组形式;步骤3.对预处理后的故障处置数据进行标注,得到每条数据中的多个命名实体以及多个实体类型,并得到标注后的故障处置数据集;步骤4.将步骤3标注后的故障处置数据集作为模型训练数据集,采用预训练的方法构建BERTwithDic

BiLSTM

CRF实体识别模型并进行微调训练,BERTwithDic

BiLSTM

CRF实体识别模型包括:BERT层、Word2Vec词嵌入层、双向长短时记忆记忆网络层BiLSTM、特征串联层Concatenate、全连接层Dense、条件随机场层CRF,从而有效识别配电网领域的复杂专业实体,然后根据预先设定好的实体间关系将故障处置数据整理为三元组形式;步骤5.将步骤2得到的三元组形式的配网设备台账数据、配网缺陷库数据、调度规程数据整理和步骤4得到的三元组形式的故障处置数据作为配电网文本数据,通过图数据库对配电网文本数据进行存储和可视化,构建配电网故障处置知识图谱。2.根据权利要求1所述的配电网故障处置知识图谱构建方法,其特征在于:其中,在步骤4中,利用构建的电力领域字典,基于Word2Vec模型提取其中的词典特征表示;输入文本经过分词处理,利用Word2Vec训练得到的词向量矩阵对输入序列进行词嵌入Embedding,得到词典特征表示向量序列D=[d1,d2,

,d
n
];电力领域词典中包括电力专业词汇和配网设备台账数据中的设备名称;然后,将BERT层的输出序列T和词典特征表示向量序列D进行特征拼接,得到拼接特征表示E=[e1,e2,

,e
n
],将其输入到BiLSTM层,捕获文字基于上下文的语言特征,输出考虑文字上下文信息的向量序列O=[o1,o2,

,o
n
]。3.根据权利要求1所述的配电网故障处置知识图谱构建方法,其特征在于:其中,在步骤1中,配电网相关数据集为data
k
(x,y),表示配电网数据集中的第k类中第x条数据第y个属性下的数据值,k∈[1,L],x∈[1,M],y∈[1,N],L为配电网相关数据类型的数量,M为某类数据下数据的总条数,N为某条数据的属性数量。4.根据权利要求1所述的配电网故障处置知识图谱构建方法,其特征在于:其中,在步骤2中,针对配网设备台账数据,以设备名称作为实体,其余部分作为附加属性,根据不同设备间的现实链接关系按照如下方式整理为三元组形式:C1=(data1(x1,y),R,data2(x2,y)),式中,data1(x1,y)为设备1,data2(x2,y)为设备2,R为根据设备现实链接关系指定的设备间关系;针对配网缺陷库数据,以缺陷名称作为实体,其余部分作为附加属性,根据缺陷和缺陷设备间的所属关系整理为如下三元组形式:C2=(data2(x1,y),R,data1(x1,y)),式中,data2(x1,y)为缺陷1,data1(x1,y)为缺陷1所指向的设备1,R为根据缺陷和缺陷设备的所属关系指定的关系;针对调度规程数据,采用关键词+短文本的方法整理为如下三元组形式:C3=(data3(x1,y1),R,data3(x1,y2)),
式中,data3(x1,y1)为调度规程数据1中的关键词,data3(x1,y2)为调度规程数据1中关键词下的短文本,R为根据编写规则设定的文本间关系。5.根据权利要求1所述的配电网故障处置知识图谱构建方法,其特征在于:其中,在步骤5中,基于图数据库对配电网文本数据构建了设备拓扑知识图谱、故障预案知识图谱、缺陷库知识图谱和调度规程知识图谱,并且故障预案知识图谱和缺陷库知识图谱分别以故障线路和缺陷线路为关联属性链接到设备拓扑知识图谱。6.配电网故障处置知识图谱构建装置,其特征在于,包...

【专利技术属性】
技术研发人员:尚磊叶欣智董旭柱田野方华亮王波
申请(专利权)人:国网辽宁省电力有限公司电力科学研究院国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1