基于知识图谱与图神经网络的电网故障诊断方法及系统技术方案

技术编号:39151711 阅读:9 留言:0更新日期:2023-10-23 14:59
本发明专利技术涉及一种基于知识图谱与图神经网络的电网故障诊断方法,包括以下步骤:步骤S1:构建原始语料库;步骤S2:基于原始语料库构建预设词典;步骤S3:基于预设词典和viterbi算法进行字符分解聚类即分词处理,对分词后的文本进行去重过滤,构建告警信息故障分词库;步骤S4:基于告警信息故障分词库,构建相关性矩阵;步骤S5:基于相关性矩阵,提取三元组,并基于Neo4j图形数据库,建立基于告警信息的知识图谱;步骤S6:基于图神经网络CompGCN模型,构建并训练的得到电网故障诊断模型;步骤S7:将待查询告警信息输入基于电网故障诊断模型,获取故障诊断结果。本发明专利技术能够快速获取故障诊断信息,并直观提供给调控人员进行分析决策,有效提高电网故障诊断效率。提高电网故障诊断效率。提高电网故障诊断效率。

【技术实现步骤摘要】
基于知识图谱与图神经网络的电网故障诊断方法及系统


[0001]本专利技术涉及电网故障诊断领域,尤其涉及一种基于知识图谱与图神经网络的电网故障诊断方法及系统。

技术介绍

[0002]电网故障诊断的主要目的是快速确定故障类型并确定故障位置,以便调控人员将故障切除,防止更为严重的事故发生。当故障发生时故障数据将上传至调度中心,电网故障诊断过程就是从这些海量数据中筛选出有用的数据,并用这些数据分析故障原因,进行故障定位。
[0003]随着我国电网规模的不断扩大,运行方式的复杂程度急剧增加,对于电网故障诊断的要求也不断提高。传统故障诊断方法偏向于依靠规则和专家经验,这些方法在应对如今复杂多变的电网运行方式时难以满足要求。如何能够在故障发生时从海量数据中提取出关键信息,快速准确定位到故障设备,使调控人员可以及时切除故障是对于电网故障诊断的最新要求。
[0004]目前基于规则和人工神经网络的故障诊断方法对于故障诊断的过程缺乏解释性和直观性,不利于调控人员的观察和推断。

技术实现思路

[0005]为了解决上述问题,本专利技术的目的在于提供一种基于知识图谱与图神经网络的电网故障诊断方法,能够快速获取故障诊断信息,并直观提供给调控人员进行分析决策,有效提高电网故障诊断效率。
[0006]为实现上述目的,本专利技术采用以下技术方案:
[0007]一种基于知识图谱与图神经网络的电网故障诊断方法,包括以下步骤:
[0008]步骤S1:获取电网调度历史告警数据集和故障数据集,构建原始语料库
[0009]步骤S2:基于原始语料库构建预设词典;
[0010]步骤S3:基于预设词典和viterbi算法进行字符分解聚类即分词处理,对分词后的文本进行去重过滤,构建告警信息故障分词库;
[0011]步骤S4:基于告警信息故障分词库,构建相关性矩阵;
[0012]步骤S5:基于相关性矩阵,提取三元组,并基于Neo4j图形数据库,建立基于告警信息的知识图谱;
[0013]步骤S6:基于图神经网络CompGCN模型,构建并训练的得到电网故障诊断模型;
[0014]步骤S7:将待查询告警信息输入基于电网故障诊断模型,获取故障诊断结果。
[0015]进一步的,所述预设词典构建,具体如下:
[0016]针对原始语料库的各个文档M中的句子序列T={t1,t2,t3,...,t
n
},分别对其中任意第i个句子ti进行分词处理,转化为关键词序列t
i
={w
i1
,wi2,w
i3
,...,w
im
},对不同关键词统计出现次数,得到第i个句子t
i
的第j个关键词w
ij
在原始语料库D中出现的次数c
ij
,并根
据下式计算关键词w
ij
的通用词频表示TF
ij

[0017][0018]上式中,ckl为第k个句子t
k
的第l个关键词w
kl
在原始语料库D中出现的次数;
[0019]分别统计第i个句子t
i
的第j个关键词w
ij
在预设的专家知识语料库ED中出现的次数是EC
ij
,并根据下式计算关键w
ij
词的专家词频表示:
[0020][0021]上式中,EC
kl
为第k个句子t
k
的第l个关键词w
kl
在专家知识语料库ED中出现的次数;
[0022]根据下式计算关键词w
ij
的重要程度:
[0023]E(i,j)=(1

μ)
×
TF
ij

×
ETF
ij

[0024]上式中,μ为权重系数;
[0025]根据重要程度对关键词进行筛选,并对筛选后的关键词进行分类为实体和关系,将分类为实体的关键词建立实体词典,将分类为关系的关键词建立关系词典。
[0026]进一步的,所述步骤S4具体为:
[0027]根据前一个故障分词和后一个故障分词之间的相邻频次,建立相关性矩阵,以故障分词之间的相邻频次作为实体间的关系:
[0028][0029]其中,A
nn
表示相关性矩阵,其中对角线元素均为0;i,j=1,2,

,n,n表示故障分词在故障事件描述分词词典中的编号,cor
ij
表示故障分词j在故障分词i后的次数;两个故障分词相邻出现的频次,其数值的大小决定了它们之间的相关性,cor
ij
越大,故障分词之间的相关性越强;A
nn
是非对称矩阵,即cor
ij
≠cor
ji

[0030]进一步的,所述步骤S5具体为:基于相关性矩阵,将先后出现的故障分词分别作为头实体和尾实体,它们之间的相邻频次作为实体间的关系,构建告警信息三元组,并利用Neo4j图形数据库,建立基于告警信息的知识图谱。
[0031]进一步的,所述图神经网络CompGCN模型,具体如下:
[0032][0033][0034]为节点v经过模型中k层CompGCN层后的表达式,为关系r经过模型中k层CompGCN层后的表达式;其中,对应于节点x
u
的特征信息,对应着关系z
r
的特征信息,W是图神经网络相应节点和关系权重。
[0035]进一步的,所述步骤S7具体为:将知识图谱故障分词相关性矩阵A
nn
中非对角线上的0元素转化为∞,即可得到该知识图谱对应的有向图邻接矩阵A;将节点特征矩阵X进行了转置,在新故障查询时,特征矩阵X就能直接从知识图谱中获得故障信息,同时标签直接从知识图谱对应的故障类型直接获取。
[0036]一种基于知识图谱与图神经网络的电网故障诊断系统,包括
[0037]数据处理模块,用于获取电网调度历史告警信息和故障信息文本,并进行分词处理,构建告警信息故障分词库;
[0038]数据存储模块,用于基于告警信息故障分词库,构建相关性矩阵;
[0039]知识图谱模块,基于相关性矩阵,提取三元组,并Neo4j图形数据库,建立基于告警信息的知识图谱;
[0040]故障诊断模块,基于图神经网络CompGCN模型,构建并训练的得到电网故障诊断模型。
[0041]一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如上所述的方法步骤。
[0042]本专利技术具有如下有益效果:
[0043]本专利技术解决现有电网故障诊断直观性不足的问题,将知识图谱与电网故障诊断相结合,以最小语义不可分为原则,实现告警信息集合中故障事件描述分词的自聚类获取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱与图神经网络的电网故障诊断方法,其特征在于,包括以下步骤:步骤S1:获取电网调度历史告警数据集和故障数据集,构建原始语料库;步骤S2:基于原始语料库构建预设词典;步骤S3:基于预设词典和viterbi算法进行字符分解聚类即分词处理,对分词后的文本进行去重过滤,构建告警信息故障分词库;步骤S4:基于告警信息故障分词库,构建相关性矩阵;步骤S5:基于相关性矩阵,提取三元组,并基于Neo4j图形数据库,建立基于告警信息的知识图谱;步骤S6:基于图神经网络CompGCN模型,构建并训练的得到电网故障诊断模型;步骤S7:将待查询告警信息输入基于电网故障诊断模型,获取故障诊断结果。2.根据权利要求1所述的基于知识图谱与图神经网络的电网故障诊断方法,其特征在于,所述预设词典构建,具体如下:针对原始语料库的各个文档M中的句子序列T={t1,t2,t3,...,t
n
},分别对其中任意第i个句子ti进行分词处理,转化为关键词序列t
i
={w
i1
,wi2,w
i3
,...,w
im
},对不同关键词统计出现次数,得到第i个句子t
i
的第j个关键词w
ij
在原始语料库D中出现的次数c
ij
,并根据下式计算关键词w
ij
的通用词频表示TF
ij
:上式中,ckl为第k个句子t
k
的第l个关键词w
kl
在原始语料库D中出现的次数;分别统计第i个句子t
i
的第j个关键词w
ij
在预设的专家知识语料库ED中出现的次数是EC
ij
,并根据下式计算关键w
ij
词的专家词频表示:上式中,EC
kl
为第k个句子t
k
的第l个关键词w
kl
在专家知识语料库ED中出现的次数;根据下式计算关键词w
ij
的重要程度:E(i,j)=(1

μ)
×
TF
ij

×
ETF
ij
,上式中,μ为权重系数;根据重要程度对关键词进行筛选,并对筛选后的关键词进行分类为实体和关系,将分类为实体的关键词建立实体词典,将分类为关系的关键词建立关系词典。3.根据权利要求1所述的基于知识图谱与图神经网络的电网...

【专利技术属性】
技术研发人员:李强郑略省赵峰庄莉王秋琳吴佩颖邱镇黄晓光王燕蓉
申请(专利权)人:福建亿榕信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1