基于数据多源融合的电力文本知识发现方法及设备技术

技术编号:34774028 阅读:13 留言:0更新日期:2022-08-31 19:42
本发明专利技术公开了基于数据多源融合的电力文本知识发现方法及设备,属于电力设备技术领域。本发明专利技术的基于数据多源融合的电力文本知识发现方法,通过构建文本数据提取模型、规则引擎判断模型、图数据挖掘模型,能从电力自然语言数据及电力设备状态文本中自动提取出缺陷诊断所需的关键信息,并集合图神经网络技术和规则引擎技术对电力文本中记录的电力设备运行状态进行评估,并能判断出故障部位及原因;同时实现至少两种文本类型的多源融合,为电力设备故障诊断提供更精准的辅助决策,降低了对运维人员的文本记录信息质量要求,方案科学、合理,计算简单,诊断准确率高,切实可行。切实可行。切实可行。

【技术实现步骤摘要】
基于数据多源融合的电力文本知识发现方法及设备


[0001]本专利技术涉及基于数据多源融合的电力文本知识发现方法及设备,属于电力设备


技术介绍

[0002]在电力设备日常巡检维护过程中,电网运维部门积累了大量设备运行状态文本。由于电力设备运行情况复杂多变,目前设备缺陷的判断与处理工作的开展仍大多依靠运维人员的知识与经验,但对于经验不足的运维人员很有可能无法根据巡检结果准确快速判断出电力设备是否存在缺陷以及存在缺陷的部件与原因。而电力公司积累的大量设备缺陷案例可以为设备缺陷诊断提供指导。案例记录有设备缺陷现象、处理过程、解决措施等信息,蕴含了丰富的专家经验,在设备的日常运维中具有较高参考价值。但由于案例众多且日常利用率低,设备缺陷案例尚无法发挥其应有的作用。如果可以借助计算机算法对案例中蕴藏的丰富知识进行学习并实现基于状态文本的电力设备的自动诊断可以大大提高设备运行可靠性并降低人力成本。
[0003]电力设备状态文本一般采用自然语言进行记录,但目前借助计算机实现自然语言信息的提取、表示、分析等过程尚存一定困难。目前基于浅层机器学习方法的知识发现设备在告警信号文本、配电线路跳闸填报文本的数据挖掘方面取得了一定成果,大多采用对电力文本进行停用词去除、词性标注等工作以选取文本特征,再利用如支持向量机、随机森林等算法对文本特征向量进行分析。但是电力文本一是由于专业特点以及编写人员记录风格不同,状态文本中所用词汇俗称较多;二是日常巡检中工作繁杂,各信息间往往存在多层嵌套关系;三是电力设备存在结构复杂,缺陷原因多样、逻辑关系复杂的特点,目前故障识别诊断准确率需要进一步提高。
[0004]经过检索,《基于数据挖掘的变压器故障诊断系统的构建》提出了针对变压器故障诊断现有方法中存在的不足,运用故障树分析法,构建了变压器故障树诊断模型,并基于聚类分析、判定树归纳分类等传统模式识别方法,实现了对变压器各项故障数据的深入发掘。但此方法存在如下问题:仅能针对一个特定事故作分析,而不是针对一个过程或设备系统作分析,具有局部性;对于复杂的诊断模型,故障树规模庞大,计算复杂,诊断准确率低。
[0005]经过检索,《基于知识图谱技术的电力设备缺陷记录检索方法》提出了利用现有电力设备缺陷记录语料构建电力设备缺陷知识图谱;然后基于所构建的知识图谱,利用图搜索进行电力设备缺陷检索。但此方法未利用句法分析等自然语言处理技术,无法在共指消解和关系抽取中得到更加丰富有效的语义特征,从而知识图谱的精确性以及完整性存在不足,故障诊断准确率低。
[0006]经过检索,《基于卷积神经网络的电力设备缺陷文本分类模型研究》在电力文本处理中引入卷积神经网络模型,构建了电力缺陷文本分类模型。但上述方法所处理的文本故障严重程度分类简单(一般、重要和紧急),难以处理文本中存在多种故障原因嵌套的情况,不利于诊断的准确开展。

技术实现思路

[0007]针对现有技术的缺陷,本专利技术的目的一在于提供一种通过构建文本数据提取模型、规则引擎判断模型、图数据挖掘模型,能从电力自然语言数据及电力设备状态文本中自动提取出缺陷诊断所需的关键信息,并集合图神经网络技术和规则引擎技术对电力文本中记录的电力设备运行状态进行评估,并能判断出故障部位及原因;同时实现至少两种数据类型的多源融合,为电力设备故障诊断提供更精准的辅助决策,降低了对运维人员的文本记录信息质量要求,方案科学、合理,计算简单,诊断准确率高,切实可行的基于数据多源融合的电力文本知识发现方法。
[0008]本专利技术的目的二在于提供一种通过设置可触控显示屏、处理器、电源模块、文本数据提取模块、图数据挖掘模块、规则引擎判断模块、设备内存,能够有效结合基础自然语言处理与信息抽取、规则引擎判断、图数据挖掘等深度学习技术,实现采样数据多元融合,并能从电力设备状态文本中自动提取出缺陷诊断所需的关键信息,并集合图神经网络技术和规则引擎技术对电力文本中记录的电力设备运行状态进行评估,为运检人员提供更精准的辅助决策的基于数据多源融合的电力文本知识发现设备。
[0009]为实现上述目的之一,本专利技术的第一种技术方案为:
[0010]基于数据多源融合的电力文本知识发现方法,
[0011]包括以下步骤:
[0012]第一步,获取电力自然语言数据以及监测指标数据;
[0013]第二步,根据第一步中的电力自然语言数据,构建文本数据提取模型;
[0014]所述文本数据提取模型用于对电力自然语言数据进行处理与关键信息抽取,得到关键特征信息;
[0015]根据历史监测指标数据,构建规则引擎判断模型;
[0016]所述规则引擎判断模型用于基于规则引擎对监测指标数据进行分析,将监测指标数据与比较规则进行对比,得到故障设备信息,对故障部件进行快速定位;
[0017]第三步,构建图数据挖掘模型,对第二步中的关键特征信息进行分析,得到电力文本中设备运行现象文本描述的故障信息,以降低系统内存要求,提高设备的计算速度与诊断准确率;
[0018]第四步,根据第三步中的图数据挖掘模型以及第二步中的规则引擎判断模型,对待判断的电力自然语言数据以及监测指标数据进行分析,实现至少两种数据类型的多源融合,并能判断出故障部位及原因。
[0019]电力自然语言数据(电力文本)记录了设备故障现象、处理过程、解决措施等设备故障信息,蕴含了丰富的设备质量信息及专家处理经验,在同类设备故障处理时具有较高参考价值。如果可以通过一条巡检记录或传感器数据报告利用计算机迅速检索出具有类似故障情况的故障案例,就可以借鉴前人的经验加快故障处理进度、发现同类潜伏异常或缺陷,对提高设备本质安全水平具有重大意义。
[0020]因此,本专利技术经过不断探索以及试验,通过构建文本数据提取模型、规则引擎判断模型、图数据挖掘模型,能从电力自然语言数据及电力设备状态文本中自动提取出缺陷诊断所需的关键信息,并集合图神经网络技术和规则引擎技术对电力文本中记录的电力设备运行状态进行评估,并能判断出故障部位及原因;同时实现至少两种数据类型的多源融合,
为电力设备故障诊断提供更精准的辅助决策,降低了对运维人员的文本记录信息质量要求,方案科学、合理,计算简单,诊断准确率高,切实可行。
[0021]作为优选技术措施:
[0022]所述第二步中,文本数据提取模型对电力文本中设备运行现象描述的关键指标信息特征进行提取与初判断,得到包括设备、设备状态类型、设备状态参数的三元组;
[0023]其具体的构建方法如下:
[0024]S1:对电力自然语言数据的关键特征进行初步提取,得到初步提取结果;
[0025]S2:对S1中的初步提取结果进行标准化与泛化处理,得到特征增强数据;
[0026]S3:根据S2中的特征增强数据,进行设备状态参数判断。
[0027]作为优选技术措施:
[0028]所述S1中:关键特征初步提取,具体包括以下内容:
[0029]电力自然语言数据在进行三元组识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于数据多源融合的电力文本知识发现方法,其特征在于,包括以下步骤:第一步,获取电力自然语言数据以及监测指标数据;第二步,根据第一步中的电力自然语言数据,构建文本数据提取模型;所述文本数据提取模型用于对电力自然语言数据进行处理与关键信息抽取,得到关键特征信息;根据历史监测指标数据,构建规则引擎判断模型;所述规则引擎判断模型用于基于规则引擎对监测指标数据进行分析,将监测指标数据与比较规则进行对比,得到故障设备信息,对故障部件进行快速定位;第三步,构建图数据挖掘模型,对第二步中的关键特征信息进行分析,得到电力文本中设备运行现象文本描述的故障信息;第四步,根据第三步中的图数据挖掘模型以及第二步中的规则引擎判断模型,对待判断的电力自然语言数据以及监测指标数据进行分析,实现至少两种数据类型的多源融合,并能判断出故障部位及原因。2.如权利要求1所述的基于数据多源融合的电力文本知识发现方法,其特征在于,所述第二步中,文本数据提取模型对电力文本中设备运行现象描述的关键指标信息特征进行提取与初判断,得到包括设备、设备状态类型、设备状态参数的三元组;其具体的构建方法如下:S1:对电力自然语言数据的关键特征进行初步提取,得到初步提取结果;S2:对S1中的初步提取结果进行标准化与泛化处理,得到特征增强数据;S3:根据S2中的特征增强数据,进行设备状态参数判断。3.如权利要求2所述的基于数据多源融合的电力文本知识发现方法,其特征在于,所述S1中:关键特征初步提取,具体包括以下内容:电力自然语言数据在进行三元组识别提取时,兼顾字符前后的语义关联,并获得电力自然语言数据的双向语义信息;所述双向语义信息的获取方法如下:采用双向长短时记忆模型对电力自然语言数据的正向和反向信息进行传输,得到隐状态序列(h1,h2,...,h
n
)∈R
n*m
,再接入一个线性层,转换隐状态序列的维度,从m维转换到k维,并对电力自然语言数据中字符所属关键特征信息的概率进行计算;同时利用随机条件场获得电力自然语言数据中字符标签的相连关系,以获得最优关键特征信息抽取;随机条件场在给定条件X下,其条件Y满足马尔可夫性,每个特征模版都要滑过每个位置,相加起来得到该特征模版对整个句子的打分,最后对多个特征模版进行加权求和,实现关键特征的初步提取,其计算公式如下:其中λ
k
为边特征函数的权重,μ
l
为点特征函数的权重,t
k
为在边上的特征函数,s
l
为在节点上的特征函数,λ
k
和μ
l
为对应的权值;Z(x)为规范化因子,k为第k个状态特征的序号,i为
第i个字符的序号。4.如权利要求2所述的基于数据多源融合的电力文本知识发现方法,其特征在于,所述S2中,标准化与泛化处理,具体包括以下内容:对同义词关系、上下位关系进行了知识标准化与词表梳理工作;基于整理得到的同义词关系与上下位关系,对提取得到的关键特征信息进行同义词标准化比对与替换。5.如权利要求2所述的基于数据多源融合的电力文本知识发现方法,其特征在于,所述S3:设备状态参数判断,具体包括以下内容:S31,对任意给定电力自然语言数据识别出目标命名实体对应的属性与值;S32,根据S31中的属性与值,得到设备、设备状态类型、设备状态参数三元组;S33,根据S32中的三元组,判断设备状态参数为正常或异常。6.如权利要求1所述的基于数据多源融合的电力文本知识发现方法,其特征在于,所述规则引擎判断模型,利用业务准则、国家标准建立规则引擎系统,对监测指标数据进行判断;其具体包括以下步骤:步骤1:将监测指标数据以无线传输形式输入到预先存储在设备内存里的规则引擎的规则库中;步骤2:使用模式匹配器比较规则库中的规则与步骤1中的监测指标数据;步骤3:如果监测指标数据与步骤2中的规则库的规则匹配成功,则输出对应诊断结果;反之,则重新将监测指标数据与规则库的规则匹配,直至与全部规则进行匹配。7.如权利要求1所述的基于数据多源融合的电力文本知识发现方法,其特征在于,所述图数据挖掘模型,将电力自然语言数据中关键指标信息与图结构进行对应,形成电力异构图,对电力设备运行状态诊断;对应关系包括:设备、部件、指标对应为图结构中的节点,设备与部件、部件与指标节点间的关联关系对应为图结构中的边;其中,图中各节点由于所对应的信息...

【专利技术属性】
技术研发人员:李晨蔺家骏王雅雯蒋晨张博文马国明刘黎王劭鹤
申请(专利权)人:华北电力大学中国电力科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1