【技术实现步骤摘要】
基于数据多源融合的电力文本知识发现方法及设备
[0001]本专利技术涉及基于数据多源融合的电力文本知识发现方法及设备,属于电力设备
技术介绍
[0002]在电力设备日常巡检维护过程中,电网运维部门积累了大量设备运行状态文本。由于电力设备运行情况复杂多变,目前设备缺陷的判断与处理工作的开展仍大多依靠运维人员的知识与经验,但对于经验不足的运维人员很有可能无法根据巡检结果准确快速判断出电力设备是否存在缺陷以及存在缺陷的部件与原因。而电力公司积累的大量设备缺陷案例可以为设备缺陷诊断提供指导。案例记录有设备缺陷现象、处理过程、解决措施等信息,蕴含了丰富的专家经验,在设备的日常运维中具有较高参考价值。但由于案例众多且日常利用率低,设备缺陷案例尚无法发挥其应有的作用。如果可以借助计算机算法对案例中蕴藏的丰富知识进行学习并实现基于状态文本的电力设备的自动诊断可以大大提高设备运行可靠性并降低人力成本。
[0003]电力设备状态文本一般采用自然语言进行记录,但目前借助计算机实现自然语言信息的提取、表示、分析等过程尚存一定困难。目前基于浅层机器学习方法的知识发现设备在告警信号文本、配电线路跳闸填报文本的数据挖掘方面取得了一定成果,大多采用对电力文本进行停用词去除、词性标注等工作以选取文本特征,再利用如支持向量机、随机森林等算法对文本特征向量进行分析。但是电力文本一是由于专业特点以及编写人员记录风格不同,状态文本中所用词汇俗称较多;二是日常巡检中工作繁杂,各信息间往往存在多层嵌套关系;三是电力设备存在结构复杂,缺陷原因多样 ...
【技术保护点】
【技术特征摘要】
1.基于数据多源融合的电力文本知识发现方法,其特征在于,包括以下步骤:第一步,获取电力自然语言数据以及监测指标数据;第二步,根据第一步中的电力自然语言数据,构建文本数据提取模型;所述文本数据提取模型用于对电力自然语言数据进行处理与关键信息抽取,得到关键特征信息;根据历史监测指标数据,构建规则引擎判断模型;所述规则引擎判断模型用于基于规则引擎对监测指标数据进行分析,将监测指标数据与比较规则进行对比,得到故障设备信息,对故障部件进行快速定位;第三步,构建图数据挖掘模型,对第二步中的关键特征信息进行分析,得到电力文本中设备运行现象文本描述的故障信息;第四步,根据第三步中的图数据挖掘模型以及第二步中的规则引擎判断模型,对待判断的电力自然语言数据以及监测指标数据进行分析,实现至少两种数据类型的多源融合,并能判断出故障部位及原因。2.如权利要求1所述的基于数据多源融合的电力文本知识发现方法,其特征在于,所述第二步中,文本数据提取模型对电力文本中设备运行现象描述的关键指标信息特征进行提取与初判断,得到包括设备、设备状态类型、设备状态参数的三元组;其具体的构建方法如下:S1:对电力自然语言数据的关键特征进行初步提取,得到初步提取结果;S2:对S1中的初步提取结果进行标准化与泛化处理,得到特征增强数据;S3:根据S2中的特征增强数据,进行设备状态参数判断。3.如权利要求2所述的基于数据多源融合的电力文本知识发现方法,其特征在于,所述S1中:关键特征初步提取,具体包括以下内容:电力自然语言数据在进行三元组识别提取时,兼顾字符前后的语义关联,并获得电力自然语言数据的双向语义信息;所述双向语义信息的获取方法如下:采用双向长短时记忆模型对电力自然语言数据的正向和反向信息进行传输,得到隐状态序列(h1,h2,...,h
n
)∈R
n*m
,再接入一个线性层,转换隐状态序列的维度,从m维转换到k维,并对电力自然语言数据中字符所属关键特征信息的概率进行计算;同时利用随机条件场获得电力自然语言数据中字符标签的相连关系,以获得最优关键特征信息抽取;随机条件场在给定条件X下,其条件Y满足马尔可夫性,每个特征模版都要滑过每个位置,相加起来得到该特征模版对整个句子的打分,最后对多个特征模版进行加权求和,实现关键特征的初步提取,其计算公式如下:其中λ
k
为边特征函数的权重,μ
l
为点特征函数的权重,t
k
为在边上的特征函数,s
l
为在节点上的特征函数,λ
k
和μ
l
为对应的权值;Z(x)为规范化因子,k为第k个状态特征的序号,i为
第i个字符的序号。4.如权利要求2所述的基于数据多源融合的电力文本知识发现方法,其特征在于,所述S2中,标准化与泛化处理,具体包括以下内容:对同义词关系、上下位关系进行了知识标准化与词表梳理工作;基于整理得到的同义词关系与上下位关系,对提取得到的关键特征信息进行同义词标准化比对与替换。5.如权利要求2所述的基于数据多源融合的电力文本知识发现方法,其特征在于,所述S3:设备状态参数判断,具体包括以下内容:S31,对任意给定电力自然语言数据识别出目标命名实体对应的属性与值;S32,根据S31中的属性与值,得到设备、设备状态类型、设备状态参数三元组;S33,根据S32中的三元组,判断设备状态参数为正常或异常。6.如权利要求1所述的基于数据多源融合的电力文本知识发现方法,其特征在于,所述规则引擎判断模型,利用业务准则、国家标准建立规则引擎系统,对监测指标数据进行判断;其具体包括以下步骤:步骤1:将监测指标数据以无线传输形式输入到预先存储在设备内存里的规则引擎的规则库中;步骤2:使用模式匹配器比较规则库中的规则与步骤1中的监测指标数据;步骤3:如果监测指标数据与步骤2中的规则库的规则匹配成功,则输出对应诊断结果;反之,则重新将监测指标数据与规则库的规则匹配,直至与全部规则进行匹配。7.如权利要求1所述的基于数据多源融合的电力文本知识发现方法,其特征在于,所述图数据挖掘模型,将电力自然语言数据中关键指标信息与图结构进行对应,形成电力异构图,对电力设备运行状态诊断;对应关系包括:设备、部件、指标对应为图结构中的节点,设备与部件、部件与指标节点间的关联关系对应为图结构中的边;其中,图中各节点由于所对应的信息...
【专利技术属性】
技术研发人员:李晨,蔺家骏,王雅雯,蒋晨,张博文,马国明,刘黎,王劭鹤,
申请(专利权)人:华北电力大学中国电力科学研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。