电网调度预案的信息抽取方法及系统技术方案

技术编号:24011238 阅读:53 留言:0更新日期:2020-05-02 01:49
本发明专利技术公开了一种电网调度预案的信息抽取方法,包括对电网调度预案进行词向量训练;根据词向量进行电网调度预案语句成分分析;根据语句成分分析结果进行信息抽取。同时也公开了相应的系统。本发明专利技术根据电网调度预案词向量进行语句成分分析,根据语句成分分析结果进行信息抽取,信息抽取效率高,提高了故障处理速度,同时也适用于非结构化的预案。

Information extraction method and system of power grid dispatching plan

【技术实现步骤摘要】
电网调度预案的信息抽取方法及系统
本专利技术涉及一种电网调度预案的信息抽取方法及系统,属于智能文本信息抽取领域。
技术介绍
由于电网规模不断扩大、拓扑结构日益复杂,电网运行中发生的故障频率也越来越高。为有效保证电网系统的稳定运行,当故障发生时,需要根据电网调度预案快速形成处置要点,供调度人员及时处理。电网调度部门根据运维经验制定了电网调度预案手册,当故障发生时,调度人员手工查找预案手册,并根据事件的特征匹配故障类型,找到相应的处置要点。在实际应用中常常采用基于规则模板库来辅助查找,由于规则模板较多,查找效率较低,同时也不适用非结构化的预案。
技术实现思路
本专利技术提供了一种电网调度预案的信息抽取方法及系统,解决了
技术介绍
中披露的问题。为了解决上述技术问题,本专利技术所采用的技术方案是:电网调度预案的信息抽取方法,包括,对电网调度预案进行词向量训练;根据词向量进行电网调度预案语句成分分析;根据语句成分分析结果进行信息抽取。在词向量训练之前,先对电网调度预案进行分词处理,具体如下:采用最大概率路径算法,从电网调度预案中找出基于词频的最大切分组合;根据最大切分组合进行分词。采用迁移学习方法对电网调度预案进行词向量训练。迁移学习方法中的源网络为长短时记忆神经网络,目标网络仅更新softmax层,目标网络与源网络共享隐含层。根据词向量进行电网调度预案语句成分分析,获得语法树;具体过程为,将电网调度预案语句输入概率上下文无关文法分析器,经训练生成语句的候选分析树;将候选分析树作为循环神经网络的输入,结合词向量共同训练,得到句法分析器;用句法分析器对电网调度预案语句进行句法分析,得到语句的语法树。信息抽取过程为,将语句成分分析结果转换成依存文法,根据依存文法进行信息抽取。电网调度预案的信息抽取系统,包括,词向量模块:对电网调度预案进行词向量训练;成分分析模块:根据词向量进行电网调度预案语句成分分析;信息抽取模块:根据语句成分分析结果进行信息抽取。成分分析模块包括:候选分析树模块:将电网调度预案语句输入概率上下文无关文法分析器,经训练生成语句的候选分析树;句法分析器模块:将候选分析树作为循环神经网络的输入,结合词向量共同训练,得到句法分析器;语法树模块:用句法分析器对电网调度预案语句进行句法分析,得到语句的语法树。一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行电网调度预案的信息抽取方法。一种计算设备,包括一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行电网调度预案的信息抽取方法的指令。本专利技术所达到的有益效果:本专利技术根据电网调度预案词向量进行语句成分分析,根据语句成分分析结果进行信息抽取,信息抽取效率高,提高了故障处理速度,同时也适用于非结构化的预案。附图说明图1为本专利技术的流程图;图2为获取语法树的流程图。具体实施方式下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。如图1所示,电网调度预案的信息抽取方法,包括以下步骤:步骤1,对电网调度预案进行预处理。电网调度预案文本内部包含专业词汇,通用分词方法是通过查找最大概率路径找出基于词频的最大切分组合,而专业词词频低,在计算最大概率路径时会被过滤掉,因而需要对其进行预处理,具体如下:11)将电网调度预案转换成纯文本;12)将转换后的电网调度预案进行分词处理;即采用最大概率路径算法,从文本中找出基于词频的最大切分组合;计算语句中每个词在该语句中的概率:其中,C={a1,a2,...aj,...,ak}表示句子中包含k个词,aj表示第j个词;将切分所得的所有结果中找出概率最大的切分组合;13)根据最大切分组合进行分词;14)用专业字典对分词处理后的结果进行校正;专业字典为电网调度预案中的词构成,专业字典构建过程如下:A1)将电网调度预案文本按语句进行切分;A2)将所有文本的格式转换为txt格式;A3)汇总文本中出现的词,构建电网调度预案的专业字典。步骤2,采用迁移学习方法对电网调度预案进行词向量训练。迁移学习方法解决了电网调度预案语句和关键词数量少的问题,在开放领域文本集训练模型的基础上,利用电网调度预案文本进行词向量迁移,其中迁移学习方法中的源网络为长短时记忆神经网络,目标网络仅更新softmax层,目标网络与源网络共享隐含层。具体过程如下:21)获取并预处理开放领域文本集,抽取特征,训练得到开放领域文本词向量;22)根据开放领域文本词向量训练语言模型,语言模型为长短时记忆神经网络,层与层之间采用全连接的方式,输入层到隐藏层的权重矩阵、隐藏层到输出层的权重矩阵随机初始化;23)根据反向传播算法,调节权重矩阵,通过不断的训练,得到更准确的模型参数;24)根据电网调度预案文本的特点对训练好的语言模型进行改进,即将语言模型去除softmax层,在此之上为电网调度预案数据集添加一个新的softmax层,对softmax层参数随机初始化,并保留训练过的长短时记忆神经网络其余参数;25)通过新的语言模型,得到电网调度预案的词向量。步骤3,根据词向量进行电网调度预案语句成分分析,获得语法树。如图2所示,具体过程如下:31)将电网调度预案语句输入概率上下文无关文法分析器,经训练生成语句的候选分析树;32)将候选分析树作为循环神经网络的输入,结合词向量共同训练,得到句法分析器;33)用句法分析器对电网调度预案语句进行句法分析,得到语句的语法树。传统的循环神经网络(RNN)模型在训练时没有考虑到关键词之间的词义关系对训练结果产生的影响,造成句法分析不准确,实际上电网领域中专业词汇的词性和词义对分析结果影响很大,因此这里采用结合词义的循环神经网络(SU-RNN)训练句法模型。该模型采用组合向量文法(CVG)进行两遍自底向上的搜索:首先将待分析的语句输入到上下文无关文法(PCFG)中,经过PCFG的训练生成该语句的候选分析树,然后将候选树作为SU-RNN的输入,结合关键词的词向量,训练得到句法分析器,用句法分析器对电网调度预案语句进行句法分析,得到语句的语法树,对语法树进行评分,将分数最高作为最终语法树。语法树评分过程如下:B1)结合语义自底向上计算每一个语法树结点的概率p,计算公式为:其中,WA,B表示RNN的权重矩阵W∈Rn×2n,其值依赖于孩子结点的词性,a,b表示结点本文档来自技高网...

【技术保护点】
1.电网调度预案的信息抽取方法,其特征在于:包括,/n对电网调度预案进行词向量训练;/n根据词向量进行电网调度预案语句成分分析;/n根据语句成分分析结果进行信息抽取。/n

【技术特征摘要】
1.电网调度预案的信息抽取方法,其特征在于:包括,
对电网调度预案进行词向量训练;
根据词向量进行电网调度预案语句成分分析;
根据语句成分分析结果进行信息抽取。


2.根据权利要求1所述的电网调度预案的信息抽取方法,其特征在于:在词向量训练之前,先对电网调度预案进行分词处理,具体如下:
采用最大概率路径算法,从电网调度预案中找出基于词频的最大切分组合;
根据最大切分组合进行分词。


3.根据权利要求1所述的电网调度预案的信息抽取方法,其特征在于:采用迁移学习方法对电网调度预案进行词向量训练。


4.根据权利要求3所述的电网调度预案的信息抽取方法,其特征在于:迁移学习方法中的源网络为长短时记忆神经网络,目标网络仅更新softmax层,目标网络与源网络共享隐含层。


5.根据权利要求1所述的电网调度预案的信息抽取方法,其特征在于:根据词向量进行电网调度预案语句成分分析,获得语法树;具体过程为,
将电网调度预案语句输入概率上下文无关文法分析器,经训练生成语句的候选分析树;
将候选分析树作为循环神经网络的输入,结合词向量共同训练,得到句法分析器;
用句法分析器对电网调度预案语句进行句法分析,得到语句的语法树。


6.根据权利要求1所述的电网调度...

【专利技术属性】
技术研发人员:李伟
申请(专利权)人:南瑞集团有限公司国电南瑞科技股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1