基于深度学习的智能变电站操作票信息智能搜索匹配方法组成比例

技术编号:20045101 阅读:27 留言:0更新日期:2019-01-09 04:13
本发明专利技术公开了一种基于深度学习的智能变电站操作票信息智能搜索匹配方法。类似智能站监控信息调度联调、站内程序化操作的验证等工作,当前只能人工逐条进行,需要耗费大量的人力和时间,极大影响工程进度。本发明专利技术采用的技术方案包括:利用关键词提取技术提取操作票中的操作对象信息;建立用于操作票信息智能搜索匹配的双层神经网络模型;利用相似度计算和排序从SCD文件中提取与操作票信息匹配的DO对象。本发明专利技术能够基于自然语言处理相关技术,建立起操作票信息与SCD文件之间的关联,解决变电站操作票信息的智能识别和搜索匹配,进而服务于完整高效的变电站智能调试工作。

【技术实现步骤摘要】
基于深度学习的智能变电站操作票信息智能搜索匹配方法
本专利技术涉及人工智能、电网智能变电领域,具体地说是一种基于深度学习的智能变电站操作票信息智能搜索匹配方法。
技术介绍
随着智能电网的发展,信息网络规模不断增大,不同应用系统之间的信息交换大大增加,信息环节对物理系统的影响问题将更加突出。电力系统应用集成是减少工作量、提高电能质量、提高电力企业经济效益的必要手段,但是电力企业在信息化过程中基本以业务部门为依托进行条块分割,各个应用系统相互独立且高度自治,导致电网建模和数据名称不一致问题严重,信息匹配已经是应用集成急需解决的问题。问题具体表现为:为了满足各类应用的需求,在智能站工程调试阶段需要开展大量工作来验证信息是否匹配。类似智能站监控信息调度联调、站内程序化操作的验证等工作,当前只能人工逐条进行,需要耗费大量的人力和时间,极大影响工程进度。
技术实现思路
本专利技术所要解决的技术问题是克服上述现有技术存在的缺陷,提供一种基于深度学习的智能变电站操作票信息智能搜索匹配方法,实现自动化作业,以替代往常的人工作业模式,为实际工程生产和调试中的工作提供技术支撑。为解决上述技术问题,本专利技术采用的技术方案是:基于深度学习的智能变电站操作票信息智能搜索匹配方法,其包括以下步骤:S1,利用关键词提取技术提取操作票中的操作对象信息;S2,建立用于操作票信息智能搜索匹配的双层神经网络模型;S3,利用相似度计算和排序从SCD文件中提取与操作票信息匹配的DO对象。作为上述技术方案的补充,步骤S1中,关键词提取技术利用基于BP神经网络模型的由字构词分词法和根据分词结果利用循环神经网络模型实现操作票中操作对象的识别。作为上述技术方案的补充,步骤S1中,基于BP神经网络模型的由字构词分词法进行分词,其过程如下:选取操作票每个字前后各K个字,连同该字本身输入共2*K+1个字;选择每个字的向量维度为L,则输入神经网络模型的维度L*(2*K+1);采用三层BP神经网络,输入层为L*(2*K+1)个神经元,隐藏层为L个神经元,输出层为4个神经元,每个神经元对应该字的词位分别为S,B,M,E的概率,S,B,M,E分别对应字单独成词、词首、词中、词尾;从输出词位概率值中选择概率最大的词位作为该字的词位类别。为了利用操作票每个字的上下文信息,本专利技术采用基于知识进行分词方法中的BP神经网络进行分词。该方法对操作票每个字的上下文信息记忆能力比较好,拥有不错的容错效果;同时该方法采用非线性并行处理方法,并且在分词中可以自动处理和学习得到的知识和信息,解决了操作票信息较多带来的速度问题。作为上述技术方案的补充,步骤S1中,根据分词结果利用循环神经网络模型实现操作票中操作对象的识别,其过程如下:将所得分词序列依次转换为词向量,选择词的向量维度为M;设定足够长的词数N,不足的后面补空,则循环神经网络模型的输入为M*N的向量,对应循环神经网络模型的输入层;第二层为双LSTM(LongShortTermMemoryNetwork,长短时记忆网络);输出层输出2维的分类情况,输出的分类结果为0和1,代表该词是否为操作对象,0表示否,1表示是。为了解决操作票中每个词的时序敏感及操作票内容长度不确定问题,本专利技术采用了循环神经网络(RNN)模型。作为上述技术方案的补充,步骤S2中,搜索匹配采用的规则为:判断两条信息所属的组别是否相同,如果两条信息的组别不同,则认定两条信息不匹配;如果两条信息属于同一组别,再判断两条信息的具体设备信息是否相同,给出最终的匹配结果。由于操作票中线路或设备信息的通常格式为“间隔+具体设备信息”。相比不同间隔,同一间隔下设备的信息之间的相似程度显然要高。因此,本专利技术将间隔抽象为组别。作为上述技术方案的补充,步骤S2中,基于搜索匹配规则,采用双层神经网络模型,第一层区分组内和组外项:组外为‘0’,组内为‘1’;第二层区分匹配项:组内不匹配为‘0’,组内匹配为‘1’;其中每层神经网络模型采用深度BP神经网络或深度循环神经网络,模型的输出为操作票信息与SCD文件中DO对象是否匹配的结果。作为上述技术方案的补充,根据每层采用神经网络的不同,双层神经网络共有四种结构,分别为:BP_1、BP_2,表示模型的第一、二层均采用BP模型;BP_1、LSTM_2,表示模型的第一层采用BP模型,第二层采用LSTM模型;LSTM_1、BP_2,表示模型的第一层采用LSTM模型,第二层采用BP模型;LSTM_1、LSTM_2,表示模型的第一、二层均采用LSTM模型。作为上述技术方案的补充,步骤S3中,根据步骤S2中神经网络的输出结果是‘0’、‘1’的概率,遍历判断操作票信息与SCD文件中所有DO对象是否匹配;其中‘1’的概率即为相似度或匹配度,其大小表示操作票信息与SCD信息的匹配程度,由此选择匹配度最大的SCD文件中的DO对象作为某条操作票信息的最佳匹配结果。与现有技术相比,本专利技术具有的有益效果是:(1)利用BP神经网络实现了中文分词。(2)利用循环神经网络完成了操作票关键字提取。(3)利用双层深度学习模型(即双层神经网络模型)实现了操作票信息的搜索匹配。本专利技术能够基于自然语言处理相关技术,建立起操作票信息与SCD文件之间的关联,解决变电站操作票信息的智能识别和搜索匹配,进而服务于完整高效的变电站智能调试工作。附图说明图1为本专利技术基于深度学习的智能变电站操作票信息智能搜索匹配方法的流程图;图2为本专利技术操作票信息与SCD文件中的DO对象搜索匹配流程图。具体实施方式附图仅用于示例性说明,不能理解为对本专利技术的限制;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明,不能理解为对本专利技术的限制。下面将结合本专利技术中的附图,对本专利技术技术方案进行详细介绍。本专利技术技术方案的实施主要包括以下步骤(流程图见附图1):S1,利用关键词提取技术提取操作票中的操作对象信息(1)利用BP神经网络模型进行中文分词。取操作票中每个字前后各3个字,前后3个字连同该字本身输入共7个字。选择每个字的向量维度为100,则输入神经网络模型的维度100*(2*3+1)=700。采用三层BP神经网络,输入层为700个神经元,隐藏层为100个神经元,输出层为4个神经元,每个神经元对应该字的词位分别为S,B,M,E(S,B,M,E分别为字单独成词(S)、词首(B)、词中(M)、词尾(E))的概率。从输出词位概率值中选择概率最大的词位作为该字的词位类别,对操作票的每个字进行依次进行同样处理便可以完成对整个操作票的分词。例如操作票“合上仙永线50121闸刀”经过分词后得到“合上仙永线50121闸刀”。(2)根据分词结果利用循环神经网络模型实现操作票中操作对象信息识别。将步骤(1)所得分词序列依次转换为词向量,选择词的向量维度为10。足够长的词数30(不足的后面补空),作为固定输入的维度,则神经网络模型的输入为30*10的向量,对应循环神经网络模型的输入层;第二层为双LSTM,隐藏层为128个神经元;输出层输出以0,1表示的2维分类情况(0和1分别对应该词是否为设备或线路,1表示是,0表示否)。经过操作后,从操作票分词结果中提取了以“仙永线50122闸刀”表示的线本文档来自技高网...

【技术保护点】
1.基于深度学习的智能变电站操作票信息智能搜索匹配方法,其特征在于,包括以下步骤:S1,利用关键词提取技术提取操作票中的操作对象信息;S2,建立用于操作票信息智能搜索匹配的双层神经网络模型;S3,利用相似度计算和排序从SCD文件中提取与操作票信息匹配的DO对象。

【技术特征摘要】
1.基于深度学习的智能变电站操作票信息智能搜索匹配方法,其特征在于,包括以下步骤:S1,利用关键词提取技术提取操作票中的操作对象信息;S2,建立用于操作票信息智能搜索匹配的双层神经网络模型;S3,利用相似度计算和排序从SCD文件中提取与操作票信息匹配的DO对象。2.根据权利要求1所述的基于深度学习的智能变电站操作票信息智能搜索匹配方法,其特征在于,步骤S1中,关键词提取技术利用基于BP神经网络模型的由字构词分词法和根据分词结果利用循环神经网络模型实现操作票中操作对象的识别。3.根据权利要求2所述的基于深度学习的智能变电站操作票信息智能搜索匹配方法,其特征在于,步骤S1中,基于BP神经网络模型的由字构词分词法进行分词,其过程如下:选取操作票每个字前后各K个字,连同该字本身输入共2*K+1个字;选择每个字的向量维度为L,则输入神经网络模型的维度L*(2*K+1);采用三层BP神经网络,输入层为L*(2*K+1)个神经元,隐藏层为L个神经元,输出层为4个神经元,每个神经元对应该字的词位分别为S,B,M,E的概率,S,B,M,E分别对应字单独成词、词首、词中、词尾;从输出词位概率值中选择概率最大的词位作为该字的词位类别。4.根据权利要求3所述的基于深度学习的智能变电站操作票信息智能搜索匹配方法,其特征在于,步骤S1中,根据分词结果利用循环神经网络模型实现操作票中操作对象的识别,其过程如下:将所得分词序列依次转换为词向量,选择词的向量维度为M;设定足够长的词数N,不足的后面补空,则循环神经网络模型的输入为M*N的向量,对应循环神经网络模型的输入层;第二层为双LSTM;输出层输出2维的分类情况,输出的分类结果为0和1,代表该词是否为操作对象,0表示...

【专利技术属性】
技术研发人员:罗华峰陆承宇宣晓华黄晓明杜奇伟丁峰阮黎翔王松吴栋萁杨涛柯人观汪冬辉方芳孙文文戚宣威孙志达陈明鲍威史立勤
申请(专利权)人:国网浙江省电力有限公司电力科学研究院国家电网有限公司杭州沃瑞电力科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1