电力信息运维知识模型构建方法技术

技术编号:19543761 阅读:35 留言:0更新日期:2018-11-24 20:36
本发明专利技术提出一种电力信息运维知识模型构建方法,通过对电力系统工单数据进行文本化和分词,之后通过相似度进行分类,再构建LSTM结构的知识模型。本发明专利技术提高了电力数据的有效利用,发挥数据隐藏的价值,提高电网的智能化应用水平,改变过去低维度、相互孤立的信息展现方式,将电力信息数据模型化,能够更加直观呈现电力知识之间的关联性。在此基础上,可以构建电力信息运维系统知识库,将历史运维数据转化为知识,支持用户在线自主咨询和解决问题,实现智能问答,提高运维效率,在电网运维工作中将发挥重要价值,并在此基础上完成电力信息运维领域知识模型优化存储技术。

Knowledge Model Construction Method of Electric Power Information Operation and Maintenance

The invention provides a method for constructing knowledge model of power information operation and maintenance. The knowledge model of LSTM structure is constructed by Textualizing and segmenting power system work order data, and then classifying by similarity. The invention improves the effective utilization of power data, exerts the value of data hiding, improves the intelligent application level of power grid, changes the low-dimensional and isolated information presentation mode in the past, and models power information data, so as to visualize the correlation between power knowledge more intuitively. On this basis, the knowledge base of power information operation and maintenance system can be constructed, and the historical operation and maintenance data can be transformed into knowledge, which can support users'online independent consultation and problem solving, realize intelligent question answering and improve operation and maintenance efficiency. It will play an important role in the work of power information operation and maintenance, and on this basis, complete the knowledge of power information operation and maintenance field. Model optimization storage technology.

【技术实现步骤摘要】
电力信息运维知识模型构建方法
本专利技术属于电力运维管理领域,尤其涉及一种电力信息运维知识模型构建方法。
技术介绍
当前的电力运维客服系统每天都在面临着来自各方的海量的客户的心声,企业和个人用户通过微信公众号、微博、掌上电力APP、95598智能互动网站等各种渠道进行业务咨询、故障保修、投诉、举报、建议、意见及表扬、电网信息、政策订阅等,对服务提供及消费提出了更高的要求,需要及时、准确洞察客户的心声,以最短时间、以最好的服务满足客户的需求;同时客户要求更友好、方便、快捷的使用我们所提供的服务。为此,需要通过不断提升信息支撑服务,改进客户服务体系来提高客户服务质量和效率,然而在互联网发展的时代,传统的呼叫中心客服系统需要大量的人力和物力。国网信通部于2015年下达了关于开展信息系统运行管理水平提升活动,提出了切实提升运行管理水平的要求,信息系统需按照“两级调度、三层检修、一体化运行、统一的客户服务和信息技术三线支持中心”模式,开展信息运维工作,由此积累了大量的运维工单数据。随着大众对电力生产可靠性要求的不断提高,国网公司对供电服务质量也有较高的要求标准。如何不断提高电力信息运维人员的业务素质,在生产中如何快速、准确的处理信息系统运维问题,在日常生产中如何快速查找定位缺陷防范于未然,是电力生产技术和管理者的诉求。面向电力行业构建公共知识模型存在很多的技术难点,如运维知识的分析较弱,数据资源价值体现整体停留在粗放型阶段,没有将数据资源有效转化为知识资产,以及没有形成知识良性循环、对业务需求的支撑能力和对管理变革的推动能力较弱等问题,这些都阻碍了电力运维知识模型的组织与构建。尤其是公司的一单两票系统存在大量的可利用数据,可被有效挖掘和利用,为构建运检修知识模型提供基础数据及理论依据。
技术实现思路
针对现有技术存在的问题和空白,本专利技术采用以下技术方案:一种电力信息运维知识模型构建方法,其特征在于,包括以下步骤:步骤1:对电力系统工单数据进行工单采集,并转换为文本格式,采用七步法进行本体构建,根据文本含义属性划分为多个文本域;步骤2:以工单为单位,对工单文本数据进行分词处理;步骤3:对文本域进行分组;步骤4:对各文本域分别进行域分词处理,采用基于字符串匹配的分词方法分别对各分组的内容进行词汇切分;步骤5:根据无效词汇表进行无效词汇过滤,过滤掉无效词汇和敏感词汇;步骤6:将有效词汇与知识库中词汇表进行比对,将新词汇加入到知识库的词汇列表,对己有词汇进行累加其出现的频次;步骤7:抽取加入词汇的实体关系:通过预先定义实体关系类型及基于实体的特征,抽取实体关系,并根据实体关系的相似度进行分类;步骤8:将实体与实体关系的分类导入图数据库;步骤9:在图数据库中采用TensorFlow构建LSTM结构的知识模型。优选地,步骤2和步骤4中,分词采用中科院的ICTCLAS系统;将分词后的所有词组成字符表D,D={d1,d2,...,dn},其中di表示一个词,i∈[1,n]。将每个词E的词特征向量表示为V={v1,v2,...,vn},其中vi代表该词是否对应字符表D中的di,vi的计算方式如下:优选地,步骤2和步骤4中,分词还包括词性特征的构建:词性特征的构建与词特征的构建方式一致。优选地,步骤7中,采用word2vec对词特征向量进行处理,计算词向量之间的相似度,并根据相似度进行实体关系的分类。优选地,对电力系统工单数据采用Python的urllib2包对非结构化文本数据的内容进行采集;采用BeautifulSoup包对采集的内容进行解析;采用R环境下的Rwordseg包进行分词。优选地,所述图数据库为:Neo4j图数据库。优选地,在步骤9中,所述LSTM结构为BLSTM结构。本专利技术与现有技术相比,将深度学习算法引入到电力领域知识模型的构建中,釆用命名实体识别和实体关系抽取这两大机器学习的任务来解决知识单元抽取和知识单元关系抽取这两个难题。除此以外,本专利技术还将图形数据库纳入到构建知识模型的体系中来,采用图形数据库对知识单元进行存储及展示,为知识模型的绘制提供了一种新的方法。本专利技术提高了电力数据的有效利用,发挥数据隐藏的价值,提高电网的智能化应用水平,基于知识模型的知识表示,将改变过去低维度、相互孤立的信息展现方式,更加直观呈现电力知识之间的关联性。构建电力信息运维系统知识库,将历史运维数据转化为知识,支持用户在线自主咨询和解决问题,实现智能问答,提高运维效率,在电网运维工作中将发挥重要价值,并在此基础上完成电力信息运维领域知识模型优化存储技术。利用本专利技术构建的知识模型,可以解决人工重复回答、人员不足等问题,能快速准确洞悉运维工单申请人的意图,并自主答案为用户解答,大幅提升运维的工作效率。附图说明下面结合附图和具体实施方式对本专利技术进一步详细的说明:图1是本专利技术实施例方法主要流程示意图;图2是基于深度学习算法的知识模型构建流程示意图;图3是本专利技术实施例在Neo4j图数据库实现及应用示意图;图4是本专利技术实施例中七步法流程示意图;图5是本专利技术实施例word2vec使用的两种流程的示意图;图6是本专利技术实施例CBOW模型示意图;图7是本专利技术实施例Skip-gram模型示意图;图8是本专利技术实施例LSTM的拓扑结构示意图;图9是本专利技术实施例BLSTM的拓扑结构示意图。具体实施方式为让本专利的特征和优点能更明显易懂,下文特举实施例,作详细说明如下:如图1所示,本实施方法包括以下步骤:包括以下步骤:步骤1:对电力系统工单数据进行工单采集,并转换为文本格式,采用七步法进行本体构建,根据文本含义属性划分为多个文本域;步骤2:以工单为单位,对工单文本数据进行分词处理;步骤3:对文本域进行分组;步骤4:对各文本域分别进行域分词处理,采用基于字符串匹配的分词方法分别对各分组的内容进行词汇切分;步骤5:根据无效词汇表进行无效词汇过滤,过滤掉无效词汇和敏感词汇;步骤6:将有效词汇与知识库中词汇表进行比对,将新词汇加入到知识库的词汇列表,对己有词汇进行累加其出现的频次;步骤7:抽取加入词汇的实体关系:通过预先定义实体关系类型及基于实体的特征,抽取实体关系,并根据实体关系的相似度进行分类;步骤8:将实体与实体关系的分类导入图数据库;步骤9:在图数据库中采用TensorFlow构建LSTM结构的知识模型。图2是常规的基于深度学习算法的知识模型构建流程示意图,本实施例相对于该流程的主要创新点在于:提出了新的分词策略,并解决了实体抽取当中特征选择的问题。步骤2和步骤4中,分词采用中科院的ICTCLAS系统;将分词后的所有词组成字符表D,D={d1,d2,...,dn},其中di表示一个词,i∈[1,n]。将每个词E的词特征向量表示为V={v1,v2,...,vn},其中vi代表该词是否对应字符表D中的di,vi的计算方式如下:步骤2和步骤4中,分词还包括词性特征的构建:词性特征的构建与词特征的构建方式一致。步骤7中,采用word2vec对词特征向量进行处理,计算词向量之间的相似度,并根据相似度进行实体关系的分类。采用这种方法构建模式集合减少了大量的人工参与,特征的提取更加简单有效。对电力系统工单数据采用Python的urllib2包对非结构化文本数据的内容进行采本文档来自技高网
...

【技术保护点】
1.一种电力信息运维知识模型构建方法,其特征在于,包括以下步骤:步骤1:对电力系统工单数据进行工单采集,并转换为文本格式,采用七步法进行本体构建,根据文本含义属性划分为多个文本域;步骤2:以工单为单位,对工单文本数据进行分词处理;步骤3:对文本域进行分组;步骤4:对各文本域分别进行域分词处理,采用基于字符串匹配的分词方法分别对各分组的内容进行词汇切分;步骤5:根据无效词汇表进行无效词汇过滤,过滤掉无效词汇和敏感词汇;步骤6:将有效词汇与知识库中词汇表进行比对,将新词汇加入到知识库的词汇列表,对己有词汇进行累加其出现的频次;步骤7:抽取加入词汇的实体关系:通过预先定义实体关系类型及基于实体的特征,抽取实体关系,并根据实体关系的相似度进行分类;步骤8:将实体与实体关系的分类导入图数据库;步骤9:在图数据库中采用TensorFlow构建LSTM结构的知识模型。

【技术特征摘要】
1.一种电力信息运维知识模型构建方法,其特征在于,包括以下步骤:步骤1:对电力系统工单数据进行工单采集,并转换为文本格式,采用七步法进行本体构建,根据文本含义属性划分为多个文本域;步骤2:以工单为单位,对工单文本数据进行分词处理;步骤3:对文本域进行分组;步骤4:对各文本域分别进行域分词处理,采用基于字符串匹配的分词方法分别对各分组的内容进行词汇切分;步骤5:根据无效词汇表进行无效词汇过滤,过滤掉无效词汇和敏感词汇;步骤6:将有效词汇与知识库中词汇表进行比对,将新词汇加入到知识库的词汇列表,对己有词汇进行累加其出现的频次;步骤7:抽取加入词汇的实体关系:通过预先定义实体关系类型及基于实体的特征,抽取实体关系,并根据实体关系的相似度进行分类;步骤8:将实体与实体关系的分类导入图数据库;步骤9:在图数据库中采用TensorFlow构建LSTM结构的知识模型。2.根据权利要求1所述的电力信息运维知识模型构建方法,其特征在于:步骤2和步骤4中,分词采用中科院的ICTCLAS系统;将分词后的所有词组成字符表D,D={d1,d2,...,dn}...

【专利技术属性】
技术研发人员:吴飞罗富财李霆陈倩吴树霖林伟刘心魏煜范金玉
申请(专利权)人:国网福建省电力有限公司福建亿榕信息技术有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1