电网数据管理方法及装置制造方法及图纸

技术编号:21952799 阅读:26 留言:0更新日期:2019-08-24 17:51
本申请提供一种电网数据管理方法及装置,本申请通过对待处理文本数据进行文本预处理,并对预处理后的待处理文本数据进行实体识别,而后基于预先构建的电网实体关系抽取模型对从预处理后的待处理文本数据中识别出的所有实体词进行电网实体关系抽取,从而基于识别出的所有实体词及抽取出的电网实体关系,构建出与待处理文本数据对应的电网数据模型,以通过该电网数据模型提高电网数据管理过程的数据管理质量及数据管理效率。其中,所述电网实体关系抽取模型基于电网语料文本数据以及与预设的电网实体关系种类对应的特征提取模型训练得到,本申请通过电网实体关系抽取模型降低了工作管理人员在数据统筹过程及价值挖掘过程中的人工参与度。

Data Management Method and Device for Power Grid

【技术实现步骤摘要】
电网数据管理方法及装置
本申请涉及信息化建设
,具体而言,涉及一种电网数据管理方法及装置。
技术介绍
随着科学技术的不断发展,各行业的信息化建设在逐步加快,各行业在数据管理业务及数据挖掘业务上有了更高的需求,其中尤以电力行业最为突出。目前,电力行业的信息化建设尚且处于初步阶段,在对电网系统产生的数据进行统筹管理及挖掘数据资源价值时需要工作管理人员对电网数据进行大量的人工操作,从而导致电网数据的数据管理质量及数据管理效率整体不高。
技术实现思路
为了克服现有技术中的上述不足,本申请的目的在于提供一种电网数据管理方法及装置,其能够基于预先构建出的用于抽取电网实体关系的电网实体关系抽取模型,在电网数据管理过程中对待处理文本数据进行电网实体关系抽取,以降低人工参与度,并提高针对电网数据的数据管理质量及数据管理效率。就方法而言,本申请实施例提供一种电网数据管理生成方法,所述方法包括:获取待处理文本数据,并对获取到的待处理文本数据进行文本预处理;对预处理后的待处理文本数据进行实体识别,并根据预先构建的电网实体关系抽取模型对识别出的所有实体词进行电网实体关系抽取,其中所述电网实体关系抽取模型基于电网语料文本数据以及与预设的电网实体关系种类对应的特征提取模型构建形成;根据识别出的所有实体词及抽取出的电网实体关系,构建出与所述待处理文本数据对应的电网数据模型。就装置而言,本申请实施例提供一种电网数据管理装置,所述装置包括:文本预处理模块,用于获取待处理文本数据,并对获取到的待处理文本数据进行文本预处理;电网关系抽取模块,用于对预处理后的待处理文本数据进行实体识别,并根据预先构建的电网实体关系抽取模型对识别出的所有实体词进行电网实体关系抽取,其中所述电网实体关系抽取模型基于电网语料文本数据以及与预设的电网实体关系种类对应的特征提取模型构建形成;数据模型构建模块,用于根据识别出的所有实体词及抽取出的电网实体关系,构建出与所述待处理文本数据对应的电网数据模型。相对于现有技术而言,本申请具有以下有益效果:本申请通过对待处理文本数据进行文本预处理,并对预处理后的待处理文本数据进行实体识别,而后基于预先构建的电网实体关系抽取模型对从所述预处理后的待处理文本数据中识别出的所有实体词进行电网实体关系抽取,从而基于识别出的所有实体词及抽取出的电网实体关系,构建出与所述待处理文本数据对应的电网数据模型,以通过该电网数据模型提高电网数据管理过程的数据管理质量及数据管理效率。其中,所述电网实体关系抽取模型是基于电网语料文本数据以及与预设的电网实体关系种类对应的特征提取模型训练得到的,本申请通过所述电网实体关系抽取模型降低了工作管理人员在数据统筹过程及价值挖掘过程中的人工参与度。为使本申请的上述目的、特征和优点能更明显易懂,下文特举本申请较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对本申请保护范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本申请实施例提供的数据管理设备的方框示意图;图2为本申请实施例提供的电网数据管理方法的流程示意图;图3为本申请实施例提供的构建电网关系抽取模型的流程示意图;图4为图3中的步骤S230包括的子步骤的流程示意图;图5为图3中的步骤S240包括的子步骤的流程示意图;图6为图3中的步骤S250包括的子步骤的流程示意图;图7为本申请实施例提供的电网数据管理装置的方框示意图之一;图8为本申请实施例提供的电网数据管理装置的方框示意图之二。图标:10-数据管理设备;11-存储器;12-处理器;13-通信单元;100-电网数据管理装置;160-文本预处理模块;170-电网关系抽取模块;180-数据模型构建模块;110-语料预处理模块;120-实体词识别模块;130-关系标注模块;140-语句向量化模块;150-抽取模型训练模块。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。请参照图1,图1是本申请实施例提供的数据管理设备10的方框示意图。在本申请实施例中,所述数据管理设备10可用于针对电网系统进行电网实体关系抽取模型训练,并通过训练好的电网实体关系抽取模型在电网数据管理过程中对待处理的电网文本数据进行实体关系抽取,从而降低电网数据管理过程中的人工参与度,提高数据管理质量及数据管理效率。其中,所述电网实体关系抽取模型用于抽取与电力行业相关的实体关系,所述数据管理设备10可以是,但不限于,服务器、个人电脑(personalcomputer,PC)、平板电脑、个人数字助理(personaldigitalassistant,PDA)、移动上网设备(mobileInternetdevice,MID)等。在本实施例中,所述数据管理设备10包括存储器11、处理器12、通信单元13及电网数据管理装置100。所述存储器11、处理器12及通信单元13各个元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,所述存储器11、处理器12及通信单元13这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。在本实施例中,所述存储器11可用于存储与电力行业相关的电网实体关系种类的相关信息,其中所述电网实体关系种类可以包括地域管理关系、配电管理关系、电网器件搭配关系等。所述存储器11还可用于存储卷积神经网络(ConvolutionalNeuralNetworks,CNN)模型及分类器模型,所述数据管理设备10通过所述卷积神经网络及所述分类器模型训练得到对应的电网实体关系抽取模型。所述存储器11还可用于存储程序,所述处理器12在接收到执行指令后,可相应地执行所述程序。在本实施例中,所述处理器12可以是一种具有信号的处理能力的集成电路芯片。所述处理器12可以是通用处理器,包括中央处理器(CentralProcessingUnit,CPU)及网络处理器(NetworkProcessor,NP)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。在本实施例中,所述通信单元13用于通过网络建立所述数据管理设备10与其他终端设备之间的通信连接,并本文档来自技高网...

【技术保护点】
1.一种电网数据管理方法,其特征在于,所述方法包括:获取待处理文本数据,并对获取到的待处理文本数据进行文本预处理;对预处理后的待处理文本数据进行实体识别,并根据预先构建的电网实体关系抽取模型对识别出的所有实体词进行电网实体关系抽取,其中所述电网实体关系抽取模型基于电网语料文本数据以及与预设的电网实体关系种类对应的特征提取模型构建形成;根据识别出的所有实体词及抽取出的电网实体关系,构建出与所述待处理文本数据对应的电网数据模型。

【技术特征摘要】
1.一种电网数据管理方法,其特征在于,所述方法包括:获取待处理文本数据,并对获取到的待处理文本数据进行文本预处理;对预处理后的待处理文本数据进行实体识别,并根据预先构建的电网实体关系抽取模型对识别出的所有实体词进行电网实体关系抽取,其中所述电网实体关系抽取模型基于电网语料文本数据以及与预设的电网实体关系种类对应的特征提取模型构建形成;根据识别出的所有实体词及抽取出的电网实体关系,构建出与所述待处理文本数据对应的电网数据模型。2.根据权利要求1所述的方法,其特征在于,所述电网实体关系抽取模型的构建过程,包括:获取电网语料文本数据,并对获取到的所述电网语料文本数据进行文本预处理;对预处理后的所述电网语料文本数据中的每条语句进行实体识别,确定出每条语句中的所有实体词,及每个实体词在对应语句中的位置信息;根据预设的电网实体关系种类对所述电网语料文本数据中的所有实体词进行关系标注,得到每条语句对应的关系标注结果;根据每条语句的关系标注结果及该语句中的每个实体词的位置信息,对该语句进行向量化处理,得到每条语句对应的语句向量矩阵;将所述电网语料文本数据中的每条语句对应的语句向量矩阵依次输入到与预设的所述电网实体关系种类对应的特征提取模型中进行训练,得到对应的电网实体关系抽取模型。3.根据权利要求2所述的方法,其特征在于,对获取到的所述电网语料文本数据进行文本预处理,包括:依次对所述电网语料文本数据进行去重处理、去噪处理、分句处理及分词处理,得到所述电网语料文本数据包括的所有语句,及每条语句包括的所有词语。4.根据权利要求2所述的方法,其特征在于,所述根据预设的电网实体关系种类在所述电网语料文本数据中的所有实体词进行关系标注,得到每条语句对应的关系标注结果,包括:针对所述电网语料文本数据中的每条语句,将该语句中的每个实体词与其他实体词依次按照每个电网实体关系种类进行关系匹配;若关系匹配成功,则将关系匹配成功的两个实体词按照对应的电网实体关系种类进行关系标注,并基于半监督学习算法将针对所述两个实体词的标注结果同步更新到所述电网语料文本数据中的其他语句处,以得到每条语句对应的关系标注结果。5.根据权利要求2所述的方法,其特征在于,所述根据每条语句的关系标注结果及该语句中每个实体词的位置信息,对该语句进行向量化处理,得到每条语句对应的语句向量矩阵,包括:针对所述电网语料文本数据中的每条语句,根据该语句的关系标注结果对该语句中的每个实体词进行词向量化处理,得到该语句中每个实体词对应的原始词向量;对该语句中每个实体词的位置信息进行向量化处理,得到该语句中每个实体词对应的位置向量;将该语句中每个实体词对应的原始词向量及位置向量进行拼接整合,得到该语句对应的语句向量矩阵。6.根据权利要求2-5中任意一项所述的方法,其特征在于,所述特征提取模型包括卷积神经网络模型及分类器模型,所述将所述电网语料文本数据中的每条语句对应的语句向量矩阵依次输入到与预设的所述电网实体关系种类对应的特征提取模型中进行训练,得到对应的电网实体关系抽取模型,包括:根据所述电网语料文本数据中各语句的排列顺序,依次将每条语句对应的语句向量矩阵输入到所述卷积神经网络模型中,并训练所述卷积神经网络模型通过卷积层得到与该语句向量矩阵对应的关系卷积向量;训练所述卷积神经网络模型通过池化层对该语句对应的关系卷积向量进行三段式划分,并提取出每段关系卷积向量中的最大池化...

【专利技术属性】
技术研发人员:华召云张淑娟王潇李周蔡翔陈清萍袁方王萍钱光超王鑫梅峰陈政波褚大可江樱张福华
申请(专利权)人:国家电网有限公司国网安徽省电力有限公司电力科学研究院国网浙江省电力有限公司信息通信分公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1