实体关系联合抽取方法、系统、设备及存储介质技术方案

技术编号:31705078 阅读:17 留言:0更新日期:2022-01-01 11:07
本发明专利技术公开了一种实体关系联合抽取方法、系统、设备及存储介质,包括:使用多标签标记综合能源资源信息传输中的实体;将综合能源资源信息传输中的实体的词向量与位置向量进行拼接,得拼接后的向量;将拼接后的向量输入到编码层中;利用编码层的Bi

【技术实现步骤摘要】
实体关系联合抽取方法、系统、设备及存储介质


[0001]本专利技术属于电力调度领域,涉及一种实体关系联合抽取方法、系统、设备及存储介质。

技术介绍

[0002]随着物联网、大数据、移动互联网等信息技术的飞速发展,综合能源系统实现了能源信息物理系统的深度融合,以及网络信息流与能源流的有效结合。然而,随着能源系统的自动化程度日益提高,网络规模和量测、决策单元数量都大大增加,越来越多的外部信息直接或间接影响着能源系统的控制决策,能源网络与信息网络的交互机理日益复杂。同时,随着分布式电源、储能、电动汽车、负荷聚合平台等新型能源及用能设备大量接入,负荷侧设备的更加多元化,用户不再仅仅是末端用电负荷,可以通过负荷侧管理实现与调度机构互动,在信息传输中,需要抽取非结构化数据中的关键信息,以实现信息的准确提取,然后现有技术中并没有给出类似的公开。

技术实现思路

[0003]本专利技术的目的在于克服上述现有技术的缺点,提供了一种实体关系联合抽取方法、系统、设备及存储介质,该方法、系统、设备及存储介质能够对非结构化数据中的关键信息进行提取。
[0004]为达到上述目的,本专利技术采用如下技术方案:
[0005]本专利技术一方面,本专利技术提供了一种实体关系联合抽取方法包括:
[0006]将综合能源资源信息传输中的实体的词向量与位置向量进行拼接,得拼接后的向量;
[0007]利用编码层的Bi

LSTM及注意力机制联合学习拼接后的向量中的信息,对学习得到的拼接后向量中的信息进行解码,得拼接后的向量中各单词的标签,从拼接后的向量中各单词的标签中选择具有关系的头尾实体,建立选择得到的具有关系的头尾实体之间的关系,完成实体关系联合抽取。
[0008]本专利技术所述联邦降采样方法进一步的改进在于:
[0009]利用解码层的条件随机场算法进行解码。
[0010]所述将综合能源资源信息传输中的实体的词向量与位置向量进行拼接之前还包括:使用多标签标记综合能源资源信息传输中的实体。
[0011]所述实体包括可调度负荷基本信息及可调度负荷所属设备信息。
[0012]所述可调度负荷基本信息包括以下至少一种信息:最大负荷容量、设备总数、所属运营商、可调度负荷类型、负荷控制类型及额定负荷量。
[0013]所述可调度负荷所属设备信息包括以下至少一种信息:设备ID、设备名称、设备类型、额定功率、所述可调度负荷及所属运营商。
[0014]通过注意力机制选择具有关系的头尾实体。
[0015]本专利技术二方面,本专利技术提供了一种实体关系联合抽取系统,包括:
[0016]拼接模块,用于将综合能源资源信息传输中的实体的词向量与位置向量进行拼接,得拼接后的向量;
[0017]抽取模块,用于利用编码层的Bi

LSTM及注意力机制联合学习拼接后的向量中的信息,对学习得到的拼接后向量中的信息进行解码,得拼接后的向量中各单词的标签,从拼接后的向量中各单词的标签中选择具有关系的头尾实体,建立选择得到的具有关系的头尾实体之间的关系,完成实体关系联合抽取。
[0018]本专利技术三方面,本专利技术提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述实体关系联合抽取方法的步骤。
[0019]本专利技术四方面,本专利技术提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述实体关系联合抽取方法的步骤。
[0020]本专利技术具有以下有益效果:
[0021]本专利技术所述的实体关系联合抽取方法、系统、设备及存储介质在具体操作时,基于Bi

LSTM和注意力机制技术进行实体关系的提取,具体的,将信息传输中的实体的词向量与位置向量进行拼接,得拼接后的向量,再利用Bi

LSTM和注意力机制联合学习拼接后的向量中的信息,以抽取非结构化数据中的关键信息,操作方便、简单。
[0022]进一步,利用解码层的条件随机场算法进行解码,解码的准确性较高,且操作简单。
附图说明
[0023]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0024]图1为本专利技术的原理图;
[0025]图2为本专利技术的方法流程图;
[0026]图3为本专利技术的系统结构示意图。
[0027]其中,1为标记模块、2为拼接模块、3为输入模块、4为抽取模块。
具体实施方式
[0028]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0029]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆
盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0030]下面结合附图对本专利技术做进一步详细描述:
[0031]公知的,条件随机场(conditional random fields,简称CRF,或CRFs),是一种判别式概率模型,是随机场的一种,常用于标注或分析序列资料,如自然语言文字或是生物序列。条件随机场是条件概率分布模型P(Y|X),表示的是给定一组输入随机变量X的条件下另一组输出随机变量Y的马尔可夫随机场,也就是说CRF的特点是假设输出随机变量构成马尔可夫随机场。条件随机场可被看作是最大熵马尔可夫模型在标注问题上的推广。
[0032]如同马尔可夫随机场,条件随机场为具有无向的图模型,在条件随机场中,随机变量Y的分布为条件机率,给定的观察值则为随机变量X。原则上,条件随机场的图模型布局是可以任意给定的,一般常用的布局是链结式的架构,链结式架构不论在训练(training)、推论(inference)、或是解码(decoding)上,都存在效率较高的算法可供演算。条件随机场是一个典型的判别式模型,其联合概率可以写成若干势函数联乘的形式,其中,最常用的是线性链条件随机场。
[0033]参考图1,本专利技术涉及模型的框架包括编码层、注意层、解码层及输出层,输入句子为:Tim Pawlenty of本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种实体关系联合抽取方法,其特征在于,包括:将综合能源资源信息传输中的实体的词向量与位置向量进行拼接,得拼接后的向量;利用编码层的Bi

LSTM及注意力机制联合学习拼接后的向量中的信息,对学习得到的拼接后向量中的信息进行解码,得拼接后的向量中各单词的标签,从拼接后的向量中各单词的标签中选择具有关系的头尾实体,建立选择得到的具有关系的头尾实体之间的关系,完成实体关系联合抽取。2.根据权利要求1所述的实体关系联合抽取方法,其特征在于,利用解码层的条件随机场算法进行解码。3.根据权利要求1所述的实体关系联合抽取方法,其特征在于,所述将综合能源资源信息传输中的实体的词向量与位置向量进行拼接之前还包括:使用多标签标记综合能源资源信息传输中的实体。4.根据权利要求1所述的实体关系联合抽取方法,其特征在于,所述实体包括可调度负荷基本信息及可调度负荷所属设备信息。5.根据权利要求4所述的实体关系联合抽取方法,其特征在于,所述可调度负荷基本信息包括以下至少一种信息:最大负荷容量、设备总数、所属运营商、可调度负荷类型、负荷控制类型及额定负荷量。6.根据权利要求4所述的实体关系联合抽取方法,其特征在于...

【专利技术属性】
技术研发人员:朱克东黄天恩王勇徐立中汤必强谷炜耿建李亚平刘建涛李跃华毛文博杨冠军周竞杨兴超郭晓蕊于韶源
申请(专利权)人:中国电力科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1