一种事件分析方法、装置、存储介质及电子设备制造方法及图纸

技术编号:30516103 阅读:59 留言:0更新日期:2021-10-27 22:58
本申请提供了一种事件分析方法、装置、存储介质及电子设备,事件分析方法包括:获取文本数据;将文本数据输入至预先训练好的事件分析模型中,得到文本数据中的每个事件以及每两个事件之间的关系类型。本申请利用预先训练好的事件分析模型对文本数据进行分析处理之后,便能够得到文本数据中的每个事件以及每两个事件之间的关系类型,无需再多其他的模型或计算,相较于现有技术中的两个独立模型,训练过程以及应用的过程均较为便捷,无需人为过多的操作,进而提高了事件分析效率。进而提高了事件分析效率。进而提高了事件分析效率。

【技术实现步骤摘要】
一种事件分析方法、装置、存储介质及电子设备


[0001]本申请涉及时间抽取
,特别涉及一种事件分析方法、装置、存储介质及电子设备。

技术介绍

[0002]事件抽取是信息抽取技术中的一个子领域,具体地,可以从海量文本数据中抽取事件,事件与事件之间可能存在着因果关系、时序关系等多种类型的关系。举例,在航空领域,航空故障事件通常是由论元和触发词构成的结构体,例如,文本数据为「密封剂渗入了电线压接区,导致电线短路,随后飞机起火。」中的事件是「密封剂渗入了电线压接区」,「电线短路」和「飞机起火」,通常论元是一个与航空相关的名词或名词词组,例如航空器元件、机组人员等;触发词通常是一个动词,例如短路、起火等。
[0003]现有技术中,事件抽取通常可以视为序列标注或机器阅读理解任务,可以通过双向长短记忆神经网络、指针神经网络等模型完成;而,事件关系确定是一个分类任务,对两个事件的文本进行特征提取,训练支持向量机模型、神经网络等分类模型完成。也就是说,现有技术中需要两个独立的模型来分别完成,但对于两个独立的模型来说,训练过程以及应用的过程均较为繁琐,需要人为操作较多,并且,事件分析效率较低。

技术实现思路

[0004]有鉴于此,本申请实施例提出了一种事件分析方法、装置、存储介质及电子设备,用以解决现有技术中选训练过程以及应用的过程均较为繁琐,需要人为操作较多,以及事件分析效率较低的问题。
[0005]第一方面,本申请实施例提供了一种事件分析方法,包括:
[0006]获取文本数据;
[0007]将所述文本数据输入至预先训练好的事件分析模型中,得到所述文本数据中的每个事件以及每两个所述事件之间的关系类型。
[0008]在一种可能的实施方式中,所述将所述文本数据输入至预先训练好的事件分析模型中,得到所述文本数据中的每个事件,包括:
[0009]利用所述事件分析模型将所述文本数据中的每个所述单元进行向量化,得到每个所述单元对应的特征向量;
[0010]对每个所述特征向量进行标注,得到标签为预定值的目标向量;
[0011]基于所述目标向量确定所述文本数据中的每个事件。
[0012]在一种可能的实施方式中,所述将所述文本数据输入至预先训练好的事件分析模型中,得到每两个所述事件之间的关系类型,包括:
[0013]提取所述第一事件中的第一目标向量以及提取所述第二事件中的第二目标向量;
[0014]计算所述第一目标向量与所述第二目标向量之间的关联值;
[0015]基于所述关联值确定所述第一事件与所述第二事件之间的关系类型。
[0016]在一种可能的实施方式中,所述第一事件中包含n个第一目标向量,所述第二事件中包含m个第二目标向量;
[0017]所述计算所述第一目标向量与所述第二目标向量之间的关联值,包括:
[0018]针对每类预设关系,利用该预设关系对应的特定值,分别对每个所述第一目标向量与每个所述第二目标向量进行计算,得到n
·
m个关联值。
[0019]在一种可能的实施方式中,利用如下公式计算所述第一目标向量与所述第二目标向量之间的关联值;
[0020]s
α
(i,j)=(W
q,α
x
i
+b
q,α
)
T
·
(W
k,α
x
j
+b
k,α
)
[0021]s
α
(i,j)表示关联值,W
q,α
表示预设关系为α时第一降维值,x
i
表示第一目标向量,b
q,α
表示预设关系为α时第一常数,W
k,α
表示预设关系为α时第二降维值,x
j
表示第二目标向量,b
k,α
表示预设关系为α时第二常数。
[0022]在一种可能的实施方式中,所述基于所述关联值确定所述第一事件与所述第二事件之间的关系类型,包括:
[0023]针对每类预设关系,统计大于第一预设阈值的所述关联值的个数;
[0024]计算所述个数与n
·
m之间的比值;
[0025]在所述比值大于第二预设阈值的情况下,确定所述第一事件与所述第二事件之间存在该类预设关系。
[0026]在一种可能的实施方式中,训练所述事件分析模型的步骤包括:
[0027]将文本数据样本中的单元样本向量化,得到所述单元样本对应的特征向量样本;其中,每个所述特征向量样本均设置有标签样本;
[0028]将所述特征向量样本、理论事件和理论关系输入至待训练的事件分析模型中,得到每个特征向量样本对应的实际标签;
[0029]基于所述实际标签确定实际事件;
[0030]计算每两个所述特征向量样本之间的关联值样本,并基于所述关联值样本确定两个所述实际事件之间的实际关系;
[0031]基于所述理论事件、所述理论关系、所述实际事件以及所述实际关系,利用损失函数调整所述待训练的事件分析模型。
[0032]第二方面,本申请实施例还提供了一种事件分析装置,包括:
[0033]获取模块,其配置地获取文本数据;
[0034]计算模块,其配置地将所述文本数据输入至预先训练好的事件分析模型中,得到所述文本数据中的每个事件以及每两个所述事件之间的关系类型。
[0035]第三方面,本申请还提供了一种存储介质,其中,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如下步骤:
[0036]获取文本数据;
[0037]将所述文本数据输入至预先训练好的事件分析模型中,得到所述文本数据中的每个事件以及每两个所述事件之间的关系类型。
[0038]第四方面,本申请还提供了一种电子设备,其中,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如下步骤:
[0039]获取文本数据;
[0040]将所述文本数据输入至预先训练好的事件分析模型中,得到所述文本数据中的每个事件以及每两个所述事件之间的关系类型。
[0041]本申请实施例利用预先训练好的事件分析模型对文本数据进行分析处理之后,便能够得到文本数据中的每个事件以及每两个事件之间的关系类型,无需再多其他的模型或计算,相较于现有技术中的两个独立模型,训练过程以及应用的过程均较为便捷,无需人为过多的操作,进而提高了事件分析效率。
附图说明
[0042]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种事件分析方法,其特征在于,包括:获取文本数据;将所述文本数据输入至预先训练好的事件分析模型中,得到所述文本数据中的每个事件以及每两个所述事件之间的关系类型。2.根据权利要求1所述的事件分析方法,其特征在于,所述将所述文本数据输入至预先训练好的事件分析模型中,得到所述文本数据中的每个事件,包括:利用所述事件分析模型将所述文本数据中的每个所述单元进行向量化,得到每个所述单元对应的特征向量;对每个所述特征向量进行标注,得到标签为预定值的目标向量;基于所述目标向量确定所述文本数据中的每个事件。3.根据权利要求2所述的事件分析方法,其特征在于,所述将所述文本数据输入至预先训练好的事件分析模型中,得到每两个所述事件之间的关系类型,包括:提取所述第一事件中的第一目标向量以及提取所述第二事件中的第二目标向量;计算所述第一目标向量与所述第二目标向量之间的关联值;基于所述关联值确定所述第一事件与所述第二事件之间的关系类型。4.根据权利要求3所述的事件分析方法,其特征在于,所述第一事件中包含n个第一目标向量,所述第二事件中包含m个第二目标向量;所述计算所述第一目标向量与所述第二目标向量之间的关联值,包括:针对每类预设关系,利用该预设关系对应的特定值,分别对每个所述第一目标向量与每个所述第二目标向量进行计算,得到n
·
m个关联值。5.根据权利要求4所述的事件分析方法,其特征在于,利用如下公式计算所述第一目标向量与所述第二目标向量之间的关联值;s
α
(i,j)=(W
q,α
x
i
+b
q,α
)
T
·
(W
k,α
x
j
+b
k,α
)s
α
(i,j)表示关联值,W
q,α
表示预设关系为α时第一降维值,x
i
表示第一目标向量,b
q,α
表示预设关系为α时第一常数,W
k,α

【专利技术属性】
技术研发人员:李嘉琛付骁弈
申请(专利权)人:上海明略人工智能集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1