【技术实现步骤摘要】
基于背景知识的事件因果关系抽取方法、装置及存储介质
[0001]本专利技术涉及自然语言处理与深度学习
,尤其是涉及一种基于事件背景知识的司法案件事件因果关系抽取方法。
技术介绍
[0002]随着人工智能技术的快速发展,其被应用在越来越多的领域及场景之中,而智慧法律也成为了当前的一个热门研究课题。在一个司法案件文本中,往往包含大量的事件因果关系。通过抽取事件间的因果关系,不仅能够将复杂的法律文本利用事件间的因果关联进行简化,而且还能够协助相关人员根据事件间的因果关系对案件的关键信息作出判断,从而更好的理解案件的发展过程。
[0003]目前,对事件因果关系抽取的方法可以大致分为基于模式匹配的方法和基于机器学习的方法。基于模式匹配的方法通过对文本进行分析归纳,构造常见的句法模板对事件之间的因果关系进行抽取。虽然这类方法在面向特定领域的任务中取得了较好的效果,但是这类方法所构造出的句法模板无法覆盖所有可能的句法结构,并且难以推广至其他领域,适用性较低。虽然目前基于机器学习的方法取得了较为良好的效果,但是这些方法往往仅在 ...
【技术保护点】
【技术特征摘要】
1.一种基于背景知识的事件因果关系抽取方法,其特征在于,具体包括以下步骤:输入句子,对句子进行预处理,得到句子中表示事件的词语;对知识图谱中与事件相关联的邻居知识节点进行筛选,保留与事件因果关系抽取任务相关的邻居节点;基于相关邻居节点对事件的背景知识表示进行编码,构建事件的背景知识表示向量;将句子输入预训练语言模型,得到句子中词语的词向量表示,将词向量表示与背景知识表示向量进行融合;将融合后的语义信息增强向量输入下游神经网络模型,为句子中的每个词语分配相应的因果语义角色标签,实现事件因果关系的抽取。2.根据权利要求1所述的一种基于背景知识的事件因果关系抽取方法,其特征在于,所述对句子进行预处理,得到其中表示事件的词语,具体步骤包括:基于专家知识构建面向司法领域的停用词表;使用分词工具包对输入句子进行分词处理,得到分词后句子S的词语集合W;对句子中的词语进行词性分析,得到词性集合POS;结合构建的停用词表与词语的词性对词语集合W中的词语进行过滤,选择其中能够表示事件的词语集合E。3.根据权利要求1所述的一种基于背景知识的事件因果关系抽取方法,其特征在于,所述对知识图谱中与事件相关联的邻居知识节点进行筛选,保留与事件因果关系抽取任务相关的邻居节点的具体步骤包括:对于事件词语集合E={e1,e2,
…
,e
m
}中的事件e
i
,在知识图谱中检索与事件e
i
相关联的邻居节点;基于节点间的关系对邻居节点进行过滤,仅保留与事件节点之间具有事件因果关系抽取任务相关关系的邻居节点;按照知识图谱中节点间的关联强度保留与事件e
i
相关性最高的前n个邻居节点{N1,N2,N3,
…
N
n
}与其对应的关联权重{W1,W2,W3,
…
W
n
}。4.根据权利要求1所述的一种基于背景知识的事件因果关系抽取方法,其特征在于,所述基于相关邻居节点对事件的背景知识表示进行编码,构建事件的背景知识表示向量的具体步骤包括:对于事件e
i
的邻居节点N
j
,计算该节点在事件e
i
的背景知识表示中的权重占比α
j
;从知识图谱的词向量表中获取邻居节点N
j
对应的词向量表示v
j
;基于得到的权重占比α
j<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。