一种基于图神经网络联合鉴别的事件检测方法技术

技术编号:38742163 阅读:49 留言:0更新日期:2023-09-08 23:26
本发明专利技术公开了一种基于图神经网络联合鉴别的事件检测方法,包括如下步骤:步骤1:构造领接矩阵;步骤2:获取每个句子的向量表示和句子的掩码;步骤3:获取最终的句子编码表示;步骤4:获取句子中每个文本跨度在每个事件类别上的初始分数;步骤5:生成一个网格化的特征表示;步骤6:获取文本跨度最后的类别和触发词的事件类别;步骤7:使用一个句子长度的掩码来修改损失函数,使得损失函数只关注候选触发词上的损失。这种方法有效的模拟候选触发词之间的关系,以及抽取出候选触发词和其相邻片段之间的特征,还使用mask修改损失函数,有效缓解漏标触发词的影响,提高了法律场景下的事件检测精度。精度。精度。

【技术实现步骤摘要】
一种基于图神经网络联合鉴别的事件检测方法


[0001]本专利技术属于事件检测领域,具体是一种基于图神经网络联合鉴别的事件检测方法。

技术介绍

[0002]近年来,随着人工智能的快速发展,大量的法律任务被数字化。为了帮助律师和法律从业者及时发现、掌握和分析相关的法律事件和信息,法律事件检测也需要借助人工智能技术来提高识别的精度,法律事件检测旨在自动识别出法律案件中的事件候选触发词的事件类型,从而完成案件事实的快速重构,帮助机器和人类更好地理解法律案件。
[0003]目前,事件检测方法分为四大类:基于生成式的方法,基于分类的方法,基于图神经网络的方法和基于跨度的方法。基于生成式的方法可以生成多样的文本,有利于更全面地覆盖和理解事件的不同方面和情境。然而,基于生成式的方法很难生成规范的事件结构,并且容易生成混乱的内容,而且模型训练难度高。基于分类的方法通常可以在较短的时间内获得较高的准确率,从而提高了事件检测的效率和实用性,但是分类结果也可能存在误判和漏判等问题,漏标的数据对其影响大。基于图神经网络的方法能够很好地处理节点之间的关系信息,并将本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络联合鉴别的事件检测方法,其特征在于,包括如下步骤:步骤1、将案件数据集中的每个案件按句子进行切分,然后使用OmniEvent将每个句子中的与候选触发词相关的内容抽取出来,根据抽取出来的内容为每个句子构造一个邻接矩阵,将每个句子中的字视作一个节点,抽取出来的内容则为一条边;步骤2、使用tokenizer将每个句子的文本数据转换成向量型的输入,得到每个句子的向量表示和句子的掩码;步骤3、将句子的向量表示和句子的掩码输入到DeBERTa模型中去,对整个句子进行编码,得到最后一层的隐藏层状态以及句子最后pooling之后的CLS结果,然后将最后一层的隐藏层状态和句子pooling之后的CLS结果拼接在一起,形成最终的句子编码表示;其中S
hidden
是DeBERTa层的最后一层的隐藏状态,P是DeBERTa的最后一层隐藏层状态池化输出,H为编码器最后的编码表示;步骤4、将最终的编码表示输入到分数初始化模块中,进行分数的初始化以获得全局信息的分数,即将编码表示输入到两个不同的全连接层,得到query向量和key向量,然后通过RoPE位置编码,将query向量和key向量携带位置信息;将query向量和key向量携带位置信息;公式(2)(3)中,h
i
和h
j
分别代表句子中第i个位置和第j个位置的字隐藏状态,q
i
和k
i
为句子中第i个位置和第j个位置的字的query向量和key向量,W
q,t
,W
k,t
,b
q,t
,和b
k,t
是事件类型t的可训练参数,q

和k

是query向量和key向量旋转位置编码后的结果;然后将query向量和key向量做一个内积操作,得到句子中每个文本跨度在每个事件类别上的初始分数;其中S
t
(i,j)为句子中第i个字到第j个字在t类别上的初始分数,S则是n
t
个类别上的分数集合;步骤5、此外还需要获得有关触发词内容局部的得分情况,将公式(1)得到的句子编码表示输入到一个特征抽取模块中去,即先将编码器得到的句子编码表示和步骤1处理数据时构造的邻接矩阵输入到图神经网络中去,利用图神经网络来模拟候选触发词之间的信息交互;公式(5)中,表示图的邻接矩阵,W
(0)
和W
(1)
都是可学习的参数;然后将图神经网络的输出输入到Conditional Layer Normalization中去,使公式(5)
中图神经网络得到的特征表示生成一个网格化的特征表示,即以图神经网络的输出作为条件,计算出其归一化参数和偏置,以及每个元素的均值和标准差;以及每个元素的均值和标准差;V={V
i,j
...

【专利技术属性】
技术研发人员:龚述涛罗旭东
申请(专利权)人:广西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1