图神经网络事件检测模型的鲁棒性分析方法技术

技术编号：35552166 阅读：13 留言：0更新日期：2022-11-12 15:32

本发明专利技术公开了图神经网络事件检测模型的鲁棒性分析方法，包括：通过通用文本变换和亚种群变换将原始文本数据转换为对抗数据，将词向量化为并输入Bi

全部详细技术资料下载

【技术实现步骤摘要】
图神经网络事件检测模型的鲁棒性分析方法

[0001]本专利技术属于图神经网络
，尤其涉及图神经网络事件检测模型的鲁棒性分析方法。

技术介绍

[0002]事件检测（ED）是自然语言处理（NLP）领域的一个重要任务，其旨在从给定的文本中识别能代表事件的触发词并将它们分类为正确的事件类型。如图1所示，一个ED模型旨在将S1中的“被破坏”识别为“攻击”的触发词，将S2中的“被解雇”识别为“失去工作”的触发词。ED促进了事件关系抽取，并且对现实世界的应用有益，如自动文本摘要、信息检索和问答。
[0003]传统的ED模型主要基于机器学习方法，但它们的性能严重依赖于人工选择的特征。随着近年深度学习理论与技术的发展，越来越多的研究者采用深度学习方法来完成ED任务。最近，更多的研究集中于如何将文本序列转化为图结构数据，以融入更丰富的语义信息，进而将图神经网络（GNN）引入ED任务。目前最先进的事件检测模型都是基于GNN的。
[0004]上述模型大多基于一个默认且完美的数据集假设，即标签质量高、噪音少且分布均衡。并期望从这样的数据集中学到的模式是可以推广到其他数据集的。然而，不满足这一完备性的真实数据集会导致模型包含与训练数据相同的偏差。大多数关于ED的研究主要关注模型的构建，并根据高质量数据集上的指标如Precision、Recall和F1分数来评估模型的性能，这会导致对模型能力的有过高的评价。
[0005]在NLP领域中，模型的鲁棒性显然是必不可少的指标。现实世界中的应用接收的输入通常不是高质量的，因此...

【技术保护点】

【技术特征摘要】
1.图神经网络事件检测模型的鲁棒性分析方法，其特征在于，包括以下步骤：获取原始文本数据；通过通用文本变换和亚种群变换，将原始文本数据转换为对抗数据，将对抗数据作为输入序列，其中为第i个token的向量，n为序列中token的数量；将向量化为，其中和分别表示的词嵌入向量和实体类型嵌入向量，d
w
、d
e
分别是所述词嵌入向量和实体类型嵌入向量的维度；将输入隐藏层维度为d
l /2的Bi
‑
LSTM网络中，分别为的正向隐层状态和反向隐层状态，用来表示每个token的；同时对输入序列进行句法依存分析，即将单词作为节点，依存关系作为边，得到句法依存图；将句法依存图中的边嵌入向量空间，得到一个边表示张量；将每个节点的表示变换到d
g
维后，作为EE
‑
GCN神经网络中第1层的输入状态，层中每个节点的向量通过边表示张量聚合邻居节点更新，L为EE
‑
GCN神经网络的层数；将各个节点的最终表示输入全连接网络，使用Softmax函数计算所有事件类型的概率分布，将概率最大的事件标签作为分类结果并输出，使用有偏损失函数来增强事件标签对训练过程的影响。2.根据权利要求1所述的图神经网络事件检测模型的鲁棒性分析方法，其特征在于，层中每个节点的向量通过边表示张量聚合邻居节点更新，层l的输出状态如下：层l的输出状态如下：分别是第l层中各个通道的节点表示，p是通道数；具体而言，聚合是在边表示张量中逐通道进行的，如下所示：其中，Pool表示平均池化操作，用于压缩所有通道的信息，是一个可学习的参数，是ReLU激活函数。3.根据权利要求2所述的图神经网络事件检测模型的鲁棒性分析方法，其特征在于，层中各边的向量更新如下所示：其中，是一个可学习的参数，表示连接操作，是第l层中第i
个节点的表示，是第l层中第j个节点的表示，n是节点数量。4.根据权利要求1所述的图神经网络事件检测模型的鲁棒性分析方法，其特征在于，所述使用Softmax函数计算所有事件类型的概率分布的公式如下：其中，为各个节点的最终表示，将最...

【专利技术属性】
技术研发人员：王懋，韦晖，刘丽华，吴继冰，肖开明，朱汉卿，杨皓宇，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人