一种原型网络的少样本事件抽取系统及方法技术方案

技术编号：33733614 阅读：31 留言：0更新日期：2022-06-08 21:29

本发明专利技术公开了自然语言处理技术领域的一种原型网络的少样本事件抽取系统及方法，包括：获取包含测试数据的询问集；将询问集中的单个测试数据分别与标签候选项进行拼接后送到Bert编码器中，取相应的CLS表示作为单个测试数据的表示；读取所有类别的支持集，计算得到询问集中所有类别候选的模型原型；基于所有类别候选的原型，计算得到询问集中单个测试数据的目标类别。本发明专利技术在少样本事件抽取领域提供更好的准确度以及提供了少样本落地的实践方案。方案。方案。

全部详细技术资料下载

【技术实现步骤摘要】
一种原型网络的少样本事件抽取系统及方法

[0001]本专利技术涉及一种原型网络的少样本事件抽取系统及方法，属于自然语言处理

技术介绍

[0002]元学习(Meta learning)引入了一系列的概念，这其中包括N
‑
way K
‑
shot，Meta
‑
training、Meta
‑
testing、Base class和Novel class,Support set和Query set等。少样本事件分类就是在给定少量有标注数据的前提下能够对事件进行分类。为了能够实现这一目标，比较常见的方法是在有大量标注的数据集上进行训练，然后在目标类别的少量标注数据上进行微调(finetune)。这样少样本的学习过程就划分成两个阶段：元训练(metatrain)和元测试(metatest)，元训练就是在有大量标注的训练集中学习相关知识，元测试就是在目标类别的少量数据上进行微调。主流少样本学习一般划分成一个个N
‑
way K
‑
>shot的训练过程本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种原型网络的少样本事件抽取方法，其特征是，包括：获取包含测试数据的询问集；将询问集中的单个测试数据分别与标签候选项进行拼接后送到Bert编码器中，取相应的CLS表示作为单个测试数据的表示；读取所有类别的支持集，计算得到询问集中所有类别候选的模型原型；基于所有类别候选的原型，计算得到询问集中单个测试数据的目标类别。2.根据权利要求1所述的原型网络的少样本事件抽取方法，其特征是，读取所有类别的支持集，计算得到询问集中所有类别候选的模型原型，包括：将支持集中的训练数据与标签的模板拼接送到Bert编码器中，取相应的CLS表示作为单个训练数据的表示；将各训练数据的表示按照类别取平均作为该类的模型原型；将同一个训练数据过两遍Bert编码器得到的相似正样本与其他样本构成对比学习的训练样本来计算对比损失；根据询问集中的测试数据计算margin损失；将所述对比损失和margin损失加权求和，作为最后的损失函数来更新所述模型原型。3.根据权利要求1所述的原型网络的少样本事件抽取方法，其特征是，基于所有类别候选的原型，计算得到询问集中单个测试数据的目标类别，包括：比较询问集中单个测试数据和各个原型之间的距离，取距离最小的类别原型作为目标类别。4.根据权利要求1所述的原型网络的少样本事件抽取方法，其特征是，基于所有类别候选的原型，计算得到询问集中单个测试数据的目标类别，包括：将所有类别原型划分成N
‑
way的组合，重复多次计算询问集中单个测试数据与这些组合间类别原型的距离后，根据距离大小对组合中的类别原型进行投票，选择票数最多的类别原型作为目标类别。5.根据权利要求2所述的原型网络的少样本事件抽取方法，其特征是，所述对比损失的函数表达式为：其中，li为对比损失函数，τ为控制相似距离度量的温度超参数，h
j
'为与目标训练样本不相似的负样本编码向量，sim()为...

【专利技术属性】
技术研发人员：纪焘，邱震宇，朱冰，朱德伟，周一航，张森辉，孔维璟，纪文迪，吴苑斌，王晓玲，
申请(专利权)人：华东师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人