一种面向农业气象灾害的零样本事件关系抽取方法技术

技术编号:43333533 阅读:82 留言:0更新日期:2024-11-15 20:30
本发明专利技术公开了一种面向农业气象灾害的零样本事件关系抽取方法,属于自然语言处理技术领域,包括如下步骤:步骤1、获取农业气象灾害句子,根据句子中事件的关系利用在线开放资源库获取关系对应的关系描述和同义词,构建数据集并进行预处理;步骤2、基于语义匹配和自注意力机制构建农业气象灾害零样本事件关系抽取模型;步骤3、利用数据集进行模型训练并测试,在多任务学习结构下训练模型,在测试阶段利用最近邻搜索算法对输入的新句子进行零样本关系预测。本发明专利技术能够实现对未定义或者未观察到的农业气象灾害事件之间的新关系进行预测。

【技术实现步骤摘要】

本专利技术属于自然语言处理,具体涉及一种面向农业气象灾害的零样本事件关系抽取方法


技术介绍

1、事件关系抽取是自然语言处理领域的一项重要任务,旨在推断给定句子中两个事件之间的语义关系。比如从句子“**等地连续降雪加之气温骤降,导致蔬菜大棚等设施垮塌损毁”中可以抽取事件“连续降雪加之气温骤降”和事件“蔬菜大棚等设施垮塌损毁”之间的关系是“导致”。正确抽取农业气象灾害事件之间的关系是构建农业气象灾害事理图谱的关键环节。现有方法通常将关系抽取任务定义为一个多分类问题,基于已有标签的数据中训练模型,需要依赖大量的人工标注数据,缺乏泛化能力,在对未见关系的抽取中应用受限。虽然最近的一些研究基于远程监督生成标记数据,然而当将关系抽取任务应用于实际场景时,现有的监督模型无法很好地识别那些在训练数据中极为罕见甚至从未涵盖的事件之间的关系。

2、为了避免对农业气象灾害相关的数据进行高昂的人工标注,研究者们开始探索零样本关系抽取方法,即模型可以对未定义或未观察到的新关系进行预测。现有的面向农业气象灾害事件关系的抽取的零样本方法有基于prompt模板的方法、基于文本文档来自技高网...

【技术保护点】

1.一种面向农业气象灾害的零样本事件关系抽取方法,其特征在于,包括如下步骤:

2.根据权利要求1所述面向农业气象灾害的零样本事件关系抽取方法,其特征在于,所述步骤1中,构建数据集并进行预处理的过程为:将具有同样关系的农业气象灾害句子放在同一个集合内,并且在输入句子中插入四个特殊标记[EH]、[\EH]、[ET]和[\ET],[EH]和[\EH]分别标记头部事件的开始和结束;[ET]和[\ET]分别标记尾部事件的开始和结束;对关系描述和同义词以整个序列的方式进行处理,若农业气象灾害事件间的关系没有对应的关系描述或没有同义词,则将关系描述和同义词的整个序列填充为“DEFAULT”...

【技术特征摘要】

1.一种面向农业气象灾害的零样本事件关系抽取方法,其特征在于,包括如下步骤:

2.根据权利要求1所述面向农业气象灾害的零样本事件关系抽取方法,其特征在于,所述步骤1中,构建数据集并进行预处理的过程为:将具有同样关系的农业气象灾害句子放在同一个集合内,并且在输入句子中插入四个特殊标记[eh]、[\eh]、[et]和[\et],[eh]和[\eh]分别标记头部事件的开始和结束;[et]和[\et]分别标记尾部事件的开始和结束;对关系描述和同义词以整个序列的方式进行处理,若农业气象灾害事件间的关系没有对应的关系描述或没有同义词,则将关系描述和同义词的整个序列填充为“default”。

...

【专利技术属性】
技术研发人员:赵华白雪洋曾庆田倪维健郭文艳程成许士霄张希文宋青华梁金国
申请(专利权)人:山东科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1