基于提示学习和生成模型的篇章级事件抽取方法及装置制造方法及图纸

技术编号:46095843 阅读:8 留言:0更新日期:2025-08-12 18:15
本发明专利技术实施例公开了一种基于提示学习和生成模型的篇章级事件抽取方法及装置,该方法包括:基于提示学习和生成模型的篇章级事件抽取方法通过对待抽取篇章级文本进行序列化,获取包括至少一个事件集合的序列化文本;将所述序列化文本与预设的事件提示模板进行匹配,获取事件序列;应用预训练的事件生成模型对所述事件序列进行处理,获取事件抽取结果。通过上述方式,本发明专利技术实施例能够准确进行事件抽取,缓解了因为实体重叠和论元散射而导致的性能下降问题,适用于小样本场景。

【技术实现步骤摘要】

本专利技术实施例涉及自然语言处理,具体涉及一种基于提示学习和生成模型的篇章级事件抽取方法及装置


技术介绍

1、事件抽取任务是自然语言处理的中信息抽取任务的三大子任务之一,旨在将非结构化文本转化为结构化文本。它在商业、军事等领域的情报工作中应用广泛,是知识图谱构建的关键技术。事件抽取任务通常分为句子级事件抽取任务和篇章级事件抽取任务,篇章级事件抽取是从一个段落中将事件的主要组成元素抽取出来,从而转化为结构化文本,因为篇章级事件抽取往往面临同一段文本多个事件,事件论元分布在不同句子中的问题,篇章级事件抽取任务比句子级事件抽取任务更有难度。但是目前互联网、工业生产、金融等领域大量的文本信息中,一个事件往往需要多个句子来进行描述,必须通过篇章级的事件抽取来解决。因此,篇章级别的文本事件抽取是一项有意义有挑战的工作。

2、“预训练+提示学习”这种范式在自然语言处理任务的各个领域取得了非常好的效果,但是将这种范式应用于篇章级事件抽取任务时,仍然存在一些困难。第一,如何基于文本生成模型对抽取后的事件列表进行建模以及设计提示模版。第二,怎样选取合适的微调方法本文档来自技高网...

【技术保护点】

1.一种基于提示学习和生成模型的篇章级事件抽取方法,其特征是,所述篇章级事件抽取方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对待抽取篇章级文本进行序列化,获取包括至少一个事件集合的序列化文本,包括:

3.根据权利要求2所述的方法,其特征在于,所述将所述序列化文本与预设的事件提示模板进行匹配,获取事件序列,包括:

4.根据权利要求3所述的方法,其特征在于,所述应用预训练的事件生成模型对所述事件序列进行处理,获取事件抽取结果之前,包括:

5.根据权利要求4所述的方法,其特征在于,所述在所述事件生成模型的训练过程是基于低秩分解进行模...

【技术特征摘要】

1.一种基于提示学习和生成模型的篇章级事件抽取方法,其特征是,所述篇章级事件抽取方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对待抽取篇章级文本进行序列化,获取包括至少一个事件集合的序列化文本,包括:

3.根据权利要求2所述的方法,其特征在于,所述将所述序列化文本与预设的事件提示模板进行匹配,获取事件序列,包括:

4.根据权利要求3所述的方法,其特征在于,所述应用预训练的事件生成模型对所述事件序列进行处理,获取事件抽取结果之前,包括:

5.根据权利要求4所述的方法,其特征在于,所述在所述事件生成模型的训练过程是基于低秩分解进行模型微调,获取预训练的事件生成模型,包括:

6.根据权利要求5所述的方...

【专利技术属性】
技术研发人员:朱晓敏丁光帅马力叶燕清杨鹏飞王全东
申请(专利权)人:中国人民解放军军事科学院战略评估咨询中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1