一种危机博弈事件抽取方法、装置、存储介质及电子设备制造方法及图纸

技术编号:44597680 阅读:22 留言:0更新日期:2025-03-14 12:53
本申请的实施例提供了一种危机博弈事件抽取方法、装置、存储介质及电子设备,涉及事件抽取技术领域,所述方法包括:使用HeidelTime对长文本进行时间标注;采用非侵入式文本提示技术在经过时间标注后的长文本上生成时间提示,得到带有非侵入式时间提示的长文本;将带有非侵入式时间提示的长文本作为大语言模型的输入,进行危机博弈事件的抽取。本申请的技术方案,将长文本时间关联提取工具HeidelTime与大语言模型结合,对长文本中的长关联时间戳进行了非侵入式提示增强,显著提升了模型在事件时间字段上的识别准确率,在总体上提高事件识别率近20%。

【技术实现步骤摘要】

本申请涉及事件抽取,具体而言,涉及一种危机博弈事件抽取方法、装置、存储介质及电子设备


技术介绍

1、事件抽取旨在从纯自然语言文本中提取事件。现有的事件抽取技术在长文本中带有时间戳的事件抽取方面存在诸多困难和局限,具体包括以下几点:

2、第一,缺少训练数据。长文本的事件抽取需要大量带有时间戳的标注数据进行模型训练。然而,目前现有的事件提取模型通常是针对短文本进行训练的,长文本数据集、针对特定数据抽取结构的数据集匮乏导致模型在处理长文本时表现不佳。长文本中的事件通常更为复杂,涉及多种时间关系和上下文信息,而现有的数据集和训练方法难以覆盖所有可能的情况。即使有长文本的数据集,这些数据集通常也未经过严格的时间标注,导致模型难以有效学习和推广。

3、第二,训练需要使用大量资源,且在不同抽取结构/模板间迁移学习困难。长文本事件提取的模型训练需要大量计算资源和时间。这不仅包括基础模型的预训练,还包括针对特定任务的微调。在处理未经任何处理的书籍等长文本时,所需的数据量和计算资源更为庞大。此外,不同的事件抽取任务和模板可能有显著不同,导致模型在一种本文档来自技高网...

【技术保护点】

1.一种危机博弈事件抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述使用HeidelTime对长文本进行时间标注,包括:

3.根据权利要求2所述的方法,其特征在于,所述采用非侵入式文本提示技术在经过时间标注后的长文本上生成时间提示,得到带有非侵入式时间提示的长文本,包括:

4.根据权利要求1所述的方法,其特征在于,在将带有非侵入式时间提示的长文本作为大语言模型的输入之前,还包括:

5.根据权利要求1所述的方法,其特征在于,所述将带有非侵入式时间提示的长文本作为大语言模型的输入,进行危机博弈事件的抽取,包括:...

【技术特征摘要】

1.一种危机博弈事件抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述使用heideltime对长文本进行时间标注,包括:

3.根据权利要求2所述的方法,其特征在于,所述采用非侵入式文本提示技术在经过时间标注后的长文本上生成时间提示,得到带有非侵入式时间提示的长文本,包括:

4.根据权利要求1所述的方法,其特征在于,在将带有非侵入式时间提示的长文本作为大语言模型的输入之前,还包括...

【专利技术属性】
技术研发人员:刘万里张天翼刘鑫陈俞舟唐世平冯收刘禄波
申请(专利权)人:中国电子科技集团公司第十研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1