一种基于可控模式生成的高效事件抽取方法技术

技术编号:41492743 阅读:27 留言:0更新日期:2024-05-30 14:38
本发明专利技术属于人工智能、自然语言处理领域,涉及一种基于可控模式生成的高效事件抽取方法,包括:获取待测文本序列,对待测文本序列进行实体抽取,得到事件实体集合、触发词集合以及位置向量序列;根据事件实体集合和触发词集合构建多个事件;事件包含实体与触发词之间的关系;将事件和位置向量序列输入训练好的事件模式生成模型,得到事件模式;对事件模式进行合并和过滤,得到事件结构;本发明专利技术基于候选提及实体利用生成模型学习事件模式的定义过程,进而自动的生成事件模式,避免对预定义的所有事件类型进行建模,提高生成效率;本发明专利技术设计一个解码约束算法来细粒度控制模式生成过程,防止得到不规范的结果,保证生成角色的数量与实体数量相对应。

【技术实现步骤摘要】

本专利技术属于人工智能、自然语言处理领域,涉及一种基于可控模式生成的高效事件抽取方法


技术介绍

1、事件抽取旨在以结构化的形式呈现文本中的事件信息,该任务包含了命名实体识别和关系抽取等重要的子任务,并已经积累了大量的研究和成果。它不仅是自然语言处理各项任务的构建基础,如信息检索、知识图谱等,更在工业界如政府部门、生物领域和金融领域等有着广泛的应用,因此近年来越来越受到人们的关注。

2、随着预训练语言模型的优异表现,大多数研究都采用基于表示的生成方法来进行事件抽取。例如将事件模式定制为用自然语言描述的问题,从而将事件抽取任务转化为回答问题,这种方法放大了嵌入在事件类型和角色中的语义信息,并更有效的利用了预训练语言模型中蕴含的丰富知识。然而,如何有效的构建问题模板以及针对不同事件类型如何提高回答的效率是潜在的问题。另外有研究使用提示学习的方法,将设计好的提示与文本一起作为输入进行编码,并在类似填空的过程中解码相应的事件序列,基于提示的方法通过自动学习的连续模板缓解了离散问题模板定义困难的问题,但同样存在输出效率方面的问题。此外还提出了序列到结构的本文档来自技高网...

【技术保护点】

1.一种基于可控模式生成的高效事件抽取方法,其特征在于,包括:

2.根据权利要求1所述的一种基于可控模式生成的高效事件抽取方法,其特征在于,对待测文本序列进行实体抽取包括:

3.根据权利要求1所述的一种基于可控模式生成的高效事件抽取方法,其特征在于,根据事件实体集合和触发词集合构建事件包括:将事件实体集合分别与触发词集合中的每一个触发词进行结合,得到多个事件。

4.根据权利要求1所述的一种基于可控模式生成的高效事件抽取方法,其特征在于,事件模式生成模型包括:输入模块、编码模块、前向加噪模块、反向去噪模块、自回归解码器以及输出模块;事件模式生成模型的训练...

【技术特征摘要】

1.一种基于可控模式生成的高效事件抽取方法,其特征在于,包括:

2.根据权利要求1所述的一种基于可控模式生成的高效事件抽取方法,其特征在于,对待测文本序列进行实体抽取包括:

3.根据权利要求1所述的一种基于可控模式生成的高效事件抽取方法,其特征在于,根据事件实体集合和触发词集合构建事件包括:将事件实体集合分别与触发词集合中的每一个触发词进行结合,得到多个事件。

4.根据权利要求1所述的一种基于可控模式生成的高效事件抽取方法,其特征在于,事件模式生成模型包括:输入模块、编码模块、前向加噪模块、反向去噪模块、自回归解码器以及输出模块;事件模式生成模型的训练过程包括:

5.根据权利要求4所述的一种基于可控模式生成的高效事件抽取方法,其特征在于,输入模块对事件进行处理包括:

6.根据权利...

【专利技术属性】
技术研发人员:常光辉张荣辉骆家辉
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1