一种基于对话状态追踪技术的事件抽取方法技术

技术编号：29835669 阅读：11 留言：0更新日期：2021-08-27 14:25

本发明专利技术通过人工智能领域的方法，实现了一种基于对话状态追踪技术的事件抽取方法。方法整体由事件分类、序列问题生成模型和论元抽取模型三部分组成；事件分类检测输入文本是否是事件，如果文本不包含事件，则输出NULL，否则分类文本所属的事件类型；序列问题生成模型根据事件类型和已经预测的置信度高的论元结果自动生成问题；论元抽取模型将所述序列问题生成模型生成的问题和输入文本作为输入来预测论元位置，然后采用标签对齐机制将预测的论元中置信度高的论元加入训练集中。这一方法通过三部分模型，能对所有参数的预测结果和高置信度结果进行反馈；提取两个任务之间的共同信息和模式，并利用所学习到的语法和语义知识标记；并充分利用论元之间的相关性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于对话状态追踪技术的事件抽取方法
本专利技术涉及人工智能领域，尤其涉及一种基于对话状态追踪技术的事件抽取方法。
技术介绍
事件提取是从文本中检测特定类型事件的发生，并提取与事件关联的参数(例如，事件参与者或其他属性)。它是支持许多自然语言处理任务的基本技术，如知识推理、文本摘要和事件预测。在现实世界中，标记大量数据是一项很高的成本。因此，研究如何从少量的标记数据和大量未标记的数据中检测事件并提取其参数是十分必要的。以前的研究是孤立地研究每个论点，没有利用论点之间的相关性。事件提取需要提取与每个事件对应的所有论元及其角色。这样做是具有挑战性的，因为一个事件往往与多个论点相关联，而这些论点在不同的语境中扮演着不同的角色。事件提取任务是复杂和多任务的。它需要识别事件的类型，查找事件触发器和事件参数，并对每个事件参数的角色进行分类。事件提取需要解决参数的重叠和分散问题，这就要求模型准确地学习文本的语义关系和单词的多语义表示。基于多回合对话框的序列事件提取通过构造问题依次识别参数。现有的事件抽取系统通常采用监督学习范式，必须依赖于标记训练数据，但是高质量训练数据的缺乏是一个常见的问题。通过将领域知识整合到问题集中，可以引导抽取框架专注于要从句子中抽取的基本语义。现有的方法没有利用多个论元之间的关系，留下了很大的改进空间。
技术实现思路
为此，本专利技术首先提出一种基于对话状态追踪技术的事件抽取方法，由事件分类、序列问题生成模型和论元抽取模型三部分组成；所述事件分类检测输入文本是否是事件，如果文...

【技术保护点】
1.一种基于对话状态追踪技术的事件抽取方法，其特征在于：由事件检测、序列问题生成模型和论元抽取模型三部分组成；所述事件检测输入文本是否是事件，并分类文本所属的事件类型；所述序列问题生成模型根据事件类型和已经预测的置信度高的论元结果自动生成问题；所述论元抽取模型将所述序列问题生成模型生成的问题和输入文本作为输入来预测论元位置，然后采用标签对齐机制将预测的论元中置信度高的论元加入训练集中，最终输出每个文本中的所有事件类型和事件类型对应的论元；/n具体地，所述事件检测中的所述检测过程为：包含事件的文本被分别传入一个图神经网络模型和一个BERT模型中，分别学习文本的结构化知识和上下文知识，之后将所述图神经网络模型模型和所述BERT模型输出的字表征拼接，得到每个字的新的表征，再加入一个自注意力机制，学习字的新的上下文表征，最后模型输出当前文本是否包含事件和所属事件类型；构造事件类别数量预测任务提高事件检测性能，通过计算事件分类和事件类别数预测两个任务的联合损失，来差别考虑当前预测错误所属类型；/n所述预测论元位置的方法为：根据事件分类的结果，确定事件类型所包含的论元角色，对于每个论元角色，利用所...

【技术特征摘要】
1.一种基于对话状态追踪技术的事件抽取方法，其特征在于：由事件检测、序列问题生成模型和论元抽取模型三部分组成；所述事件检测输入文本是否是事件，并分类文本所属的事件类型；所述序列问题生成模型根据事件类型和已经预测的置信度高的论元结果自动生成问题；所述论元抽取模型将所述序列问题生成模型生成的问题和输入文本作为输入来预测论元位置，然后采用标签对齐机制将预测的论元中置信度高的论元加入训练集中，最终输出每个文本中的所有事件类型和事件类型对应的论元；
具体地，所述事件检测中的所述检测过程为：包含事件的文本被分别传入一个图神经网络模型和一个BERT模型中，分别学习文本的结构化知识和上下文知识，之后将所述图神经网络模型模型和所述BERT模型输出的字表征拼接，得到每个字的新的表征，再加入一个自注意力机制，学习字的新的上下文表征，最后模型输出当前文本是否包含事件和所属事件类型；构造事件类别数量预测任务提高事件检测性能，通过计算事件分类和事件类别数预测两个任务的联合损失，来差别考虑当前预测错误所属类型；
所述预测论元位置的方法为：根据事件分类的结果，确定事件类型所包含的论元角色，对于每个论元角色，利用所述序列问题生成模块生成问题集，设计一个机器阅读理解模型，每次输入一个问题和对应的文本，之后将问题输入到一个BERT模型中，文本分别输入到一个图注意力模型来学习文本的结构化表征和BERT模型来学习文本的上下文表征，然后将两个模型的结果拼接在一起后经过一个自注意力机制，最后经过FCN层预测论元的开始和结束位置。

2.如权利要求1所述的一种基于对话状态追踪技术的事件抽取方法，其特征在于：所述图神经网络模型具体为：将每个文本构成一个图，每个字被为图中的一个节点，使用词汇知识连接字符并提出一个全局中继节点，以捕获局部组成和潜在的单词边界，节点间的连边包括四种：第一种连边是词内关系连边，即一个词内的字之间依次顺序相连，直到连接到最后一个字；第二种连边方式是词语之间构建一条连边，具体连接方式是前一个词的第一个字和后一...

【专利技术属性】
技术研发人员：李建欣，李倩，宁元星，骆功旭，李熙，毛乾任，黄洪仁，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人