一种基于机器阅读理解模型的事件抽取方法技术

技术编号：37137057 阅读：22 留言：0更新日期：2023-04-06 21:37

本发明专利技术公开了一种基于机器阅读理解模型的事件抽取方法。该方法将事件抽取的两个子任务：事件检测和事件元素提取都建模成机器阅读理解任务，并采用多轮问答的方式来抽取出事件的完整信息。本发明专利技术通过使用BERT预训练模型来构建机器阅读理解框架。为了使模型能学习到句子中的实体信息，在输入句子中对句子中的实体进行显式地标记。此外还构建了历史会话信息编码模块，并采用注意力机制从历史会话中捕获重要信息以辅助当前轮次的问答。相比于现有方法，本发明专利技术方法能更好的利用先验知识来辅助进行事件抽取，在自动文摘、自动问答以及事理图谱构建等方面具有广阔应用前景。谱构建等方面具有广阔应用前景。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于机器阅读理解模型的事件抽取方法

[0001]本专利技术设计了一种基于机器阅读理解模型的事件抽取方法，属于自然语言处理

技术介绍

[0002]事件抽取是信息抽取一个重要研究方向，在自动文摘、自动问答以及信息检索等方面具有重要应用价值，同时也是构建事理图谱的关键技术。事件抽取是从给定的非结构化文本中抽取出事件结构化描述信息的过程，其通常分为事件检测和事件元素抽取两个子任务。其中，事件检测是指准确地检测出事件的触发词并分类到正确的事件类型。而事件元素提取是指准确地提取出事件的要素，并分配恰当的角色。
[0003]早期的工作中，事件抽取通常都被当作序列标注或者分类任务，其核心在于获得一个句子较好的语义特征表示。传统方法主要基于特征工程的方式获得句子的特征表示，依赖研究人员根据专业知识手工设计不同层次的特征。这类方法的性能受特征影响较严重，且手工设计的特征在不同场景中的迁移性较差。近年来，基于神经网络的方法被广泛应用于事件抽取。相比于基于特征工程的方法，神经网络方法采用逐层抽象表示学习的方式来获得句子的语义特...

【技术保护点】

【技术特征摘要】
1.一种基于机器阅读理解模型的事件抽取方法，其特征在于包括以下步骤：步骤一：首先根据问题模板构造触发词抽取问题；步骤二：对输入句子中的实体信息进行显式的标记；步骤三：将步骤一中的生成的问题和步骤二得到的句子进行拼接后送入到机器阅读理解模型后抽取出触发词；步骤四：针对步骤三中抽取的触发词，进一步根据问题模板构造事件类型抽取问题；步骤五：将所有的事件类型以标识符“[EVENT_TYPE]”进行拼接到步骤二中得到的句子后形成新的输入段落，然后进一步将其拼接到步骤四中生成的问题后输入到机器阅读理解模型后抽取出相应的事件类型；步骤六：根据触发词和事件的角色进一步构造事件角色元素抽取问题，然后将步骤二中得到的句子拼接到生成的问题后，输入到融合历史会话信息的阅读理解模型抽取出相应的事件角色元素；步骤七：重复步骤三继续抽取新的事件信息，直到句子中所有的事件抽取完成。2.根据权利要求1所述的基于机器阅读理解模型的事件抽取方法，其特征在于：在对输入句子中的实体信息进行显式标注时的标注过程如下：通过在实体词前后分别增加实体类型符后得到新的句子；例如针对句子“The Iraqi unit in possession of those guns fired mortars in the direction of the 7th Cavalry”，增加实体标记符后得到如下形式的句子“The<org>Iraqiunit</org>in possession of those<wea>guns</wea>fired<wea>mortars</wea>in the direction of the<org>7th Cavalry</org>.”，其中“<org>、<wea>”分别表示组织和武器。3.根据权利要求1所述的基于机器阅读理解模型的事件抽取方法，其特征在于：在构造事件角色抽取的问题时，一个问题由问题类型和问题内容两...

【专利技术属性】
技术研发人员：何小海，刘露平，周欣，卿粼波，魏鑫，吴小强，滕奇志，
申请(专利权)人：四川大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人