一种事件抽取方法、装置及电子设备制造方法及图纸

技术编号：38728970 阅读：13 留言：0更新日期：2023-09-08 23:19

本申请提供一种事件抽取方法、装置及电子设备，该方法包括：使用神经网络模型获取事件提示向量，事件提示向量包括多组令牌嵌入向量，每组令牌嵌入向量表征一个事件类别；获取待处理文本，并根据事件提示向量对待处理文本进行事件分类，获得事件类别；从待处理文本中提取出全部实体元素；根据事件提示向量从全部实体元素中识别出事件类别对应的实体元素；对事件类别对应的实体元素进行元素角色识别，获得实体元素的角色类别。通过使用神经网络模型获取事件提示向量，并根据事件提示向量对待处理文本进行事件抽取，有效地使用事件提示向量实现了触发词的作用，从而提高了进行事件抽取的正确率。的正确率。的正确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种事件抽取方法、装置及电子设备

[0001]本申请涉及自然语言处理、提示学习和事件抽取的
，具体而言，涉及一种事件抽取方法、装置及电子设备。

技术介绍

[0002]事件抽取(Event Extraction，EE)是自然语言处理(Natural Language Processing，NLP)领域中一种经典的信息抽取(Information Extraction，IE)任务，主要是指从含有事件信息的文本数据中抽取出感兴趣的事件信息，并且将用自然语言表达事件以结构化的形式呈现，比如事件发生的时间、地点、参与角色以及与之相关的动作或者状态的改变等等。
[0003]目前，从文本内容中抽取出事件信息大都是采用基于触发词的事件抽取方法，这些触发词例如：新品发布、并购或者上市发布等等。然而，在具体的实践过程中发现，有些特殊场景根本没有触发词，例如在警情笔录场景中的文本数据是以对话形式存在的，对话形式的数据具有模糊化和口语化表述的特点，难以从对话形式的数据中识别出清楚的触发词。因此，对没有触发词的特殊场景中的数据进行事件抽取的正确率较低。

技术实现思路

[0004]本申请实施例的目的在于提供一种事件抽取方法、装置及电子设备，用于改善进行事件抽取的正确率较低的问题。
[0005]本申请实施例提供了一种事件抽取方法，包括：使用神经网络模型获取事件提示向量，事件提示向量包括多组令牌嵌入向量，每组令牌嵌入向量表征一个事件类别，每组令牌嵌入向量包括多个令牌嵌入向量；获取待处理文本，并根据事件提示向量对...

【技术保护点】

【技术特征摘要】
1.一种事件抽取方法，其特征在于，包括：使用神经网络模型获取事件提示向量，所述事件提示向量包括多组令牌嵌入向量，每组令牌嵌入向量表征一个事件类别，所述每组令牌嵌入向量包括多个令牌嵌入向量；获取待处理文本，并根据所述事件提示向量对所述待处理文本进行事件分类，获得事件类别；从所述待处理文本中提取出全部实体元素；根据所述事件提示向量从所述全部实体元素中识别出所述事件类别对应的实体元素；对所述事件类别对应的实体元素进行元素角色识别，获得所述实体元素的角色类别，所述实体元素的角色类别用于生成事件记录表。2.根据权利要求1所述的方法，其特征在于，所述使用神经网络模型获取事件提示向量，包括：获取预先构造的类别标签描述语句、类别标签解释定义语句、元素角色名称和事件关键词语；将所述类别标签描述语句、所述类别标签解释定义语句、所述元素角色名称和所述事件关键词语输入所述神经网络模型，获得所述神经网络模型输出的句子表示向量；根据所述句子表示向量中的多个令牌嵌入向量确定所述事件提示向量。3.根据权利要求2所述的方法，其特征在于，所述根据所述句子表示向量中的多个令牌嵌入向量确定所述事件提示向量，包括：从所述句子表示向量中的多个令牌嵌入向量筛选出类别令牌嵌入向量，并将所述类别令牌嵌入向量确定为所述事件提示向量；或者，对所述句子表示向量中的多个令牌嵌入向量进行最大池化处理，获得所述事件提示向量；或者，对所述句子表示向量中的多个令牌嵌入向量进行均值池化处理，获得所述事件提示向量；或者，对所述句子表示向量中的多个令牌嵌入向量进行最小池化处理，获得所述事件提示向量。4.根据权利要求1所述的方法，其特征在于，所述使用神经网络模型获取事件提示向量，包括：获取事件矩阵，所述事件矩阵是根据所述事件类别的总数量，以及每个所述事件类别的多个令牌嵌入向量构造的矩阵结构，并使用所述神经网络模型对所述矩阵结构进行学习获得的；针对每个所述事件类别，根据所述事件矩阵中的多个令牌嵌入向量确定所述事件提示向量。5.根据权利要求4所述的方法，其特征在于，所述事件矩阵包括：多个令牌嵌入向量；所述根据所述事件矩阵中的多个令牌嵌入向量确定所述事件提示向量，包括：对所述事件矩阵中的多个令牌嵌入向量进行最大池化处理，获得所述事件提示向量；或者，对所述事件矩阵中的多个令牌嵌入向量进行均值池化处理，获得所述事件提示向量；或者，对所述事件矩阵中的多个令牌嵌入向量进行最小池化处理，获得所述事件提示
向量。6.根据权利要求1所述的方法，其特征在于，所述根据所述事件提示向量对所述待处理文本进行事件分类，包括：获取所述待处理文本的文本表示向量，以及所述事件提示向量中的多组令牌嵌入向量的事件类别；针对所述多组令牌嵌入向量中的每组令牌嵌入向量，判断所述文本表示向量与该组令牌嵌入向量之间的相似度值是否大于预设阈值；若是，则将所述待处理文本的事件类别确定为该组令牌嵌入向量的事...

【专利技术属性】
技术研发人员：李健铨，穆晶晶，胡加明，
申请(专利权)人：鼎富智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人