一种基于图神经网络算法的金融篇章级多关联事件抽取方法技术

技术编号：25440294 阅读：24 留言：0更新日期：2020-08-28 22:28

本发明专利技术公开了一种基于图神经网络算法的金融篇章级多关联事件抽取方法，首先对输入的语句进行切分，并通过bert+crf抽取事件候选元素；其次，构建GCNN节点，获取所述事件候选元素的表征、元素位置编码、所在句表征、句位置编码后拼接成节点表征；然后，构建GCNN边；再其次，基于GCNN网络更新所述事件候选元素的表征，并通过linear层+multi‑sigmoid层后获取各个元素对应的事件类型和事件角色分类结果；最后，输出抽取的信息。本发明专利技术所应用的图卷积神经网络弥补了现有其他篇章级事件抽取方法中无法捕获的句间多事件元素相互关联的信息，采用bert+CRF的算法结构可以更精准、更全面的描述GCNN中节点向量及其所对应句向量。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图神经网络算法的金融篇章级多关联事件抽取方法
本专利技术涉及信息
，尤其是涉及一种基于图神经网络算法的金融篇章级多关联事件抽取方法。
技术介绍
事件抽取的主要研究方法有模式匹配和机器学习两大类。模式匹配在特定领域内能取得较高的性能，但移植性较差。在机器学习的抽取方法中，机器学习与领域无关，无需太多领域专家的指导，系统移植性较好。1、基于模式匹配的事件抽取模式匹配方法是在一些模式的指导下进行事件的识别和抽取。模式主要用于指明构成目标信息的上下文约束环，集中体现了领域知识和语言知识的融合。抽取时只要通过各种模式匹配算法找出符合模式约束条件的信息即可。由此可见，其核心是抽取模式的构建。典型的基于模式匹配的事件抽取系统有ExDisco，GenPAM等。起初，模式主要是通过手工方法来建立的。中国科学院的姜吉发在其博士论文中对模式的自动获取做了深入的研究，提出了一种基于领域无关概念知识库的事件抽取模式学习方法GenPAM，在模式的学习过程中，用户只需定义IE任务，无需提供种子模式及对语料分类和标注，系统就能自动从未经分类和标准的语料中学习出IE模式，大大降低了用户的劳动量和技能要求。总的来说，基于模式匹配的方法在特定领域内可以取得比较好的效果，但是系统的可移植性差，从一个领域移植到另一个领域时，需要重新构建模式。而模式的构建费时费力，需要领域专家的指导。虽然机器学习方法的引入可以从一定程度上加速模式的获取，但是不同模式之间造成的冲突也是一个棘手的问题。并且，现有研究的语义程度大多停留在句法层...

【技术保护点】
1.一种基于图神经网络算法的金融篇章级多关联事件抽取方法，其特征在于，包括以下步骤：/nS1：对输入的语句进行切分，并通过bert+crf抽取事件候选元素；/nS2：构建GCNN节点：获取所述事件候选元素的表征、元素位置编码、所在句表征、句位置编码后拼接成节点表征；/nS3：构建GCNN边；/nS4：基于GCNN网络更新所述事件候选元素的表征，并通过linear层+multi-sigmoid层后获取各个元素对应的事件类型和事件角色分类结果；/nS5：输出抽取的信息。/n

【技术特征摘要】
1.一种基于图神经网络算法的金融篇章级多关联事件抽取方法，其特征在于，包括以下步骤：
S1：对输入的语句进行切分，并通过bert+crf抽取事件候选元素；
S2：构建GCNN节点：获取所述事件候选元素的表征、元素位置编码、所在句表征、句位置编码后拼接成节点表征；
S3：构建GCNN边；
S4：基于GCNN网络更新所述事件候选元素的表征，并通过linear层+multi-sigmoid层后获取各个元素对应的事件类型和事件角色分类结果；
S5：输出抽取的信息。

2.根据权利要求1所述的基于图神经网络算法的金融篇章级多关联事件抽取方法，其特征在于，所述步骤S3构建GCNN边的具体方法如下：
(1)句向量通过linear层和sigmoid激活层后判断该句是否包含事件信息，若包含则作为构建图卷积网络边的候选句；
(2)连接候选句中存在共享的实体名，其中包括企业名和人名的共指名词或代词；
(3)对于存在共享的实体名，将其与出现于同句内的其他事件...

【专利技术属性】
技术研发人员：周露，
申请(专利权)人：北京合众鼎成科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人