一种生物医学事件抽取中的递归神经网络多树融合方法技术

技术编号:46630653 阅读:0 留言:0更新日期:2025-10-14 21:29
本发明专利技术属于生物医学信息抽取技术领域,具体涉及一种生物医学事件抽取中的递归神经网络多树融合方法。通过把不同规则解析器的解析结果进行融合,提出了基于句法解析树的并集合并方法,针对合并结果进行子树后处理保证子树的结构精简以及语法合理性。针对合并之后的树结构存在冗余子树和节点,提出了异构体分支裁剪以及节点蒸馏方法。同时采用分支裁剪和节点蒸馏操作,子树结构进一步简化,对于绑定和调控复杂事件效果较好。

【技术实现步骤摘要】

本专利技术属于生物医学信息抽取,具体涉及一种生物医学事件抽取中的递归神经网络多树融合方法


技术介绍

1、生物医学事件抽取的研究内容主要包括触发词识别、事件论元抽取。其中,触发词是生物医学事件的核心,它通常是一个动词或名词短语,能够明确指示一个生物医学事件的发生。事件论元则是事件的参与者或属性,如蛋白质、基因等。事件类型则根据生物医学事件的不同特点进行分类,如简单事件、绑定事件和调控事件等。

2、递归神经网络中的节点按照连接顺序对输入信息进行递归处理,每个节点都执行相同的操作,即将其子节点的信息组合起来生成自己的表示。递归神经网络通过递归地组合子节点的信息来生成父节点的表示,从而实现对整个树状结构的编码。在训练过程中,递归神经网络通过前向传播算法计算每个节点的输出,并使用反向传播算法计算梯度,以更新网络参数,不同句法解析器内置算法原理不同,导致使用单一的句法分析树不能解析出所有依赖关系,例如,基于规则的方法可能无法处理某些不符合规则的句子结构,而基于统计或深度学习的方法则可能无法准确地识别出句子中的所有句法依赖关系,特别是对于生物医学事件抽取任本文档来自技高网...

【技术保护点】

1.一种生物医学事件抽取中的递归神经网络多树融合方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种生物医学事件抽取中的递归神经网络多树融合方法,其特征在于,所述创建一个新的多叉树,为合并后的树设置根节点,具体为:创建一个新的多叉树T,采用如下公式进行合并:

3.根据权利要求1所述的一种生物医学事件抽取中的递归神经网络多树融合方法,其特征在于,所述采用的并集合并方法,在任意两颗句法分析树A和B合并时,存在相同节点情况:

4.根据权利要求1所述的一种生物医学事件抽取中的递归神经网络多树融合方法,其特征在于,所述采用的并集合并方法,在任意两颗句法...

【技术特征摘要】

1.一种生物医学事件抽取中的递归神经网络多树融合方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种生物医学事件抽取中的递归神经网络多树融合方法,其特征在于,所述创建一个新的多叉树,为合并后的树设置根节点,具体为:创建一个新的多叉树t,采用如下公式进行合并:

3.根据权利要求1所述的一种生物医学事件抽取中的递归神经网络多树融合方法,其特征在于,所述采用的并集合并方法,在任意两颗句法分析树a和b合并时,存在相同节点情况:

4.根据权利要求1所述的一种生物医学事件抽取中的递归神经网络多树融合方法,其特征在于,所述采用的并集合并方法,在任意两颗句法分析树a和b合并时,存在节点仅存于一棵句法分析树中的情况:

5.根据权利要求1所述的一种生物医学事件抽取中的递归神经网络多树融合方法,其特征在于,对初步合并后的多叉树,自底向上遍历,对于重复的子节点,回溯到父节点,提取子节点与父节点构成的分支,进入分支匹配,若分支匹配成功,则进行分支裁剪,若匹配失败,则进行节点蒸馏。

6.根据权利要求5所述的一种生物医学事件抽取中的递归神经网络多树融合方法,其特征在于,所述分支裁剪,具体为:在子树合并后,若发现同一父节点下存在重复或可匹配的子节点分支,则回溯到父节点,提取该父节点与子节点构成的分支进行匹配,匹配成功时,直接删除深度值较高的子节点及其与父节点的连接,仅...

【专利技术属性】
技术研发人员:王磊
申请(专利权)人:陕西开放大学陕西工商职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1