【技术实现步骤摘要】
本专利技术属于生物医学信息抽取,具体涉及一种递归神经网络进行生物医学事件抽取方法及系统。
技术介绍
1、生物医学事件抽取的研究内容主要包括触发词识别、事件论元抽取。其中,触发词是生物医学事件的核心,它通常是一个动词或名词短语,能够明确指示一个生物医学事件的发生。事件论元则是事件的参与者或属性,如蛋白质、基因等。事件类型则根据生物医学事件的不同特点进行分类,如简单事件、绑定事件和调控事件等。生物医学事件特别是复杂事件构造的树状结构包含丰富的边特征信息,现有研究采用的递归神经网络在聚合过程中忽略了边特征信息。句法分析树中每个节点代表句子中的一个成分,每条边都被标注了特定的关系类型,这些类型描述了节点之间的句法关系。除此之外,边还可以携带额外的特征信息,如时态、语态、语态标记等,这些信息有助于更精确地理解句子中的语法现象。
技术实现思路
1、本专利技术提供一种递归神经网络进行生物医学事件抽取方法及系统,以解决现有技术中存在的传统生物医学事件抽取忽略生物医学依赖关系的技术问题。
2、为
...【技术保护点】
1.一种递归神经网络进行生物医学事件抽取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种递归神经网络进行生物医学事件抽取方法,其特征在于,所述获得生物医学文本中每个词的低维稠密向量表示,具体为:通过SciBERT语言模型,捕捉生物学文本数据中每个词的语义信息,将生物学文本数据中的祠从离散的符号转换为连续的数值向量,进而获得每个词的低维稠密向量表示。
3.根据权利要求1所述的一种递归神经网络进行生物医学事件抽取方法,其特征在于,所述构建依赖结构树,具体为:采用stanford、malt和spaCy三种解析器,基于CoNLL’2007
...【技术特征摘要】
1.一种递归神经网络进行生物医学事件抽取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种递归神经网络进行生物医学事件抽取方法,其特征在于,所述获得生物医学文本中每个词的低维稠密向量表示,具体为:通过scibert语言模型,捕捉生物学文本数据中每个词的语义信息,将生物学文本数据中的祠从离散的符号转换为连续的数值向量,进而获得每个词的低维稠密向量表示。
3.根据权利要求1所述的一种递归神经网络进行生物医学事件抽取方法,其特征在于,所述构建依赖结构树,具体为:采用stanford、malt和spacy三种解析器,基于conll’2007/2008 dependencies、stanford dependencies、dependency trees of lexical heads和universal dependencies五种类型的解析格式,对每个词的低维稠密向量表示进行句法分析,生成句法解析结构的依赖结构树。
4.根据权利要求1所述的一种递归神经网络进行生物医学事件抽取方法,其特征在于,所述最终节点向量的输出具体为:依赖结构树中的每个节点,通过同构交互规则和同构交互路径进行多次迭代,逐步更新节点语义,将不同解析器生成的特征向量通过特征拼接或特征求和的方式进行融合,最终输出整合了词的语义信息、句法依赖关系以及上下文特征的节点向量。
5.根据权利要求4所述的一种递归神经网络进行生物医学事件抽取方法,其特征在于,所述同构交互规则存在6中交互规则,依赖结构树的节点和边通过所述6种交互规则进行信息交互,其具体为:若子节点向父节点传递信息,则通过交互规则5和交互规则6,将子节点合并到父节点中;若需要更新边信息,则通过交互规则1和交互规则...
【专利技术属性】
技术研发人员:王磊,
申请(专利权)人:陕西开放大学陕西工商职业学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。