一种基于事件的神经影像学文献挖掘主题学习管道方法技术

技术编号:27499330 阅读:27 留言:0更新日期:2021-03-02 18:22
本发明专利技术公开了一种基于事件的神经影像学文献挖掘主题学习管道方法,该方法通过分析神经影像研究的过程和神经影像文献的信息可用性,确定了三种类型的神经影像研究主题事件。设计一个基于事件的主题学习任务,以获得丰富的语义神经影像研究主题,以提高主题的可解释性和准确性。并通过将深度学习和领域知识与概率主题模型融合,提出了一种新的主题学习方法,以实现针对全文神经影像文献的基于事件的主题学习。最后针对主题学习的两个核心指标,主题一致性和KL差异被选为评估参数。根据实际数据完成了一组实验,以将所提出的方法与四种主要主题学习方法进行比较。实验结果表明,神经影像Event

【技术实现步骤摘要】
一种基于事件的神经影像学文献挖掘主题学习管道方法


[0001]本专利技术属于计算机科学计算领域,涉及一种基于事件的神经影像学文献挖掘主题学习管道方法。
技术背景
[0002]神经影像文本挖掘是从神经影像文本中提取知识,受到了广泛的关注,主题学习是神经成像文本挖掘的重要研究重点。然而,当前的神经影像主题学习研究主要使用传统的概率主题模型从文献中提取主题,无法获得高质量的神经影像主题。现有的主题学习方法不能满足针对全文神经影像文献的主题学习要求。因此,本专利技术提出一种基于事件的神经影像学文献挖掘主题学习管道方法。

技术实现思路

[0003]本专利技术要解决的技术问题是,提供一种基于事件的神经影像学文献挖掘主题学习管道方法。该方法首先通过分析神经影像研究的过程和神经影像文献的信息可用性,确定了三种类型的神经影像研究主题事件,然后通过将深度学习和领域知识与概率主题模型融合,提出了一种新的主题学习方法,以实现针对全文神经影像文献的基于事件的主题学习。
[0004]为解决上述问题,本专利技术采用如下的技术方案:
[0005]一种基于事件的神经影像学文献挖掘主题学习管道方法包括以下步骤:
[0006]步骤1、数据预处理。
[0007]对从PLoS One网站上爬取到的论文数据进行停用词处理。
[0008]步骤2、预定义事件的表达。
[0009]通过分析神经影像研究的过程和结果以及神经影像文献中的相关信息可用性,确定了一组神经影像研究事件。
[0010]步骤3、训练LSTM-CNN模型。
[0011]首先通过Embedding Layer将单词转化为词向量,再输入LSTM进行语义特征提取,最后将LSTM的输出作为CNN的输入,进行进一步的特征提取。
[0012]步骤4、训练PCNN模型。
[0013]通过向量表示,卷积,最大池化,分类四个部分获得关系的向量表示。
[0014]步骤5、构建neuroimaging Event-BTM主题学习管道。
[0015]输入功能神经影像文献数据,获取该文献的主题表示结果。
[0016]步骤6、评价模型。
[0017]使用模型评价指标评价模型性能。
附图说明
[0018]图1为neuroimaging Event-BTM主题学习管道框架结构图;
[0019]图2为Event-BTM主题学习模型;
具体实施方式
[0020]下面结合附图对本专利技术做进一步说明:
[0021]如图1所示,本专利技术方法主要包括以下步骤:
[0022]步骤1、数据预处理
[0023]对从PLoS One网站上爬取到的文献数据进行停用词处理。
[0024]步骤2、预定义事件的表达
[0025]通过分析神经影像研究的过程和结果以及神经影像文献中的相关信息可用性,确定了一组神经影像研究事件,并将这些事件分为三个主题事件“认知反应”,“实验”和“分析”,分别用于描述神经影像研究的结果,实验过程和分析过程。每个主题事件都包含几个用于事件提取任务设计的元事件。具体公式为:
[0026]Event
deduce-reSults
=[trigger,<argument1,role1>?,<argument2,role2>?]=[{evoke,indicate,reveal...},<{EXPERIMENT TASK,COGNITIVE FUNCTION,MEDICAL PROBLEM},research object>+,<{FEATURES OF PHYSIOLOGY ANDPSYCHOLOGY},biologicalmechanism>+][0027]式中,Event
deduce-results
是推理事件,trigger表示触发词,argument1和argument2分别指第一个论元和第二个论元,role1和role12分别表示第一个论元和第二个论元的角色。
[0028]步骤3、训练LSTM-CNN模型
[0029]事件识别包括触发词识别,论元识别和触发词类型识别。使用BiLSTM-CNN为事件识别建模文本特征。
[0030]步骤3.1、将文本数据进行向量化。
[0031]v
word
=[v
w
,v
c
,v
t
,v
char
][0032]其中v
word
是句子中word
i
的组合向量,v
w
,v
c
,v
t
,v
char
分别是单词向量,大小写向量,术语词典以及字符向量。
[0033]步骤3.2、进行事件元素识别,基于BiLSTM的特征建模过程描述如下:
[0034][0035][0036]其中,v
word
是句子中word
i
的组合向量,f
i
是单词表示,h
i
是LSTM隐藏层的输出,基于BiLSTM的输出,log-softmax函数用于获取每种触发词或论元的对数概率。
[0037]步骤4、训练PCNN模型。
[0038]将BiLSTM-CNN模型的输出作为该模型的输入,具体过程为:
[0039]步骤4.1、特征向量。
[0040]V
lf
=[E
1t
,E
2t
,E
1tf
,E
1tb
,E
2tf
,E
2tb
,r][0041]其中,V
lf
是特征向量E
1t
是触发词的单词向量,E
2t
是论元的单词向量,E
1tf
是触发器的前一个单词的词向量,E
1tb
是触发器的后一个单词的词向量,E
2tf
是参数前一个单词的单词向量,E
2tb
是参数后一个单词的单词向量,r是事件角色类型的索引。
[0042]步骤4.2、单词表示。
[0043][0044]其中v
wp
是单词表示向量,其中v
wf
是当前单词的单词矢量,d
pft
是当前单词与触发器之间的距离矢量,d
pfa
是当前单词与自变量之间的距离矢量。
[0045]步骤4.3、CNN可以提取句子级别的全局特征来预测角色。
[0046]步骤5、构建neuroimaging Event-BTM主题学习管道。
[0047]步骤5.1、对BiLSTM-CNN模型的进行预训练,输入的句子首先经过em本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于,包括以下步骤:步骤1:数据预处理;对从PLoS One网站上爬取到的论文数据进行停用词处理;步骤2:预定义事件的表达;步骤3:训练LSTM-CNN模型;首先通过Embedding Layer将单词转化为词向量,再输入LSTM进行语义特征提取,最后将LSTM的输出作为CNN的输入,进行进一步的特征提取;步骤4:训练PCNN模型;通过向量表示,卷积,最大池化,分类四个部分获得关系的向量表示;步骤5:构建neuroimaging Event-BTM主题学习管道,输入功能神经影像文献数据,获取该文献的主题表示结果;步骤6:评价模型;使用模型评价指标评价模型性能。2.根据权利要求1所述的一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于:步骤1所述的数据预处理方法中的功能神经影像文献数据去除包含“the、a、an”在内的停用词。3.根据权利要求1所述的一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于:步骤2所述的预定义事件的表达,具体为:主题事件通过使用元事件来构造,元事件表示为“触发词+论元”的结构。4.根据权利要求1所述的一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于:步骤3所述的BiLSTM-CNN模型训练步骤包括:步骤一:文本向量化;v
word
=[v
w
,v
c
,v
t
,v
char
]其中,v
word
是句子中word
i
的组合向量,v
w
,v
c
,v
t
,v
char
分别是单词向量,大小写向量,术语词典以及字符向量;步骤二:事件元素识别,对于一个句子S=[word1,word2,...,word
n
],基于BiLSTM的特征建模过程描述如下:征建模过程描述如下:其中,v
word
是句子中word
i
的组合向量,f
i
是单词表示,word
i
是句子中的单词,v
word
是句子中word
i
的组合向量,h
i
是LSTM隐藏层的输出,基于BiLSTM的输出,log-softmax函数用于获取每种触发词或论元的对数概率。5.根据权利要求1所述的一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于:步骤4所述的训练PCNN模型,具体方法为:将BiLSTM-CNN模型的输出作为该模型的输入,该数学模型为:步骤一:特征向量;V
lf
=[E
1t
,E
2t
,E
1tf
,E
1tb
,E
2tf
,E
2tb
,r]其中,V
lf
是特征向量,E
1t...

【专利技术属性】
技术研发人员:闫健卓陈丽红陈建辉于涌川
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1