【技术实现步骤摘要】
一种基于事件的神经影像学文献挖掘主题学习管道方法
[0001]本专利技术属于计算机科学计算领域,涉及一种基于事件的神经影像学文献挖掘主题学习管道方法。
技术背景
[0002]神经影像文本挖掘是从神经影像文本中提取知识,受到了广泛的关注,主题学习是神经成像文本挖掘的重要研究重点。然而,当前的神经影像主题学习研究主要使用传统的概率主题模型从文献中提取主题,无法获得高质量的神经影像主题。现有的主题学习方法不能满足针对全文神经影像文献的主题学习要求。因此,本专利技术提出一种基于事件的神经影像学文献挖掘主题学习管道方法。
技术实现思路
[0003]本专利技术要解决的技术问题是,提供一种基于事件的神经影像学文献挖掘主题学习管道方法。该方法首先通过分析神经影像研究的过程和神经影像文献的信息可用性,确定了三种类型的神经影像研究主题事件,然后通过将深度学习和领域知识与概率主题模型融合,提出了一种新的主题学习方法,以实现针对全文神经影像文献的基于事件的主题学习。
[0004]为解决上述问题,本专利技术采用如下的技术方案:
[0005]一种基于事件的神经影像学文献挖掘主题学习管道方法包括以下步骤:
[0006]步骤1、数据预处理。
[0007]对从PLoS One网站上爬取到的论文数据进行停用词处理。
[0008]步骤2、预定义事件的表达。
[0009]通过分析神经影像研究的过程和结果以及神经影像文献中的相关信息可用性,确定了一组神经影像研究事件。
[0010]步骤3 ...
【技术保护点】
【技术特征摘要】
1.一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于,包括以下步骤:步骤1:数据预处理;对从PLoS One网站上爬取到的论文数据进行停用词处理;步骤2:预定义事件的表达;步骤3:训练LSTM-CNN模型;首先通过Embedding Layer将单词转化为词向量,再输入LSTM进行语义特征提取,最后将LSTM的输出作为CNN的输入,进行进一步的特征提取;步骤4:训练PCNN模型;通过向量表示,卷积,最大池化,分类四个部分获得关系的向量表示;步骤5:构建neuroimaging Event-BTM主题学习管道,输入功能神经影像文献数据,获取该文献的主题表示结果;步骤6:评价模型;使用模型评价指标评价模型性能。2.根据权利要求1所述的一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于:步骤1所述的数据预处理方法中的功能神经影像文献数据去除包含“the、a、an”在内的停用词。3.根据权利要求1所述的一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于:步骤2所述的预定义事件的表达,具体为:主题事件通过使用元事件来构造,元事件表示为“触发词+论元”的结构。4.根据权利要求1所述的一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于:步骤3所述的BiLSTM-CNN模型训练步骤包括:步骤一:文本向量化;v
word
=[v
w
,v
c
,v
t
,v
char
]其中,v
word
是句子中word
i
的组合向量,v
w
,v
c
,v
t
,v
char
分别是单词向量,大小写向量,术语词典以及字符向量;步骤二:事件元素识别,对于一个句子S=[word1,word2,...,word
n
],基于BiLSTM的特征建模过程描述如下:征建模过程描述如下:其中,v
word
是句子中word
i
的组合向量,f
i
是单词表示,word
i
是句子中的单词,v
word
是句子中word
i
的组合向量,h
i
是LSTM隐藏层的输出,基于BiLSTM的输出,log-softmax函数用于获取每种触发词或论元的对数概率。5.根据权利要求1所述的一种基于事件的神经影像学文献挖掘主题学习管道方法,其特征在于:步骤4所述的训练PCNN模型,具体方法为:将BiLSTM-CNN模型的输出作为该模型的输入,该数学模型为:步骤一:特征向量;V
lf
=[E
1t
,E
2t
,E
1tf
,E
1tb
,E
2tf
,E
2tb
,r]其中,V
lf
是特征向量,E
1t...
【专利技术属性】
技术研发人员:闫健卓,陈丽红,陈建辉,于涌川,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。