一种基于自动变分自编码器的脑效应连接网络学习方法技术

技术编号:32770554 阅读:14 留言:0更新日期:2022-03-23 19:25
一种基于自动变分自编码器的脑效应连接网络学习方法,属于深度学习算法领域。首先对模型进行参数初始化,然后利用自动变分自编码器的编码网络从各脑区的fMRI数据中学习潜变量,并通过解码网络从潜变量中获得生成的fMRI数据。最后,当生成的fMRI数据和真实的fMRI数据高度相似时,模型在迭代训练的过程中可以学习到一个最优的脑效应连接网络。本发明专利技术利用融合了比例

【技术实现步骤摘要】
一种基于自动变分自编码器的脑效应连接网络学习方法


[0001]本专利技术属于脑科学研究、神经网络深度学习理论与应用研究领域,具体来说,是涉及一种基于自动变分自编码器的脑效应连接网络学习方法。

技术介绍

[0002]人脑连接组研究试图从多层次建立刻画不同活体人脑功能、结构的脑网络组图谱,脑效应连接网络是一种由节点和有向边构成的图模型,其中节点通常被定义为脑区,有向边刻画了一个脑区施加于另一个脑区神经活动的因果效应。目前,利用计算方法从人脑功能磁共振成像(functional magnetic resonance imaging,fMRI)数据中进行脑效应连接网络的学习已成为该项研究中的一个前沿热点。
[0003]近年来,随着信息科学和神经科学的不断融合,许多传统的机器学习和数据挖掘方法被成功地用于脑效应连接网络的学习。然而,这些方法受到浅层模型及学习机理的制约,难以从fMRI数据中提取到深层特征,因此极大地限制了此类方法的发展。
[0004]伴随着深度学习的蓬勃发展及其在图像、语音等诸多领域获得的巨大成功,一些深度学习方法已被探索性地用于从fMRI数据中学习脑效应连接网络。例如:多层感知机神经网络方法,循环神经网络格兰杰因果方法和基于对抗生成网络的脑效应连接学习方法。实验结果表明这些方法能够获得比传统的机器学习方法更好的性能。然而,目前这些方法需要人工设置许多超参数,算法的性能严重依赖于所设置的参数。一旦参数设置不合理,算法将难以准确地学习到脑效应连接网络。

技术实现思路

[0005]本专利技术针对上述脑效应连接网络学习所面临的挑战,提出了一种基于自动变分自编码器的脑效应连接网络学习方法。该方法能够自动地调节模型参数,使模型在生成脑区fMRI数据的过程中自适应地学习到脑效应连接网络。
[0006]为了实现上述目的,本专利技术采用的技术方案是一种基于自动变分自编码器的脑效应连接网络学习方法。该方法首先利用编码网络从各脑区的fMRI数据中学习潜变量,然后基于该潜变量,通过解码网络生成各脑区的fMRI数据。最后,当生成的fMRI数据和真实的fMRI数据高度相似时,模型在迭代训练的过程中可以学习到一个最优的脑效应连接网络。
[0007]一种基于自动变分自编码器的脑效应连接网络学习方法,其特征在于,在计算机上依次按照以下步骤实现:
[0008]步骤(1):参数设置:包括脑区个数n,初始化脑效应连接参数矩阵A(计算脑区间的皮尔逊相关系数作为初始化的脑效应连接矩阵),网络稀疏损失函数的超参数λ,期望的KL散度值V
KL
,比例控制器系数K
P
,积分控制器系数K
I

[0009]步骤(2):利用编码器从fMRI数据中学习潜变量,具体步骤如下:
[0010]步骤(2.1):利用结构方程模型将脑效应连接参数矩阵和脑区fMRI数据编码为潜变量,其表达式如下:
[0011]Z=(I

A
T
)X
ꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0012]其中,Z=[z1,...,z
n
]表示潜变量,I表示单位矩阵,A表示脑效应连接参数矩阵,X=[x1,...,x
n
]表示各脑区fMRI数据。
[0013]步骤(2.2):设计了一个基于多层感知机的编码网络,该编码网络由3层神经网络结构组成(包括输入层、隐层和输出层),然后通过该编码网络来估计潜变量的后验分布的均值和方差。假设潜变量服从正态分布,则可根据所得到的均值和方差推断出潜变量的后验分布。接下来,通过蒙特卡罗采样和重参化技巧,可以从潜变量的分布中采样得到每个脑区所对应的潜变量。
[0014]步骤(3):利用解码网络从获得的潜变量中生成脑区fMRI数据。设计一个基于多层感知机的解码网络,该解码网络由3层神经网络结构组成(包括输入层、隐层和输出层),用于从步骤(2)所获得的潜变量中得到生成的各脑区fMRI数据的分布,其表达式如下:
[0015]p
θ
(X|Z)=ReLU((I

A
T
)
‑1Zθ)
ꢀꢀꢀꢀꢀꢀꢀ
(2)
[0016]其中,p
θ
(X|Z)表示从潜变量中学到的各脑区fMRI数据的分布,ReLU表示激活函数,θ表示在模型在前向和反向传播过程中解码网络学到的权重系数。
[0017]步骤(4):设计了一个包含fMRI数据生成损失项和网络稀疏损失项的损失函数。以最小化该损失函数为目标,使模型在迭代训练的过程中自动地学习到一个脑效应连接网络。构建该损失函数的具体步骤如下:
[0018]步骤(4.1):构建脑区fMRI数据生成损失项。为了使生成的fMRI数据接近真实的fMRI数据,采用证据下界作为数据生成的目标函数,其表达式为:
[0019][0020]其中,L
ELBO
表示脑区fMRI数据生成损失项,表示生成的fMRI数据,φ和θ分别表示在模型在前向和反向传播过程中编码器和解码器学习到的网络权重系数,p(Z)表示潜变量的真实分布,q
φ
(Z|X)表示由步骤(2.2)所得到的潜变量的后验分布,表示从潜变量中学到的各脑区fMRI数据的分布,表示生成的fMRI数据期望,D
KL
(q
φ
(Z|X)||p(Z))是KL散度值,表示生成fMRI数据与实际fMRI数据的误差。
[0021]步骤(4.2):由于KL散度在数据生成的过程中发挥了重要作用,KL散度值过大或者过小都会影响模型的学习性能。因此,设计了一个比例

积分控制器,使模型能够自动调节KL散度的大小。比例

积分控制器的计算公式如下:
[0022][0023][0024]其中,β(t)表示比例

积分控制器,K
P
=0.005表示比例控制系数,K
I
=0.01表示积分控制系数,e(t)表示模型估计的KL散度值和期望的KL散度值在t时刻的误差,T表示模型训练完成一次的时间,期望的KL散度值v
KL
=1.5,运行算法所得到的实际的KL散度值
[0025]步骤(4.3):将所设计的比例

积分控制器引入到公式(1)中,如图2所示,可得到新的脑区fMRI数据生成损失项,其表达式如下:
[0026][0027]其中,M表示对潜变量进行蒙特卡洛采样的次数,m表示对潜变量进行蒙特卡洛采样的第m次,σ
z
表示潜变量的后验分布的方差,μ
z
表示潜变量的后验分布的均值。
[0028]步骤(4.4):为了构建稀疏的脑效应连接网络结构,设计了一个保持脑效应连接网络稀疏性的网络稀疏损失函数,其表达式如下:
[0029][0030]其中,L
S
表示网络稀疏损本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自动变分自编码器的脑效应连接网络学习方法,其特征在于包括以下步骤:(1):参数设置:包括脑区个数n,初始化脑效应连接参数矩阵A参数矩阵A是通过计算脑区间的皮尔逊相关系数构建初始化的脑效应连接矩阵;网络稀疏损失函数的超参数λ,期望的KL散度值V
KL
,比例控制器系数K
P
,积分控制器系数K
I
;(2):利用编码器从fMRI数据中学习潜变量,具体步骤如下:

利用结构方程模型将脑效应连接参数矩阵和脑区fMRI数据编码为潜变量,其表达式如下:Z=(I

A
T
)X
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,Z=[z1,...,z
n
]表示潜变量,I表示n
×
n的单位矩阵,A表示脑效应连接参数矩阵,X=[x1,...,x
n
]表示各脑区fMRI数据;

设计了一个基于多层感知机的编码网络,该编码网络由3层神经网络结构组成,包括输入层、隐层和输出层,然后通过该编码网络来估计潜变量的后验分布的均值和方差;假设潜变量服从正态分布,则可根据所得到的均值和方差推断出潜变量的后验分布;接下来,通过蒙特卡罗采样和重参化技巧,从潜变量的分布中采样得到每个脑区所对应的潜变量;(3):利用解码网络从获得的潜变量中生成脑区fMRI数据;设计一个基于多层感知机的解码网络,该解码网络由3层网络结构组成,包括输入层、隐层和输出层;利用解码网络从步骤(2)所获得的潜变量中得到生成的各脑区fMRI数据的分布,其表达式如下:p
θ
(X|Z)=ReLU((I

A
T
)
‑1Zθ)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中,p
θ
(X|Z)表示从潜变量中学到的各脑区fMRI数据的分布,ReLU表示激活函数,θ表示在训练过程中解码网络学到的权重系数;(4):设计了一个包含fMRI数据生成损失项和网络稀疏损失项的损失函数;以最小化该损失函数为目标,使模型在迭代训练的过程中自动地学习到一个脑效应连接网络;

构建脑区fMRI数据生成损失项;为了使生成的fMRI数据接近真实的fMRI数据,采用证据下界作为数据生成的目标函数,其表达式为...

【专利技术属性】
技术研发人员:冀俊忠邹爱笑
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1