面向功能性脑网络的多阈值下基于多任务的特征选择方法技术

技术编号:22239156 阅读:85 留言:0更新日期:2019-10-09 18:54
面向功能性脑网络的多阈值下基于多任务的特征选择方法,采用多阈值方式提取多层次的网络特征,对于阈值化后的网络利用多核多任务学习方式提取多层次特征进一步分类处理。克服了已有方法的不足,进而学习出更具有判别力和解释性的特征。该gk‑MTFS方法将每个阈值下的特征学习作为一个任务,对每个任务采用图核(构建在图上的核)保留网络的结构化信息,并采用多任务学习探索任务之间的内在关联性,进而学习出更具判别力和解释性的特征。最后在真实脑疾病数据集上进行了验证,实验结果表明,相比现阶段的方法,提出的方法对脑疾病具有更好的分类特性。

Multi-task-based feature selection method under multi-threshold for functional brain network

【技术实现步骤摘要】
面向功能性脑网络的多阈值下基于多任务的特征选择方法
本专利技术属于机器学习和医学图像分析领域,具体涉及面向功能性脑网络的多阈值下基于多任务的特征选择方法。
技术介绍
随着现在生物技术的快速发展,脑影像技术,如现代核磁共振成像(magneticresonanceimaging,MRI)技术,包括功能性核磁共振成像(functionalMRI,fMRI),提供了一种非侵入式的方式探索人体大脑,揭示了之前无法认知的脑结构和功能的机制。脑网络分析可以在连接层次上刻画大脑脑区间的交互,成为医学图像分析和神经影像学中一个新的研究热点。最近,机器学习的方法已被用于脑网络的分析和分类中。例如,研究人员利用脑网络进行早期脑疾病的诊断和分类,获得了很好的性能。在这些研究中,典型的做法是从脑网络中提取脑的局部测量(如聚类系数)作为特征用于疾病的分类。而特征选择则是过滤掉多余和不重要的特征,从而改进分类性能。例如,Chen等人使用边的权重作为特征用于AD(Alzheimer’sdisease)和MCI(mildcognitiveimpairment)的分类。Wee等人从功能性脑网络中提取聚类系数作为特征用于MCI的分类。Zanin等人使用16种网络测量作为特征用于MCI和正常人的分类。由于局部性测量仅仅网络局部结构的特征,因此在分类过程中,丢失了网络的整体性的拓扑结构,从而可能会影响分类性能。在脑网络分析中,最经常使用的两种特征选择方法是t-test方法和Lasso方法。在t-test方法中,首先对每一个特征利用标准t-test来测量它们的判别性,并根据判别性对特征进行排序,最终选择一组最具判别力的特征子集。已有的研究表明在小样本情况下t-test方法通常能够获得好的性能。与t-test方法不同是,Lasso的方法通过最小化一个目标函数来完成特征选择,研究表明当大量不相关的特征而却只有少量样本时Lasso方法非常有效。目前,绝大多数特征选择方法主要针对向量数据,不能直接用于处理复杂的结构化数据,如脑网络数据。特征选择由于不仅能够提高分类器的性能,而且能够帮助寻找一些对疾病敏感的生物标志。已有的方法通常是从网络数据中提取局部测量(如边的权重或聚类系数)作为特征,并组合成一个长的特征向量,用于随后的特征选择和分类,而一些有用的网络结构信息(如网络的整体拓扑结构)被丢失,这可能降低了最终的分类性能。另外,功能性脑网络一般都是全连接加权网络,为了刻画网络的结构化特性需要采用阈值化预处理。然而,一方面,没有一个好的标准去选择特定的阈值,另一方面,不同阈值一般会得到不同的网络结构,这些结构可能含有互补信息,有可能进一步提升网络分析性能。基于此,本专利技术采用多阈值方式提取多层次的网络特征,对于阈值化后的网络利用多核多任务学习提取多层次特征进一步分类处理。克服了已有方法的不足,进而学习出更具有判别力和解释性的特征。提出的gk-MTFS方法将每个阈值下的特征学习作为一个任务,对每个任务采用图核(构建在图上的核)保留网络的结构化信息,并采用多任务学习探索任务之间的内在关联性,进而学习出更具判别力和解释性的特征。最后在真实脑疾病数据集上进行了验证,实验结果表明,相比现阶段的方法,提出的方法对脑疾病具有更好的分类特性。
技术实现思路
本专利技术针对现有技术中的不足,提供面向功能性脑网络的多阈值下基于多任务的特征选择方法。该gk-MTFS方法首先利用L21范式组稀疏化项,使得更具有判别性的特征能够被选中。进一步使用多阈值下基于图核的Laplacian正则化项,保留了功能性脑网络连接自身的拓扑结构信息。最后利用多核特征联合学习,利用近似加速梯度算法对目标函数进行优化求解。为实现上述目的,本专利技术采用以下技术方案:面向功能性脑网络的多阈值下基于多任务的特征选择方法,其特征在于,包括如下步骤:步骤一、对fMRI数据进行预处理,构建功能性脑网络;步骤二、采用R个阈值同时对构建的功能性脑网络进行阈值化处理;步骤三、对每个阈值化网络提取脑区的聚类系数作为特征用于测量网络的局部拓扑结构;步骤四、对每个阈值化网络利用图核计算网络间整体拓扑结构的相似性;步骤五、基于步骤三和步骤四,建立面向脑网络的多阈值下gk-MTFS特征选择方法的目标函数;步骤六、利用加速近似梯度算法对提出的目标函数进行优化。为优化上述技术方案,采取的具体措施还包括:进一步地,所述步骤一中,将大脑空间划分为116个脑区,获取脑区的时间序列,使用Pearson相关系数构建功能性脑网络,所构建的脑网络是加权的全连接网络,用于后续的脑网络分析。进一步地,所述步骤二中,对步骤一中所构建的带有权重的全连接网络,同时利用R个给定阈值将权重网络转化为多个二值化的网络,刻画多层次的拓扑结构,用于后续的特征提取和结构化特征选择。进一步地,所述步骤三中,对于步骤二中每个阈值化的脑网络,提取每个脑区的局部聚类系数作为特征,来自所有脑区的特征在一起构成一个特征向量,用于刻画脑网络的局部拓扑结构。进一步地,所述步骤四中,使用图核来定义两个网络的相似性,为了保留功能性连接网络数据拓扑结构信息,使用图核来直接定义两个网络数据的结构上的整体相似性,即对于第r个阈值下两个脑网络和其相似性的定义为:其中,表示第r个阈值下两个脑网络和的相似性,是定义的图核,使用Weisfeiler-Lehman子树的方法来构建相应的图核。进一步地,所述步骤五中,令r=1,2,...,R,Xr表示在步骤三中从N个样本R个阈值下提取的特征矩阵,i=1,2,...N表示从第i个样本在第r个阈值下提取的特征向量,d是每种特征维数;令Y=[y1,y2…,yN]∈RN,Y表示N个样本对应的响应向量,yi,i=1,2,...N表示样本的类标签,对两类分类问题,yi∈{+1,-1},可以分别表示为病人和正常人;基于此,提出面向脑网络的多阈值下gk-MTFS特征选择方法的目标函数如下:其中,W=[w1,w2,…,wR]∈Rd*N是一个权重矩阵,wr表示第r个阈值下的权重,Mr=Cr-Sr是Laplacian矩阵,Sr表示定义在第r个阈值(即任务)下的相似矩阵,利用公式(1)定义两个网络的相似性,即令i=1,2,...N,j=1,2,...N,Cr是对角矩阵,且表示第i个对角上的元素;该目标函数包含三项,第一项是损失函数项,采用平方损失函数,第二项是组稀疏化(group-sparsity)正则化项,用于从不同任务中选择公共的特征,第三项是Laplacian正则化项,用于保留网络的结构化信息和网络数据的分布信息,λ和β是用来平衡三项之间的相对贡献的大于0的常数。本专利技术的有益效果是:针对多阈值采用多任务的方式探索不同阈值(任务)下阈值网络的互补信息,充分提取了样本特征,保留了脑网络数据的整体结构信息与自身的拓扑信息,且在两个真实公开数据集(注意力缺陷多动障碍数据集与老年痴呆症数据集)上验证了所提出方法gk-MTFS具备更好的分类性能。附图说明图1a到图1c表示在三个分类任务上分类精度结果随不同正则化参数λ和β值的变化曲线,其中,图1a表示1MCIvs.eMCI分类,图1b表示eMCIvs.HC分类,图1c表示ADHDvs.HC分类。具体实施方式现在结合附图对本专利技术作进一步详细的本文档来自技高网
...

【技术保护点】
1.面向功能性脑网络的多阈值下基于多任务的特征选择方法,其特征在于,包括如下步骤:步骤一、对fMRI数据进行预处理,构建功能性脑网络;步骤二、采用R个阈值同时对构建的功能性脑网络进行阈值化处理;步骤三、对每个阈值化网络提取脑区的聚类系数作为特征用于测量网络的局部拓扑结构;步骤四、对每个阈值化网络利用图核计算网络间整体拓扑结构的相似性;步骤五、基于步骤三和步骤四,建立面向脑网络的多阈值下gk‑MTFS特征选择方法的目标函数;步骤六、利用加速近似梯度算法对提出的目标函数进行优化。

【技术特征摘要】
1.面向功能性脑网络的多阈值下基于多任务的特征选择方法,其特征在于,包括如下步骤:步骤一、对fMRI数据进行预处理,构建功能性脑网络;步骤二、采用R个阈值同时对构建的功能性脑网络进行阈值化处理;步骤三、对每个阈值化网络提取脑区的聚类系数作为特征用于测量网络的局部拓扑结构;步骤四、对每个阈值化网络利用图核计算网络间整体拓扑结构的相似性;步骤五、基于步骤三和步骤四,建立面向脑网络的多阈值下gk-MTFS特征选择方法的目标函数;步骤六、利用加速近似梯度算法对提出的目标函数进行优化。2.如权利要求1所述的面向功能性脑网络的多阈值下基于多任务的特征选择方法,其特征在于:所述步骤一中,将大脑空间划分为116个脑区,获取脑区的时间序列,使用Pearson相关系数构建功能性脑网络,所构建的脑网络是加权的全连接网络。3.如权利要求2所述的面向功能性脑网络的多阈值下基于多任务的特征选择方法,其特征在于:所述步骤二中,对步骤一中所构建的带有权重的全连接网络,同时利用R个给定阈值将权重网络转化为多个二值化的网络,用于刻画多层次的拓扑结构。4.如权利要求1所述的面向功能性脑网络的多阈值下基于多任务的特征选择方法,其特征在于:所述步骤三中,对于步骤二中每个阈值化的脑网络,提取每个脑区的局部聚类系数作为特征,来自所有脑区的特征在一起构成一个特征向量,用于刻画脑网络的局部拓扑结构。5.如权利要求1所述的面向...

【专利技术属性】
技术研发人员:接标王正东王咪卞维新丁新涛左开中陈付龙罗永龙
申请(专利权)人:安徽师范大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1