当前位置: 首页 > 专利查询>天津大学专利>正文

一种利用人工神经网络模型对视觉刺激解码方法技术

技术编号:22817653 阅读:26 留言:0更新日期:2019-12-14 13:21
本发明专利技术公开了一种利用人工神经网络模型对视觉刺激解码方法,包括S1、获取fMRI数据作为原始数据;S2、对采集原始数据进行转换和预处理获得数据更新集;S3、对数据更新集中数据进行多余数据删除和选取脑区ROI数据获得脑区数据集;S4、对脑区数据集进行特征特征选择和标准化获得脑区分类数据集;S5、采用多层感知机对脑区分类数据集进行分类输出分类准确率,利用多层感知机对fMRI数据进行分类,以达到对视觉刺激解码的目的。

A decoding method of visual stimulus based on artificial neural network model

【技术实现步骤摘要】
一种利用人工神经网络模型对视觉刺激解码方法
本专利技术涉及认知科学领域,具体涉及利用利用人工神经网络模型对视觉刺激解码方法。
技术介绍
视觉是人类接受外界信息的最主要来源之一。在繁杂的社会环境中,人类可以依靠视觉识别物体,鉴别危险,因此这种识别能力于人类而言具有很强的生存意义。随着脑科学和认知科学的发展,人们对于物体识别在大脑中的运行机制有了浓厚的兴趣,有关训练分类机制的研究迅速展开,国内外学者也在神经系统的水平上对大脑中的神经机制进行了深入研究。不仅如此,人工智能、信息科学等领域对视觉在大脑中的处理机制也展现了强烈的兴趣,如脑机接口、人工视觉等。已经有越来越多的研究表明,当接收到不同种类事物的视觉刺激时,人脑会有不同的激活模式。fMRI(功能磁共振成像)为我们在计算水平上研究视觉解码提供了技术支持。利用该技术可以记录不同视觉刺激下脑激活模式的数据,然后利用这些数据对大脑的认知状态进行解码,该过程通常被称之为“读脑”。在认知科学领域中,利用fMRI数据探究不同视觉物体刺激下人脑激活模式,进而实现视觉物体解码是一个重要的任务。有关视觉解码的大脑激活模式的研究分为三个层次:分类、识别和重构。分类与识别构成了重构的基础。本研究中主要是利用多层感知机建立视觉刺激解码模型,以解码精度作为评价指标,对不同视觉刺激下的fMRI数据进行分类。分类实现了对外界不同视觉刺激类别的解码,反映了刺激类别与大脑认知模式的映射关系。进一步的,这种分类也有助于进一步探究大脑不同区域对应的不同功能,从而进一步理解大脑内部的视觉处理机制。fMRI作为一种新兴的神经影像学技术,具有可重复性、无损伤性、无侵入性等优点,并且有较高的空间分辨率和时间分辨率。目前主要应用在人或动物的脑或脊髓。该技术通过测量局部血氧水平依赖(BOLD)的变化,可以实现对神经代谢活动旺盛区域的准确定位。当人脑接收到不同类别的视觉事物的刺激时,不同大脑区域的神经代谢活动情况不同,导致对应区域的血氧水平依赖会发生改变。利用该技术可以定位这样的脑区,即得到不同类别视觉刺激主要激活的大脑区域。同时结合多元数据分析的数学方法,可以提取不同刺激下大脑活动的时空特性并分析,就可以实现对fMRI数据的分类,即实现对不同种类的视觉刺激的解码。本研究中利用fMRI技术结合多体素模式分析(MVPA)方法,建立大脑对视觉刺激的解码模型。在数据的处理方法上,传统的方法是利用单变量分析,在每个体素上建立一个基于假设驱动的广义线性模型,利用t检验判断该体素在一定的显著性水平上是否与某个任务是显著相关的,进而可以得到该任务下很多体素构成的显著性区域。这种方法的缺点是它将每个体素单独分析,没有考虑到体素之间的相关性,但事实上大脑中的体素在某些状态下是彼此相关的,尤其是空间上相邻的体素可能具有更强的相关性。为了在研究中不丢失这一部分的关联信息,本研究中使用多体素模式分析方法。该方法充分考虑了体素间的相关性,并且可以根据大脑模式识别大脑的认知状态,所以经常被应用于物体分类的问题上。fMRI数据具有特征数庞大,影响因素多等特征,MVPA将机器学习的方法应用到fMRI数据上,能够提取体素之间或者脑区之间的关联信息,进而识别不同的大脑激活模式,因此具有较大优势。MVPA通常包括数据选取、特征选择、选择分类器和分类性能测试等过程。在应用多体素模式分析的过程中,人工神经网络(ArtificialNeuralNetwork,ANN)是常用的一种机器学习的方法。这种方法灵敏度更高,能更好的挖掘数据中有用的信息。近些年,人工神经网络已经发展成为一个应用广泛并且涉及多学科交叉的前沿学科。人工神经网络对复杂的非线性的输入-输出映射关系较为敏感,在处理规模较大的模糊数据以及非线性数据时尤为适用。由于其具有一定的泛化能力,尤其能对未学习的数据样本进行分类,ANN已经广泛应用于医学数据分类,如阿尔茨海默病的诊断,评价情绪稳定性等。多层感知机(MLP)是一种前向结构的人工神经网络模型。有多个节点层,并且每一层都是全连接到下一层,每个节点都可以使用非线性激活函数。相比于神经网络中的单层感知器,多层感知机除了具有输入输出层以外,还具有一层或多层的隐藏层,这支持了多层感知机可以实现非线性判别,即MLP可以学习输入的任意非线性函数。我们通常认为大脑神经元的活动是存在很多非线性源的,这也正是MLP可以被用于大脑数据分析的一个主要原因。综上所述,本专利技术中利用fMRI技术采集被试在不同种类视觉刺激下的大脑数据,结合多层感知机这种人工神经网络模型,对fMRI数据进行分类,进而实现对视觉物体的解码,从而更有利于探究大脑处理视觉刺激的机制,掌握大脑相应区域的神经活动规律。
技术实现思路
本专利技术目的在于使用多体素模式分析(MVPA)和多层感知机(MLP)对fMRI数据进行特征选择和分类,从而实现对不同种类视觉刺激的解码。一种利用人工神经网络模型对视觉刺激解码方法,包括如下步骤:S1、获取fMRI数据作为原始数据;S2、对采集原始数据进行转换和预处理获得数据更新集;S3、对数据更新集中数据进行多余数据删除和选取脑区ROI数据获得脑区数据集;S4、对脑区数据集进行特征选择和标准化获得脑区分类数据集;S5、采用多层感知机对脑区分类数据集进行分类输出分类准确率。所述S2中脑区分类数据集处理过程:2.1、对脑区数据集通过单因素方差方法获得每个脑区中体素的P值、F值;2.2、判断当前列数是否等于原始矩阵列数;如果相等则对新矩阵中的所有数据进行标准化处理获得脑区分类数据集;否则进入下一步2.3、判断P<0.05,如果满足要求将该P值所在列加入新矩阵,否则进入下一步2.4、列数+1,返回步骤2.2。所述S5中采用多层感知机对脑区分类数据集进行解码过程:5.1、选取分类数据集中向量为X建立隐藏层:f(ωX+b);5.2、根据隐藏层建立多层感知机的输出层:f1(ω1X1+b1);5.3、在输出层得到训练数据的预测目标后,通过误差在MLP中的反向传递利用优化器获得最优参数,训练得到MLP模型。5.4、将测试集用于上述MLP模型,重复步骤5.1和5.2,输出预测目标并与测试集结果进行对比,最终输出分类准确率。有益效果本专利技术利用多层感知机对fMRI数据进行分类,以达到对视觉刺激解码的目的。因为实验数据的质量以及数据选取对最终的解码准确率影响较大,因此不能武断判定该方法适用于所有数据集。但该专利技术中,没有刻意选取特别的数据集,而是以网上公开数据集为实例对该方法进行实施,且准确率可以达到%50-%60左右,与八分类对应的%12.5相比,准确率很高,说明该方法具有一定的普适性和高准确率。以实施例中的公开数据集为例,下表1列出了实施例的分类准确率的结果。其中sub1-6表示6个被试,LingualGyrus,FusiformGyrus,InferiorOccipitalGyrus,MiddleOccipitalGyrus分别表示选取的舌回本文档来自技高网
...

【技术保护点】
1.一种利用人工神经网络模型对视觉刺激解码方法,其特征在于,包括如下步骤:/nS1、获取fMRI数据作为原始数据;/nS2、对采集原始数据进行转换和预处理获得数据更新集;/nS3、对数据更新集中数据进行多余数据删除和选取脑区ROI数据获得脑区数据集;/nS4、对脑区数据集进行特征选择和标准化获得脑区分类数据集;/nS5、采用多层感知机对脑区分类数据集进行分类输出分类准确率。/n

【技术特征摘要】
1.一种利用人工神经网络模型对视觉刺激解码方法,其特征在于,包括如下步骤:
S1、获取fMRI数据作为原始数据;
S2、对采集原始数据进行转换和预处理获得数据更新集;
S3、对数据更新集中数据进行多余数据删除和选取脑区ROI数据获得脑区数据集;
S4、对脑区数据集进行特征选择和标准化获得脑区分类数据集;
S5、采用多层感知机对脑区分类数据集进行分类输出分类准确率。


2.根据权利要求1所述的一种利用人工神经网络模型对视觉刺激解码方法,其特征在于,所述S4中脑区数据集处理过程:
2.1、对脑区数据集通过单因素方差方法获得每个脑区中体素的P值、F值;
2.2、判断当前列数是否等于原始矩阵列数;如果相等则对新矩阵中的所有数据进行标准化处理获得脑...

【专利技术属性】
技术研发人员:梁亚平魏建国
申请(专利权)人:天津大学
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1