当前位置: 首页 > 专利查询>江南大学专利>正文

基于模糊建模和多标记学习的自闭症谱系障碍诊断方法技术

技术编号:38155248 阅读:9 留言:0更新日期:2023-07-13 09:23
本发明专利技术属于智能医疗计算机辅助诊断应用领域,涉及一种基于模糊建模和多标记学习的自闭症谱系障碍诊断方法。该方法包括预处理、特征抽取、训练阶段和使用阶段四部分。预处理和特征抽取将自闭症谱系障碍样本的rs

【技术实现步骤摘要】
基于模糊建模和多标记学习的自闭症谱系障碍诊断方法


[0001]本专利技术属于智能医疗计算机辅助诊断应用领域,涉及一种基于模糊建模和多标记学习的自闭症谱系障碍诊断方法。
技术背景
[0002]自闭症谱系障碍(autism spectrum disorder,ASD)是一种伴有社交障碍、兴趣受限和行为重复等症状的神经发育障碍。基于大脑可塑性理论,及早地诊断,干预和治疗ASD,对于改变ASD患者的发育轨迹而言至关重要。但是,ASD病因复杂,没有确定的实验室生化指标作为诊断依据。并且,ASD包括自闭症、阿斯伯格综合征和待分类广泛性发展障碍等亚类,它们在症状的严重程度上位于从轻到重的连续谱上(自闭症处于最严重的一段),没有明确的划分界限。这些现状对于临床诊断ASD而言是一项重要挑战。基于此,计算机辅助诊断因其高效和可重复性的优势,已成为辅助诊断ASD的研究热点。
[0003]现有的计算机辅助诊断ASD的主流工作是基于静息态功能磁共振成像(resting state functional magnetic resonance imaging,rs

fMRI)展开的。与基于行为分析的幼儿孤独症筛查量表和孤独症诊断观察量表等量表不同,rs

fMRI通过跟踪血氧水平依赖信号的内在波动来评估整个大脑的功能连接。也即,rs

fMRI揭示大脑的固有自发活动规律、功能连接模式以及脑网络拓扑特征,是一种直接的、非侵入性的ASD度量工具。由于rs

fMRI只需患者保持闭眼放松状态而无需执行过多指令,且不需要监护人等观察者的参与,这在一定程度上降低了ASD数据采集过程中的差错。因此,它在计算机辅助诊断ASD领域更受欢迎。
[0004]现有方法已经有效促进了计算机辅助诊断ASD的发展。但是,几乎没有方法同时考虑计算机辅助诊断ASD时会面临的四个常见挑战。第一,ASD亚类之间的类失衡。这种情况普遍存在于数据采集过程中。第二,rs

fMRI图像含有不确定的信息表达。这主要是由于采集设备的不稳定性,不理想的静息状态,发病机制的复杂性,以及人体固有的生理噪声等因素的干扰导致的。第三,ASD数据集中存在标记噪声。这主要是因为ASD亚类之间的划分界限不清晰,所以在人工标注的ASD数据集中很可能存在被错误标记的ASD亚类。第四,对ASD数据集有限的知识挖掘。数据预处理只能利用有限的方法将rs

fMRI图像降维成对智能模型友好的特征数据,这在一定程度上限制了智能模型对ASD知识的学习强度。一般地,这四个挑战在计算机辅助诊断ASD时会同时出现。因此,亟待发展出一个能兼顾上述四个挑战的ASD辅助诊断方法。

技术实现思路

[0005]本专利技术的目的是提供一种面向类别不平衡、信息不确定以及标记噪声的,基于模糊建模和多标记学习的自闭症谱系障碍诊断方法。
[0006]具体实现步骤如下:
[0007]第一步:基于六个成像中心的自闭症谱系障碍图像数据,使用由ABIDE提供的标准
工具DPARSF对rs

fMRI图像进行处理。根据自动解剖标记AAL模板将大脑划分的116个感兴趣区域,本专利技术将rs

fMRI图像处理成相应的116种平均时间序列。
[0008]第二步:在获得的平均时间序列的基础上,进一步执行特征抽取。基于皮尔逊相关系数,本专利技术度量任意两个平均时间序列之间的相关性,获得一个规模为116
×
116的二阶功能连通特征矩阵。事实上,该二阶功能连通特征矩阵是一个对称矩阵,其中有一半的二阶功能连通信息是冗余的。所以,本专利技术仅从二阶功能连通特征矩阵中抽取上三角矩阵的元素作为特征向量。即,在本专利技术工作中,ASD数据集的特征维度是6670。
[0009]第三步:对不平衡的ASD数据集执行SMOTE样本合成。具体过程如下:
[0010](1)输入ASD训练数据最近邻数k,样本生成比n。
[0011](2)初始化
[0012](3)分别查找与L个ASD亚类标记相关的样本子集(3)分别查找与L个ASD亚类标记相关的样本子集N
i
是第i个ASD亚类标记的相关样本数,N
max

max N
i
(1≤i≤L)。
[0013](4)对于每一个ASD标记
[0014]如果N
i
>0且N
i
<N
max
[0015]1)在中为查找k个最近居查找k个最近居
[0016]2)如果不满足n倍生成比
[0017]a)从中随机选择样本来合成新样本(x
new
,y
new
)。即,δ且δ且是每个元素均在[0,1]范围内的随机向量。表示Hadamard乘积。
[0018]b)
[0019]经样本合成后的训练集被记为经样本合成后的训练集被记为本专利技术令N
tr
=N+N
new
,以及
[0020]第四步:先将ASD亚类输出数据转变成离散清晰的ASD标记输出矩阵,再执行模糊不确定学习。模糊不确定学习基于模糊逻辑推理准则依次建立“ASD实例

ASD聚类”模糊关系矩阵“ASD聚类

ASD标记”模糊关系矩阵“ASD实例

ASD标记”模糊关系矩阵并将获得到“ASD实例

ASD标记”关系矩阵融入清晰的标记输出矩阵,获得含有模糊不确定信息的输出矩阵具体过程如下:
[0021](1)FM_ASD利用模糊C均值聚类将ASD实例集聚成C个抽象类,构建“ASD实例

ASD聚类”关系矩阵每个实例对应一个隶属于C个抽象类的模糊隶属度向量,该向量从模糊聚类的角度分析了ASD数据的不确定性。对于ASD实例它属于第c(1≤c≤C)个聚类的模糊隶属值为:
[0022][0023][0024]其中表示第i个ASD实例属于第c类的模糊隶属度。是第c类的聚类中心。m>1是模糊指数。通过迭代求解和v
c
,第i个ASD实例属于第c类的最优模糊隶属值即可被获得,进一步可获得模糊隶属度矩阵即可被获得,进一步可获得模糊隶属度矩阵最优模糊隶属度向量反映了第i个ASD实例的表达不确定性。
[0025](2)FM_ASD基于ASD样本的模糊隶属度向量,构建“模糊聚类

ASD标记”的模糊关系矩阵具体地,对于F的第j行向量F
j
,(1≤j≤L),它在第j个ASD标记上整合了所有相关实例的模糊隶属度向量。即:
[0026][0027][0028]其中01×
C
表示1行C列的零向量。实际上,F是一种全局的不确定分析。它是基于所有ASD实例建立的模糊聚类与ASD标记之间的整体模糊本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于模糊建模和多标记学习的自闭症谱系障碍诊断方法,步骤如下:第一步:用DPARSF对rs

fMRI图像进行处理;根据自动解剖标记模板将rs

fMRI图像处理成与116个脑部感兴趣区域相应的116种平均时间序列;第二步:在平均时间序列的基础上执行特征抽取;利用皮尔逊相关函数度量任意两个平均时间序列之间的相关性,获得一个规模为116
×
116的二阶功能连通特征矩阵,再从二阶功能连通特征矩阵中抽取上三角矩阵的元素生成6670维度的特征向量;第三步:对不平衡的ASD数据集执行SMOTE样本合成;样本合成后的训练集被记为第三步:对不平衡的ASD数据集执行SMOTE样本合成;样本合成后的训练集被记为本发明令N
tr
=N+N
new
,以及第四步:先将ASD亚类输出数据转变成离散清晰的ASD标记输出矩阵,再执行模糊不确定学习;模糊不确定学习基于模糊逻辑推理准则依次建立“ASD实例

ASD聚类”模糊关系矩阵“ASD聚类

ASD标记”模糊关系矩阵“ASD实例

ASD标记”模糊关系矩阵并将获得到“ASD实例

ASD标记”关系矩阵融入清晰的标记输出矩阵,获得含有模糊不确定信息的输出矩阵第五步:在含有模糊不确定信息的输出矩阵的基础上执行标记协同学习;优化标记协同学习项以建立单个标记与全局标记之间的关联;第六步:依据每个标记相关样本量的差异,为每个标记的线性回归过程赋予专属的线性回归权重,且相关样本量越少,回归权重越大;第七步:基于标记先验知识构建标记协同学习;即,利用任意两个标记之间的相关性构建其判别特征之间的关联,从而有效挖掘ASD数据中的隐藏信息;第八步:通过整合上述七个步骤,实现完整的基于模糊建模和多标记学习的自闭症谱系障碍诊断目标函数;在类别不平衡、信息不确定以及标记噪声的场景下,仍能有效实现自闭症谱系障碍预测。2.如权利要求1所述的基于模糊建模和多标记学习的自闭症谱系障碍诊断方法,其特征在于:所述的第三步,具体步骤如下:3.1输入ASD训练数据最近邻数k,样本生成比n;3.2初始化3.3分别查找与L个ASD亚类标记相关的样本子集3.3分别查找与L个ASD亚类标记相关的样本子集N
i
是第i个ASD亚类标记的相关样本数,N
max

max N
i
(1≤i≤L);3.4对于每一个ASD标记如果N
i
>0且N
i
<N
max
1)在中为x
j(i) (1≤j≤Ni)查找k个最近居(1≤j≤Ni)查找k个最近居2)如果不满足n倍生成比
a)从中随机选择样本来合成新样本(x
new
,y
new
);即,且且且是每个元素均在[0,1]范围内的随机向量;(
°
)表示Hadamard乘积;b)3.如权利要求1或2所述的基于模糊建模和多标记学习的自闭症谱系障碍诊断方法,其特征在于:所述的第四步,具体步骤如下:4.1 FM_ASD利用模糊C均值聚类将ASD实例集聚成C个抽象类,构建“ASD实例

ASD聚类”关系矩阵每个实例对应一个隶属于C个抽象类的模糊隶属度向量,该向量从模糊聚类的角度分析了ASD数据的不确定性;对于ASD实例它属于第c(1≤c≤C)个聚类的模糊隶属值为:≤C)个聚类的模糊隶属值为:其中表示第i个ASD实例属于第c类的模糊隶属度;是第c类的聚类中心;m>1是模糊指数;通过迭代求解和v
c
,第i个ASD实例属于第c类的最优模糊隶属值即可被获得,进一步可获得模糊隶属度矩阵最优模糊隶属度向量反映了第i个ASD实例的表达不确定性;4.2 FM_ASD基于ASD样本的模糊隶属度向量,构建“模糊聚类

ASD标记”的模糊关系矩阵具体地,对于F的第j行向量F
j
,(1≤j≤L),它在第j个ASD标记上整合了所有相关实例的模糊隶属度向量;即:关实例的模糊隶属度向量;即:其中01×
C
表示1行C列的零向量;实际上,F是一种全局的不确定分析;它是基于所有ASD实例建立的模糊聚类与ASD标记之间的整体模糊关系;4.3 FM_ASD基于模糊逻辑准则,将“模糊聚类

ASD标记”的模糊关系矩阵F转化为“ASD实例

ASD标记”的模糊关系矩阵对于B中的第i行第j列元素B
ij
(1≤i≤L,1≤j≤N
tr
),它的计算公式为:其中F
ic
是F的第i行第c列元素,是第j个ASD实例在第c个聚类上的模糊隶属度,∧代表模糊矩阵合成运算中的取小运算,∨代表模糊矩阵合成运算中的取大运算;实际上,公式(5)即为模糊矩阵的合成运算,它能够实现模糊关系的推理建模;4.4 FM_ASD将“ASD实例

ASD标记”的模糊关系矩阵B融入ASD标记矩阵获得新标记矩
阵“ASD实例

ASD标记”模糊关系矩阵B暗含了ASD数据中的不确定信息的分布;所以,相比于原始清晰集标记矩阵所以,相比于原始清晰集标记矩阵更贴合真实ASD数据分布特点;的具体计算公式为:针对ASD数据的模糊不确定学习的建立将原本模糊不确定的ASD数据变得清晰可度量,它基于模糊推理建模量化了ASD数据表达的不确定性;这在一定程度上帮助FM_ASD缓解ASD数据中不确定信息表达带来的影响。4.如权利要求1或2所述的基于模糊建模和多标记学习的自闭症谱系障碍诊断方法,其特征在于:所述的第五步,具体步骤如下:5.1令ASD数据集中的N
tr
个训练样本在第l个标记上组成的标记向量为为了降低中标记噪声对后续FM_ASD学习ASD的干扰,FM_ASD提出标记的显性映射向量来分析所有ASD标记对第l个标记的影响,即,其中m
l
中的第j(1≤j≤L)个元素m
lj
代表第j个ASD标记对第l个ASD标记的影响;最小化公式(7)的目的在分析所有标记对第l个ASD标记的作用时,尽可能保持第l个标记在显式映射前后的表达一致性;5.2完整的标记协同学习即为:其中,公式(8)的第一项代表ASD标记间的协同学习,第二项代表关于M的正则化项;α和γ是两个超参数,分别平衡ASD标记间协同学习和模型复杂度的影响;Tr(
·
)表示矩阵的迹。5.如权利要求3所述的基于模糊建模和多标记学习的自闭症谱系障碍诊断方法,其特征在于:所述的第五步,具体步骤如下:5.1令ASD数据集中的N
tr
个训练样本在第l个标记上组成的标记向量为为了降低中标记噪声对后续FM_ASD学习ASD的干扰,FM_ASD提出标记的显性映射向量来分析所有ASD标记对第l个标记的影响,即,其中m
l
中的第j(1≤j≤L)个元素m
lj
代表第j个ASD标记对第l个ASD标记的影响;最小化公式(7)的目的在分析所有标记对第l个ASD标记的作用时,尽可能保持第l个标记在显式映射前后的表...

【专利技术属性】
技术研发人员:邓赵红娄琼丹胡曙东王士同
申请(专利权)人:江南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1