可解释的图池化网络与知识嵌入用于阿尔兹海默症的诊断制造技术

技术编号：40635605 阅读：3 留言：0更新日期：2024-03-13 21:19

本发明专利技术公开了一种可解释的图池化网络与知识嵌入的方法用于阿尔兹海默症（AD）的诊断与生物标记的提取，该方法包括：1）预处理脑影像基因组学数据，根据大脑分割的脑区和提取的风险基因构建每个样本的异质因素关联图；2）提出图池化网络，通过设计边加权图注意力卷积层更新节点特征，并采用自注意力图池化层提取显著节点；3）为了充分利用受试者的人口统计数据，嵌入一个知识学习模块以捕获受试者之间的相关性；4）基于池化分数，提出了两个正则化损失项以识别个体水平和组水平的生物标志物。在AD神经影像公开数据集上验证了本方法的预测性能；同时，一系列生物学实验也证明本方法提取的致病脑区和风险基因与AD密切相关。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及脑影像遗传学领域，尤其涉及一种可解释的图池化网络与知识嵌入用于阿尔兹海默症的诊断与生物标记的提取。

技术介绍

1、阿尔茨海默病(ad)是一种起病隐匿的进行性发展的神经退行性疾病,临床上以记忆障碍、失语、失用、失认、执行功能障碍等全面性痴呆症状为特征。迄今为止，ad还没有有效的治疗方法。此外，轻度认知障碍(mci)是正常衰老和早期ad之间的过渡状态，每年有15%-20%的mci患者发展为ad状态。在mci阶段采取一些措施可以有效防止疾病的进一步恶化。因此，有必要专利技术有效方法精确的探索脑部疾病的发展模式并准确诊断mci和ad阶段。

2、ad作为一种脑部疾病，主要表现在两个方面，一是宏观层面的脑部结构和功能的退化，二是微观层面的潜在遗传性。脑成像遗传学作为一个新兴领域，通过整合宏观医学影像数据和微观遗传数据进行综合分析，捕捉大脑功能结构与基因表达之间的相关性。尽管此类多组学数据具有互补信息，但目前方法很难以合理且有效的方式进行数据融合。传统的多模态数据融合仅简单拼接多组学数据的特征矩阵或使用优化函数，导致信息融合不完整，忽略了生物学可解释性。此外，异源致病因子之间潜在的疾病特异性相互作用也需要进一步探讨。因此，以合理且可解释的方式整合大脑区域和基因数据具有重要意义。

3、传统的机器学习方法，例如随机森林（rf）和支持向量机（svm），已成功应用于各个领域。近年来，随着高维生物学数据的迅速增加，这些方法的性能并不显著。同时，深度学习（dl）方法可以有效处理非结构化数据进而挖掘数据的潜在模式，为脑

4、尽管上述方法推动了神经影像遗传学领域的发展，但也存在一些局限性。首先，单核苷酸多态性（snp）在基因数据的处理过程中被编码为显性纯合基因型、杂合基因型、和隐性纯合基因型，即所有snp数据是由三种数值组成的数据。因此，如何在不同的基因中有效地反映每个snp的重要性是需要考虑的问题。其次，多模态的脑影像基因组学数据具有丰富且互补的生物信息，如何有效融合多模态数据并挖掘它们之间的关联关系是一个挑战。第三，为了提取不同级别的感兴趣脑区（roi）和风险基因（gene）标记，需要构建一个有效且可解释的框架进行致病生物标记的挖掘。最后，受试者丰富的先验信息有助于阿尔兹海默症的诊断，而已有方法并没有考虑受试者人口统计数据的关键作用。

技术实现思路

1、本专利技术的主要目的在于：针对现有技术存在的以上四点不足，提供一种可解释的图池化网络与知识嵌入的方法用于阿尔兹海默症的诊断和生物标记的提取。

2、为了达到以上目的，本专利技术主要包括三个模块，即影像和基因组学数据预处理、多模态数据融合模块、可解释的多模态图池化网络和知识嵌入模块、以及生物标记提取模块。主要包括以下步骤：

3、1）首先，在数据预处理阶段，为了突出不同基因中每个snp的重要性，构建了一个基因群体映射矩阵，基于该映射矩阵将分类数值组成的snp数据映射为重要性数值数据。

4、2）以感兴趣脑区和基因为节点，基于功能磁共振成像（fmri）数据和snp数据为每个受试者构建了异质因素关联图（hfags），从而实现多模态数据融合并进行脑影像遗传学关联分析。

5、3）接下来，将构建的异质脑区-基因关联图输入到所提出的可解释图池化网络框架中，该网络利用边加权图注意力卷积作为节点卷积层以更新节点特征；同时，使用自注意力图池化（self-attention pooling: sag pooling）作为节点池化层以筛选重要的脑区和基因节点。

6、4）一种新颖的知识学习模块被嵌入到所提出的深度图池化网络中，该模块利用人口统计数据，包括受试者的年龄、性别、受教育程度、以及mmse来丰富先验信息。接下来，使用位置编码将输入的人口统计数据映射到高维空间以增大数据之间的差异。全连接神经网络将编码后的特征向量进行非线性映射并提取高维特征。

7、5）最后，通过图池化层，为每个生物标志物分配一个重要性分数，并基于池化分数提出两个正则化损失项来提取个体水平和组水平的生物标志物。

8、6）我们使用了ad神经影像公开数据库（adni）的数据集，验证了专利技术方法可以取得更高的分类精度，并提取了与阿尔兹海默高度相关的致病脑区和风险基因，进而证明了专利技术方法的有效性和泛化性。

本文档来自技高网...

【技术保护点】

1.本专利技术公开了一种可解释的图池化网络与知识嵌入的方法用于阿尔兹海默症的诊断和生物标记的提取，其特征在于，以下步骤：

2.根据权利要求1所述的可解释的图池化网络与知识嵌入的方法，其特征在于，所述步骤2中：

3.根据权利要求2所述的可解释的图池化网络与知识嵌入的方法，其特征在于，所述步骤3中：

4.根据权利要求3所述的可解释的图池化网络与知识嵌入的方法，其特征在于，所述步骤4中：

5.根据权利要求4所述的可解释的图池化网络与知识嵌入的方法，其特征在于，所述步骤5中：

6.根据权利要求5所述的可解释的图池化网络与知识嵌入的方法，其特征在于，所述步骤6中：

【技术特征摘要】

1.本发明公开了一种可解释的图池化网络与知识嵌入的方法用于阿尔兹海默症的诊断和生物标记的提取，其特征在于，以下步骤：

2.根据权利要求1所述的可解释的图池化网络与知识嵌入的方法，其特征在于，所述步骤2中：

3.根据权利要求2所述的可解释的图池化网络与知识嵌入的方法，其特征在于，所述步...

【专利技术属性】
技术研发人员：刘金星，焦翠娜，王双，尚军亮，高英莲，李凤，
申请(专利权)人：曲阜师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人