基于深度学习的复杂疾病分型方法、系统及存储介质技术方案

技术编号:37363869 阅读:18 留言:0更新日期:2023-04-27 07:11
本发明专利技术公开了一种基于深度学习的复杂疾病分型方法、系统及存储介质,涉及疾病分型技术领域。步骤为:采集疾病多模态组学数据,并对疾病多模态组学数据进行特征筛选,得到第一特征;利用稀疏典型相关分析对第一特征进行数据融合,得到多模态数据;将多模态数据输入到神经网络分类器中,提取特征表示;对特征表示进行聚类,将聚类结果作为伪标签重新训练神经网络分类器,更新神经网络参数进行迭代;利用更新后的神经网络分类器提取特征表示再次进行聚类,直到聚类结果收敛。本发明专利技术提出一个新颖的基于多模态数据的聚类框架,用于复杂疾病分型,摒弃了传统的学习表示

【技术实现步骤摘要】
基于深度学习的复杂疾病分型方法、系统及存储介质


[0001]本专利技术涉及疾病分型
,更具体的说是涉及一种基于深度学习的复杂疾病分型方法、系统及存储介质。

技术介绍

[0002]复杂疾病往往是由一组表型相似,但致病基因或环境因素不同的疾病组成,可以划分为多个亚型,相较于基于临床症状以及病理学特征进行疾病亚型划分,依赖于客观的生物学数据能为临床提供更科学的分型。
[0003]已有大量研究通过整合多组学数据进行亚型划分,然而,目前的方法大都是存在以下两个问题:
[0004](1)目前大部分的多组学聚类算法遵循同一种模式,首先从多组学数据共同学习低维特征表示,再使用提取到的特征表示进行聚类分析。这种模式归根到底还是传统的学习表示+聚类的模式,学习特征表示以及聚类分析这两个阶段是完全独立的,互不影响的,该类方法的弊端是难以学习到对聚类最友好的特征表示,导致往往无法取得最优的聚类结果。
[0005](2)多组学数据往往不是完全独立的,各种组学数据之间往往不仅仅具有简单的相加效应,更重要的是,他们之间可能具有交互作用,存在着互补性,各个组学数据之间可能存在内在关联。在进行数据融合时,不能忽视组学数据之间的关联性。
[0006]因此,对本领域技术人员来说,如何克服上述缺陷实现复杂疾病的准确分型是亟待解决的问题。

技术实现思路

[0007]有鉴于此,本专利技术提供了一种基于深度学习的复杂疾病分型方法、系统及存储介质,实现复杂疾病的准确分型。
[0008]为了实现上述目的,本专利技术采用如下技术方案:一种基于深度学习的复杂疾病分型方法,具体步骤包括如下:
[0009]采集疾病多模态组学数据,并对所述疾病多模态组学数据进行特征筛选,得到第一特征;
[0010]利用稀疏典型相关分析对所述第一特征进行数据融合,得到多模态数据;
[0011]将所述多模态数据输入到神经网络分类器中,提取特征表示;
[0012]对所述特征表示进行聚类,将聚类结果作为伪标签重新训练所述神经网络分类器,更新神经网络参数进行迭代;
[0013]利用更新后的所述神经网络分类器提取特征表示再次进行聚类,直到聚类结果收敛。
[0014]通过采用上述技术方案,具有以下有益的技术效果:通过分层集成学习整合多模态数据,并采用一种深度自监督聚类的策略,将神经网络分类器与聚类算法相结合;以分类
器提取特征表示,迭代的进行表示学习和聚类两个过程,摒弃了传统的学习表示

聚类两阶段完全独立的模式。
[0015]可选的,所述疾病多模态组学数据包括影像学数据、代谢组学数据、蛋白组学数据。
[0016]可选的,所述神经网络分类器为分层集成深度学习框架,包括输入层、全连接层、集成层、输出层;所述输入层,用于接收所述多模态数据,所述全连接层,用于学习各模态数据的特征表示,所述集成层,用于集成所述特征表示,通过所述输出层输出。
[0017]可选的,在所述全连接层前还包括归一化层,用于避免过拟合。
[0018]通过采用上述技术方案,具有以下有益的技术效果:在本专利技术的神经网络分类器中,采用聚类结果进行自监督训练优化特征学习,达到了最优的聚类结果。
[0019]可选的,利用双样本t检验方法对所述疾病多模态组学数据进行特征筛选,在特征筛选过程中,采用线性回归的方式进行协变量消除,得到所述第一特征。
[0020]可选的,在数据融合过程中,采用惩罚矩阵分解设置稀疏约束条件,使用网格搜索通过交叉验证选择最优的组合参数。
[0021]另一方面,提供一种基于深度学习的复杂疾病分型系统,包括依次相连的数据获取模块、数据融合模块、特征提取模块、聚类模块、迭代模块;其中,
[0022]所述数据获取模块,用于采集疾病多模态组学数据,并对所述疾病多模态组学数据进行特征筛选,得到第一特征;
[0023]所述数据融合模块,用于利用稀疏典型相关分析对所述第一特征进行数据融合,得到多模态数据;
[0024]所述特征提取模块,用于将所述多模态数据输入到神经网络分类器中,提取特征表示;
[0025]所述聚类模块,用于对所述特征表示进行聚类,将聚类结果作为伪标签重新训练所述神经网络分类器,更新神经网络参数进行迭代;
[0026]所述迭代模块,用于利用更新后的所述神经网络分类器提取特征表示再次进行聚类,直到聚类结果收敛。
[0027]最后,提供一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的一种基于深度学习的复杂疾病分型方法的步骤。
[0028]经由上述的技术方案可知,与现有技术相比,本专利技术公开提供了一种基于深度学习的复杂疾病分型方法、系统及存储介质,具有以下有益的技术效果:本专利技术基于多模态生物学数据,提出一个新颖的基于多模态数据的聚类框架,用于复杂疾病分型,摒弃了传统的学习表示

聚类两阶段完全独立、互不影响的模式,通过学习面向聚类的特征表示来优化聚类效果,聚类效果更好,使得对复杂疾病分型更准确。
附图说明
[0029]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0030]图1为本专利技术的方法流程图;
[0031]图2为本专利技术的深度迭代聚类算法结构图;
[0032]图3为本专利技术的神经网络分类器框架结构图;
[0033]图4为本专利技术的相关系数之和对比结果图;
[0034]图5为本专利技术的系统结构图。
具体实施方式
[0035]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0036]本专利技术实施例公开了一种基于深度学习的复杂疾病分型方法,如图1所示,具体步骤包括如下:
[0037]S1、采集疾病多模态组学数据,并对疾病多模态组学数据进行特征筛选,得到第一特征;
[0038]S2、利用稀疏典型相关分析对第一特征进行数据融合,得到多模态数据;
[0039]S3、将多模态数据输入到神经网络分类器中,提取特征表示;
[0040]S4、对特征表示进行聚类,将聚类结果作为伪标签重新训练神经网络分类器,更新神经网络参数进行迭代;
[0041]S5、利用更新后的神经网络分类器提取特征表示再次进行聚类,直到聚类结果收敛。
[0042]疾病多模态组学数据包括影像学数据、代谢组学数据、蛋白组学数据。
[0043]进一步的,影像组学数据往往具有高维度小本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的复杂疾病分型方法,其特征在于,具体步骤包括如下:采集疾病多模态组学数据,并对所述疾病多模态组学数据进行特征筛选,得到第一特征;利用稀疏典型相关分析对所述第一特征进行数据融合,得到多模态数据;将所述多模态数据输入到神经网络分类器中,提取特征表示;对所述特征表示进行聚类,将聚类结果作为伪标签重新训练所述神经网络分类器,更新神经网络参数进行迭代;利用更新后的所述神经网络分类器提取特征表示再次进行聚类,直到聚类结果收敛。2.根据权利要求1所述的一种基于深度学习的复杂疾病分型方法,其特征在于,所述疾病多模态组学数据包括影像学数据、代谢组学数据、蛋白组学数据。3.根据权利要求1所述的一种基于深度学习的复杂疾病分型方法,其特征在于,所述神经网络分类器为分层集成深度学习框架,包括输入层、全连接层、集成层、输出层;所述输入层,用于接收所述多模态数据,所述全连接层,用于学习各模态数据的特征表示,所述集成层,用于集成所述特征表示,通过所述输出层输出。4.根据权利要求3所述的一种基于深度学习的复杂疾病分型方法,其特征在于,在所述全连接层前还包括归一化层,用于避免过拟合。5.根据权利要求1所述的一种基于深度学习的复杂疾病分型方法,其特征在于,利用双样本t检验方法对所述疾病多模...

【专利技术属性】
技术研发人员:张锡哲王菲
申请(专利权)人:南京脑科医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1