基于组学-组学核交互的多组学数据整合肿瘤分型方法技术

技术编号:42996317 阅读:69 留言:0更新日期:2024-10-15 13:25
本发明专利技术属于医疗数据分析技术领域,具体涉及一种基于组学‑组学核交互的多组学数据整合肿瘤分型方法,以提高分型准确性。本方法包括:获取肿瘤患者的多组学数据,所述多组学数据包括但不限制于:mRNA数据、miRNA数据和DNA甲基化数据,对多组学数据进行预处理;对每个组学数据采用高斯核函数计算样本相似核;采用高斯核函数计算每个组学数据集中的样本相似核;采用哈达玛积构建不同组学数据集间的交互核;基于每个组学数据集中的样本相似核与不同组学数据集间的交互核,采用无监督多核学习构建融合核;在融合核基础上进行k‑means聚类,得到肿瘤患者分型结果。

【技术实现步骤摘要】

本专利技术属于医疗数据分析,具体涉及一种基于组学-组学核交互的多组学数据整合肿瘤分型方法(interactive multi-kernel learning,imkl)。


技术介绍

1、肿瘤具有高度分子异质性和复杂生物学特征,相同临床分期或病理特征相近的肿瘤患者,其临床预后却存在显著差异。根据肿瘤不同分子生物学特征建立肿瘤分子分型,以此制定肿瘤个体化治疗策略,是临床肿瘤学的重要发展方向。肿瘤的发生发展涉及基因变异、表观遗传改变、基因表达异常以及信号通路紊乱等诸多层次的复杂调控机制,相比于单组学数据分型,整合多组学数据可以同时捕获不同数据类型之间的关联和潜在的因果关系,形成信息互补。

2、近年来发展了多种多组学数据整合方法,这些方法主要分为串联整合和基于转换的方法。串联整合多组学数据直接将多个数据集串联成一个大的输入矩阵,在此矩阵基础上采用合适的统计方法进行分析,极大增加了数据维度,导致维度灾难更为突出,且不同组学数据对分型的贡献相同容易造成信息损失和偏倚;基于转换的方法,如无监督多核学习(unsupervised multikernel lea本文档来自技高网...

【技术保护点】

1.一种基于组学-组学核交互的多组学数据整合肿瘤分型方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于组学-组学核交互的多组学数据整合肿瘤分型方法,其特征在于,所述S1中对多组学数据包括但不限于:DNA甲基化数据和mRNA数据和miRNA数据。

3.根据权利要求2所述的一种基于组学-组学核交互的多组学数据整合肿瘤分型方法,其特征在于,所述对多组学数据进行预处理,包括:

4.根据权利要求3所述的一种基于组学-组学核交互的多组学数据整合肿瘤分型方法,其特征在于,所述S2中采用高斯核函数计算每个组学数据集的样本相似核,具体为:

5...

【技术特征摘要】

1.一种基于组学-组学核交互的多组学数据整合肿瘤分型方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于组学-组学核交互的多组学数据整合肿瘤分型方法,其特征在于,所述s1中对多组学数据包括但不限于:dna甲基化数据和mrna数据和mirna数据。

3.根据权利要求2所述的一种基于组学-组学核交互的多组学数据整合肿瘤分型方法,其特征在于,所述对多组学数据进行预处理,包括:

4.根据权利要求3所述的一种基于组学-组学核交互的多组学数据整合肿瘤分型方法,其特征在于,所述s2中采用高斯核函数计算每个组学数据集的样本相似核,具体为:

5.根据权利要求4所述的一种基于组学-组学核交互的多组学数据整合肿瘤分型方法,其特征在于,所述s3中交互核为两个组学间的交互核和多个...

【专利技术属性】
技术研发人员:曹红艳田雅昕王彤赵鑫徐昭阳张岩波余红梅房瑞玲
申请(专利权)人:山西医科大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1