一种基于图表征的多组学癌症样本表示方法及相关装置制造方法及图纸

技术编号:44569892 阅读:27 留言:0更新日期:2025-03-11 14:28
本发明专利技术公开了一种基于图表征的多组学癌症样本表示方法及相关装置,表示方法包括:获取基因公共库数据;对基因公共库数据处理,得到癌症样本的方差大于阈值的基因表达数据以及甲基化数据;将癌症样本的方差大于阈值的基因表达数据以及甲基化数据处理后,得到癌症样本的多组学数据,癌症样本的多组学数据取交集,得到公共基因;基于公共基因,通过蛋白质互作网络数据库,得到对应基因的基因互作网络,过滤掉基因互作网络中的部分散点并整合后,得到样本基因互作网络骨架;将癌症样本的多组学数据与样本基因互作网络骨架表示采用样本图表示算法进行整合。本发明专利技术对多组学数据进行处理,获得与癌症发生高度相关的基因对应的组学数据,从而减少了测量和测序数据中的实验偏差对后续结论的影响。

【技术实现步骤摘要】

本专利技术属于生物信息学,具体涉及一种基于图表征的多组学癌症样本表示方法及相关装置


技术介绍

1、乳腺癌、肺癌和肾癌作为临床上常见且具有重要危害性的恶性肿瘤,对全球健康构成了严重威胁。根据2022年发表在jncc上关于国内癌症情况的研究,乳腺癌是女性中最常见的癌症之一,肺癌则是全球范围内造成死亡人数最多的癌症之一,其肾癌的发病率和致死率也在逐年增加。究其原因,癌症是一种高度遗传异质性的恶性肿瘤,这些携带不同基因突变谱和遗传表型的肿瘤细胞的生物学行为以及对治疗的敏感性不尽相同。且同一类型的肿瘤在不同患者之间可能存在着遗传变异,导致对治疗药物的反应差异很大。

2、随着当前高通量生物技术和人工智能技术的快速进步,研究人员越来越关注基于多个癌症数据集的多组学数据的整合和分析。机器学习方法在癌症研究中得到广泛应用,提供了许多新的工具来整合和分析各种组学数据,以获得更准确的预测结果,推动精准医疗的实现。

3、在当前主流的多组学数据融合方法中,主要有特征连接的多组学数据集成方法、模型集成的多组学数据集成方法、基于网络模型的多组学方法三种技术方法本文档来自技高网...

【技术保护点】

1.一种基于图表征的多组学癌症样本表示方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于图表征的多组学癌症样本表示方法,其特征在于,甲基化数据的甲基化水平通过下式计算:

3.根据权利要求1所述的基于图表征的多组学癌症样本表示方法,其特征在于,公共基因通过以下公式获得:

4.根据权利要求1所述的基于图表征的多组学癌症样本表示方法,其特征在于,将癌症样本的方差大于阈值的基因表达数据以及甲基化数据处理是采用R脚本处理。

5.根据权利要求1所述的基于图表征的多组学癌症样本表示方法,其特征在于,选取基因互作置信度大于0.4的边,作为样本基...

【技术特征摘要】

1.一种基于图表征的多组学癌症样本表示方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于图表征的多组学癌症样本表示方法,其特征在于,甲基化数据的甲基化水平通过下式计算:

3.根据权利要求1所述的基于图表征的多组学癌症样本表示方法,其特征在于,公共基因通过以下公式获得:

4.根据权利要求1所述的基于图表征的多组学癌症样本表示方法,其特征在于,将癌症样本的方差大于阈值的基因表达数据以及甲基化数据处理是采用r脚本处理。

5.根据权利要求1所述的基于图表征的多组学癌症样本表示方法,其特征在于,选取基因互作置信度大于0.4的边,作为样本基因互作网络骨架。

6.根据权利要求1所述的基于图表征的多组学癌症样本表示方法,其特征在于,基于图表征的多组学癌症样本表...

【专利技术属性】
技术研发人员:杨晓飞刘吉祥叶凯
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1