基于基因共表达网络分析的癌症转录组数据处理方法技术

技术编号:33136051 阅读:46 留言:0更新日期:2022-04-17 01:01
基于基因共表达网络分析的癌症转录组数据处理方法,涉及数据处理领域,包括获取原始数据集;原始数据的预处理;识别差异表达基因;构建基因共表达网络;挖掘基因模块;基因模块与临床指标的关联分析;基因模块的富集分析;识别关键基因;探究关键基因的功能;关键基因的生存分析。由富集分析结果可知,使用该方法划分的基因模块具有显著的生物学意义;由Disgenet数据库对于关键基因的验证结果可知,使用该方法识别出的关键基因大部分均与肿瘤疾病有关。该方法在基因模块的挖掘及关键基因的识别方面具有良好的效果。该方法可作为癌症疾病转录组数据的一个重要工具,其应用也为进一步了解癌症疾病的患病机制提供了新的方向。一步了解癌症疾病的患病机制提供了新的方向。一步了解癌症疾病的患病机制提供了新的方向。

【技术实现步骤摘要】
基于基因共表达网络分析的癌症转录组数据处理方法


[0001]本专利技术涉及一种基因数据处理方法,具体涉及一种基于基因共表达网络分析的癌症转录组数据处理方法。

技术介绍

[0002]近年来,癌症疾病的患病率越来越高,但是由于这类疾病治疗困难又极易复发,故对于癌症疾病的研究变得越来越重要。如果能利用生物信息学方法对癌症疾病进行功能基因模块的挖掘,并识别出其中的关键基因,必将能够进一步了解癌症疾病的患病机制,并对其临床治疗具有一定的帮助。
[0003]随着二代测序技术的快速发展,基因表达数据出现了爆炸式的增长,如何从大量数据中挖掘出隐藏的知识成为了后基因组时代的重要任务之一。与此同时,随着研究的深入,人们逐渐发现在细胞环境中,各种生物因子不是单独地行使作用,而是相互合作完成各种复杂的生物功能。故将各类生物数据采用适当的方法转化为生物网络,从而利用图论以及复杂网络理论的相关知识对其进行分析与挖掘,已成为处理海量生物数据的有效方法。生物网络是在生物学领域的科学问题中,利用生物元素构建的网络,网络中的结点代表生物元素,如蛋白质、基因等,而网络中的边本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,包括以下步骤:步骤一、获取原始数据集;步骤二、原始数据的预处理;步骤三、识别差异表达基因;步骤四、构建基因共表达网络;步骤五、挖掘基因模块;步骤六、基因模块与临床指标的关联分析;步骤七、基因模块的富集分析;步骤八、识别关键基因;步骤九、探究关键基因的功能;步骤十、关键基因的生存分析。2.根据权利要求1所述的基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,步骤一中,所述原始数据集来源于TCGA数据库或GEO数据库;所述原始数据集包括癌症组织样本中的基因表达数据、癌旁组织样本中的基因表达数据和每个样本对应的临床数据。3.根据权利要求2所述的基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,步骤二中,首先过滤掉低表达基因,然后对样本进行层次聚类,删除离群样本。4.根据权利要求3所述的基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,步骤三中,利用FC

t算法识别出满足限定条件的所有差异表达基因。5.根据权利要求4所述的基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,步骤四中,以差异表达基因在样本中的基因表达数据为基础,进行两两基因的皮尔森相关分析;设置限定条件对得到的所有关系进行筛选,将满足限定条件的两个基因视为存在共表达关系;将所有存在共表达关系的基因及其关系用一张图进行表示,即得到基因共表达网络。6.根据权利要求5所述的基于基因共...

【专利技术属性】
技术研发人员:付聪梁磊张彦易星丞许彤
申请(专利权)人:吉林省蒲川生物医药有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1