【技术实现步骤摘要】
一种利用公共数据资源发现并整合直肠癌相关基因及其功能分析的方法及系统和应用
本专利技术涉及医学基因组学和计算生物学领域,具体涉及一种利用公共数据资源发现并整合直肠癌相关基因及其功能分析的方法。
技术介绍
基因是遗传的基本单位。它决定了生物的性状以及生物的生长与发育,基因与疾病以及生理特征之间有着极密切的关系。“人类基因组计划”的目标就是要阐明人类基因的全部序列,从整体上破译人类遗传信息,从而使人类可以第一次从分子水平上全面认识自身。“人类基因组”的研究,已从“结构基因组”阶段进入“功能基因组”阶段,主要通过海量生物学数据分析,进一步阐明基因组的生物学功能。因此,生物信息学是一门集生命科学、计算机科学、数学、物理学为一身的多学科交叉的前沿学科。公共数据库是开展生物信息学研究的重要工具。目前,国际上公共数据库发展极快,利用高通量测序、计算方法预测、文献挖掘等技术产生了海量的数据资源,平均每15个月就会增长一倍,并且这些数据库大部分是开放的,是免费提供各国科学家使用的。如何充分利用这些免费资源、高效整合数据、深入挖掘分析已成为生物信息学的一个重要课题。随着高通量检测技术 ...
【技术保护点】
一种利用公共数据资源发现并整合直肠癌相关基因及其功能分析的方法,其特征在于:包括如下步骤:步骤1,样本数据下载和整理:获取基因表达数据,选定目标疾病直肠癌和测序平台,下载数据,下载的数据包含疾病样本和对应的正常样本;步骤2,对步骤1得到的基因表达数据去极值并分析;步骤3,对经过步骤2处理后的基因表达数据进行筛选差异表达分析基因;步骤4,对步骤3得到的基因进行功能分析并找出与疾病相关的条目;步骤5,互作基因分析,构建网络示意图。
【技术特征摘要】
1.一种利用公共数据资源发现并整合直肠癌相关基因及其功能分析的方法,其特征在于:包括如下步骤:步骤1,样本数据下载和整理:获取基因表达数据,选定目标疾病直肠癌和测序平台,下载数据,下载的数据包含疾病样本和对应的正常样本;步骤2,对步骤1得到的基因表达数据去极值并分析;步骤3,对经过步骤2处理后的基因表达数据进行筛选差异表达分析基因;步骤4,对步骤3得到的基因进行功能分析并找出与疾病相关的条目;步骤5,互作基因分析,构建网络示意图。2.根据权利要求1所述的利用公共数据资源发现并整合直肠癌相关基因及其功能分析的方法,其特征在于:所述步骤1具体包括如下步骤:步骤1.1,进入R语言工作界面,载入TCGAbiolinks包;步骤1.2,设定目标疾病、测序平台和mRNA文件类型;步骤1.3,批量下载所需的标准化数据,得到单个样本数据;步骤1.4,将上述步骤得到的单个样本数据进行合并。3.根据权利要求1所述的利用公共数据资源发现并整合直肠癌相关基因及其功能分析的方法,其特征在于:所述步骤2中,所述基因表达数据去极值并分析的步骤中的极值数据为:作为RNA表达值的标准化测序片段数目为零的数据。4.根据权利要求1所述的利用公共数据资源发现并整合直肠癌相关基因及其功能分析的方法,其特征在于:所述步骤3中,筛选差异表达分析基因选取1.5倍或者2倍的差异倍数,选用三个标准Benjamini–Hochberg方法、FDR方法或者Bonforroni方法校正P-value得到差异表达的mRNA。5.根据权利要求1所述的利用公共数据资源发现并整合直肠癌相关基因及其功能分析的方法,其特征在于:所述步骤4中,基因进行功能分析基于DAVID数据库信息,包括基因本体分析,代谢通路分析,疾病相关分析和调控网络的构建...
【专利技术属性】
技术研发人员:陈瑞,高娜,李晓波,孟庆涛,吴申申,
申请(专利权)人:东南大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。