一种基于生物网络的癌症驱动基因的筛选方法技术

技术编号:11642271 阅读:114 留言:0更新日期:2015-06-24 19:38
一种基于生物网络的癌症驱动基因的筛选方法,包括如下步骤:(1)癌症差异表达基因筛选;(2)癌症生物分子网络构建;(3)基于癌症生物分子网络的基因癌症驱动力计算;(4)根据驱动力计算结果排序确定癌症驱动基因;本发明专利技术方法不仅和成熟可靠的现代高通量技术紧密结合,而且符合系统生物学和网络药理学理论,与生物网络的结合使癌症驱动基因的筛选更加的贴合生物体内的生物学过程,为进一步的基因靶点药物研发打下了重要基础。

【技术实现步骤摘要】

本专利技术涉及癌症医学领域,特别涉及一种基于生物网络的癌症驱动基因的筛选方 法。
癌症的发病过程是变异的驱动基因主导的癌细胞生存优势不断积累的过程。在整 个癌症的发病过程中,癌细胞获得生存优势的积累,不断扩增,对周围组织环境产生浸润, 直至发生扩散的过程需要一系列基因的遗传结构发生变化。这些遗传结构发生变化后能够 为癌细胞带来生存优势的基因被称为驱动基因,它们是主导癌症发病过程的关键因素。 在肿瘤细胞中不是所有检测到相对正常细胞发生变化的基因都是驱动基因。基于 日常细胞分裂较频繁的组织中,如血液和肠道,发生的癌症的研宄发现,在肿瘤细胞中检测 到的突变数目随着病人年龄的增长直线增加。如何有效的识别癌症驱动基因,仍然是当前 的癌症研宄中亟待解决的难题。 已有的癌症驱动基因相关研宄中,多是基因突变频率或者突变功能预测的方法, 现有的癌症驱动基因相关专利,【申请号】CN201310284338. X公开了"一种检测非小细胞肺 癌驱动基因突变谱的方法及试剂盒与应用"其中使用的是检测突变基因频率的方法判断驱 动基因。此方法仅仅依赖基因的突变率,无法反映突变基因的在生物网络中的真实价值。因 为所有基因的功能都不是独立实现的,都是通过在生物分子网络中和其他分子相互作用而 实现的。所以说仅仅依赖突变频率的方法无法真实反映突变基因对于细胞功能的影响,也 就无法正确判断此基因的遗传结构变化是否真的对癌症获得生存优势有贡献。
技术实现思路
为了克服上述现有技术的缺陷,本专利技术的目的在于提供一种基于生物网络的癌症 驱动基因的筛选方法,将癌症生物分子网络与基因变异有机结合,为进一步的细胞和动物 实验验证和基因靶点药物研发打下了重要基础。 为了达到上述目的,本专利技术的技术方案是这样实现的: -种基于生物网络的癌症驱动基因的筛选方法,包括如下步骤: (1)癌症差异表达基因筛选:选择一套包含癌症组织和对应正常样本的基因表达 谱数据集作为分析基础,使用Fold change方法比较基因在每对癌症组织和正常组织中的 表达量差异,将在癌症对正常样本比较中出现两倍及以上表达量差异的基因作为候选差异 表达基因集合,然后对此集合进行筛选,将至少有三例以上癌症样本支持的基因作为癌症 差异表达基因; (2)癌症生物分子网络构建:整合BI0GRID数据库和HPRD数据库中的人类蛋白质 相互作用数据,对蛋白质相互作用的数据进行筛选,筛选标准是:将一篇以上实验文献支持 的蛋白质-蛋白质相互作用关系整理出来,删除不符合前述要求的蛋白质-蛋白质相互作 用关系,使用筛选后的蛋白质-蛋白质相互作用关系将癌症差异表达基因编码的蛋白连接 起来,建立人类癌症生物分子网络; (3)基于癌症生物分子网络的基因癌症驱动力计算:对人类癌症生物分子网络进 行拓扑结构分析,计算每个分子与网络中其他分子相互作用的次数,也就是拓扑学理论中 的Degree,作为单个分子的癌变基础效力值,此效力值越高,与此分子作用的癌症分子越 多,此分子在癌症中的作用越重要,然后使用如下公式计算网络中编码每个蛋白质分子的 基因的癌变驱动力:【主权项】1. ,其特征在于,包括如下步骤: (1) 癌症差异表达基因筛选:选择一套包含癌症组织和对应正常样本的基因表达谱数 据集作为分析基础,使用Fold change方法比较基因在每对癌症组织和正常组织中的表达 量差异,将在癌症对正常样本比较中出现两倍及以上表达量差异的基因作为候选差异表达 基因集合,然后对此集合进行筛选,将至少有三例以上癌症样本支持的基因作为癌症差异 表达基因; (2) 癌症生物分子网络构建:整合BI0GRID数据库和HPRD数据库中的人类蛋白质相 互作用数据,对蛋白质相互作用的数据进行筛选,筛选标准是:将一篇以上实验文献支持的 蛋白质-蛋白质相互作用关系整理出来,删除不符合前述要求的蛋白质-蛋白质相互作用 关系,使用筛选后的蛋白质-蛋白质相互作用关系将癌症差异表达基因编码的蛋白连接起 来,建立人类癌症生物分子网络; (3) 基于癌症生物分子网络的基因癌症驱动力计算:对人类癌症生物分子网络进行 拓扑结构分析,计算每个分子与网络中其他分子相互作用的次数,也就是拓扑学理论中的 Degree,作为单个分子的癌变基础效力值,此效力值越高,与此分子作用的癌症分子越多, 此分子在癌症中的作用越重要,然后使用如下公式计算网络中编码每个蛋白质分子的基因 的癌变驱动力:公式(I) i为癌症生物分子网络中的一个蛋白质; j为癌症生物分子网络中与蛋白质i相互作用的另一个蛋白质; η为癌症生物分子网络中与蛋白质i相互作用的蛋白质总数; DPi为编码癌症生物分子网络中的一个蛋白质i的基因的癌变驱动力值; VCi为发生编码蛋白质i的基因差异表达的癌症样本数目; NCj为发生编码蛋白质j的基因差异表达的癌症样本数目; Dj为蛋白质j的癌变基础效力值,也就是与蛋白质j相互作用的癌症分子总数; NP为整个数据集合所有癌症样本的数目; (4) 根据驱动力计算结果排序确定癌症驱动基因:对步骤3计算获得的所有基因的癌 症驱动力按照数值大小进行排序;数值越大,排序越高,其作为癌症驱动基因的可能性越 尚,将排序如十位的基因作为此癌症的驱动基因。2. 根据权利要求1所述的,其特征在 于,所述步骤(1)中的癌症,其类型包括但不限于肝细胞癌、非小细胞肺癌和胃癌。3. 根据权利要求1所述的,其特征在 于,所述步骤(1)中的癌症组织和对应正常样本的基因表达谱数据来源可以是公共数据 库,也可以是自行采集病人组织样本通过高通量芯片或者测序平台分析获得,芯片产生 的基因表达谱数据,具体包括但不限于Affiymerix公司的芯片或Agilent公司的基因 芯片;转录组测序产生的表达谱数据,具体包括但不限于Illumina公司的测序仪或Life Technologies公司的测序仪产生的数据。4. 根据权利要求1所述的,其特征在 于,所述步骤(1)中比较基因在每对癌症组织和正常组织中的表达量差异所采用的方法可 以采用本领域常用的各种方法,例如包括但不限于:标准Fold Change法、基于标准Fold Change方法改良的能够指示基因差异表达方向的比较方法。5. 根据权利要求1所述的,其特征在 于,所述步骤(1)中的候选差异表达基因的筛选标准包括但不限于癌症和正常组织两倍差 异表达;癌症差异表达基因的筛选标准包括但不限于三例癌症样本支持。6. 根据权利要求1所述的,其特征在 于,所述步骤(2)中的人类蛋白质相互作用网络数据是本领域常用的各种蛋白质相互作用 网络,本专利技术包括但不限于实验证实的蛋白质相互作用网络数据,本领域技术人员也可以 根据本领域常识并结合具体需求选取其他类型的分子相互作用数据。7. 根据权利要求1所述的,其特征在 于,所述步骤(3)中的癌症生物分子网络为在癌症中发生变异的生物分子通过它们之间的 相互作用关系连接而成的网络。8. 根据权利要求1所述的,其特征在 于,所述步骤(4)中的癌症驱动基因的判定,包括但不限于排序的前十位基因。【专利摘要】,包括如下步骤:(1)癌症差异表达基因筛选;(2)癌症生物分子网络构建;(3)基于癌症生物分子网络的基因癌本文档来自技高网...

【技术保护点】
一种基于生物网络的癌症驱动基因的筛选方法,其特征在于,包括如下步骤:(1)癌症差异表达基因筛选:选择一套包含癌症组织和对应正常样本的基因表达谱数据集作为分析基础,使用Fold change方法比较基因在每对癌症组织和正常组织中的表达量差异,将在癌症对正常样本比较中出现两倍及以上表达量差异的基因作为候选差异表达基因集合,然后对此集合进行筛选,将至少有三例以上癌症样本支持的基因作为癌症差异表达基因;(2)癌症生物分子网络构建:整合BIOGRID数据库和HPRD数据库中的人类蛋白质相互作用数据,对蛋白质相互作用的数据进行筛选,筛选标准是:将一篇以上实验文献支持的蛋白质‑蛋白质相互作用关系整理出来,删除不符合前述要求的蛋白质‑蛋白质相互作用关系,使用筛选后的蛋白质‑蛋白质相互作用关系将癌症差异表达基因编码的蛋白连接起来,建立人类癌症生物分子网络;(3)基于癌症生物分子网络的基因癌症驱动力计算:对人类癌症生物分子网络进行拓扑结构分析,计算每个分子与网络中其他分子相互作用的次数,也就是拓扑学理论中的Degree,作为单个分子的癌变基础效力值,此效力值越高,与此分子作用的癌症分子越多,此分子在癌症中的作用越重要,然后使用如下公式计算网络中编码每个蛋白质分子的基因的癌变驱动力:DPi=NCiNPΣj=1nNCjNPDj]]>公式(I)i为癌症生物分子网络中的一个蛋白质;j为癌症生物分子网络中与蛋白质i相互作用的另一个蛋白质;n为癌症生物分子网络中与蛋白质i相互作用的蛋白质总数;DPi为编码癌症生物分子网络中的一个蛋白质i的基因的癌变驱动力值;VCi为发生编码蛋白质i的基因差异表达的癌症样本数目;NCj为发生编码蛋白质j的基因差异表达的癌症样本数目;Dj为蛋白质j的癌变基础效力值,也就是与蛋白质j相互作用的癌症分子总数;NP为整个数据集合所有癌症样本的数目;(4)根据驱动力计算结果排序确定癌症驱动基因:对步骤3计算获得的所有基因的癌症驱动力按照数值大小进行排序;数值越大,排序越高,其作为癌症驱动基因的可能性越高,将排序前十位的基因作为此癌症的驱动基因。...

【技术特征摘要】

【专利技术属性】
技术研发人员:张虎勤何冰刘芳娥杜建强赵静林松刘治镇
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1