一种预测两种疾病共同致病基因的方法技术

技术编号:14866896 阅读:78 留言:0更新日期:2017-03-20 22:48
本发明专利技术提供了一种预测两种疾病共同致病基因的方法,包括以下步骤:分别收集已知的两种疾病的致病基因,及获取该两种疾病的蛋白作用网络;寻找上述两种疾病的致病基因对应的蛋白在蛋白网络中的位置;基于位置进行基因扩展后从扩展基因中的重叠基因中寻找得到两种疾病的共同致病基因。该方法通过在两种疾病的基因对应的蛋白作用网络图中进行基因扩展,并在扩展基因中的共同基因中选取两种疾病的共同致病基因,并在预测过程中应用了随机游走方法、基因集富集分析法及超几何检验法,使得共同致病基因的选取更加准确。本发明专利技术方法能够预测可能影响到两种疾病的关键驱动基因,可实现精准医疗。

【技术实现步骤摘要】

本专利技术涉及致病基因预测
,特别涉及一种预测两种疾病共同致病基因的方法
技术介绍
目前在疾病治疗及预测领域,有些病患会同时患有一种以上的疾病,这种情况会带给患者极大痛苦,现代精准医学提出疾病诊断和治疗需要了解疾病的遗传物质基础,以开展针对个体遗传差异的诊断和治疗。但现实当中某两种特定的疾病发生在某个个体上的几率是比较低的,而一旦发生带来的疾病负担又是非常重的,例如有研究发现精神分裂症病人患结核病的比率为1.33~2.30%,与2010年第五次全国结核病流调抽样调查报告的普通人群中活动性结核病的患病率459/10万比较,精神分裂症患者这一特殊群体,结核病的患病率为普通人群的2.9~5.5倍。所以如何找到一种方法,能够预测两种疾病的共同致病基因,实现精准医疗,就显得非常关键。现有技术中进行研究两种疾病的共同致病基因的方法主要有:1、基于相互作用网络的致病基因预测方法;2、基于PPI网络的疾病候选基因排名方法;3、基于协同过滤的疾病基因预测方法;4、基于复杂网络的症状基因预测方法等等。这些方法均属于以因果关系推理的方式进行预测的,因而这些方法存在天然的偏倚,且依赖临床病例,推广难度较大。
技术实现思路
本专利技术的目的在于提供一种预测两种疾病共同致病基因的方法,以解决现有技术由于以因果关系推理的方式进行预测所造成的存在偏倚且依赖临床数据推广难度大的问题。本专利技术的第二目的在于提供一种预测两种疾病共同致病基因的方法,以实现找到两种疾病共同的致病遗传物质基础的目标。为实现上述目的,本专利技术提供了一种预测两种疾病共同致病基因的方法,包括以下步骤:S1:分别收集已知的两种疾病的致病基因,及获取该两种疾病的蛋白作用网络;S2:寻找上述两种疾病的致病基因对应的蛋白在所述蛋白网络中的位置;S3:基于所述位置进行基因扩展后从扩展基因中的重叠基因中寻找得到两种疾病的共同致病基因。较佳地,所述步骤S1具体包括:分别选取两种疾病的已知致病基因作为种子基因集a和b,种子基因集a内包含若干个疾病A的种子基因,种子基因集b内包含若干个疾病B的种子基因;所述步骤S2具体包括:根据两种疾病已知的蛋白作用网络绘制以所述种子基因集a和b为核心的蛋白作用网络图;所述步骤S3具体包括:S31:以每个所述种子基因为起点,在所述蛋白作用网络中进行基因扩展以得到扩展基因,并赋予每个所述扩展基因一个分值,所述分值与其所属的扩展基因对应的疾病相关性的强弱相关;S32:将所述扩展基因依据分值大小进行由高到低的排序;S33:从所述排序中的最大值开始依次计算每个扩展基因的加和,如对任意一个扩展基因i,其为种子基因集a中的种子基因扩展得到的,且其计算加和时,加和中包括任意一个种子基因集b的扩展基因,则对扩展基因i进行加分,否则减分;S34:依据分值的预设阈值分别选取加和后的两种疾病的扩展基因;S35:选取步骤S34中得到的两种疾病的扩展基因中的重叠基因;S36:对所述重叠基因进行筛选,得到两种疾病的共同致病基因。较佳地,所述步骤S31中,采用重起始的随机游走方法在所述蛋白作用网络中进行基因扩展以得到扩展基因。较佳地,设任意一个扩展基因j的分值为Vj,若j属于种子基因集a中的种子基因扩展得到的,则每次加和时,加分时得到的分值为减分时得到的分值为若j属于种子基因集b中的种子基因扩展得到的,则每次加和时,加分时得到的分值为减分时得到的分值为其中,N为蛋白作用网络图中所有蛋白/基因的数量,Ga为疾病A的种子基因集a中的基因数量,Gb为疾病B的种子基因集b中的基因数量。较佳地,所述步骤S33中计算每个扩展基因的加和时,采用基因集富集分析法进行计算。较佳地,所述步骤S36中采用超几何学方法计算所述重叠基因及其在蛋白作用网络中相邻基因的p值,依据该p值对重叠基因进行筛选,其中,p值按下式计算:p=Σk=mnMkN-Mn-kNn,]]>N为蛋白作用网络图中所有蛋白/基因的数量,M是共同蛋白/基因数目,n是相邻蛋白/基因的数目,m是相邻蛋白/基因中共同蛋白/基因数目。本专利技术提供的预测两种疾病共同致病基因的方法通过在两种疾病的基因对应的蛋白作用网络图中进行基因扩展,并在扩展基因中的共同基因中选取两种疾病的共同致病基因,并在预测过程中应用了随机游走方法、基因集富集分析法及超几何检验法,使得共同致病基因的选取更加准确。本专利技术方法能够预测可能影响到两种疾病的关键驱动基因,可实现精准医疗,其中两种疾病的类型可为任何已知病症,特别是可为较少发生的病例,只要具备两种疾病分别的基因数据即可。附图说明图1为本专利技术提供的预测两种疾病共同致病基因的方法流程图;图2为本专利技术方法中的寻找得到两种疾病的共同致病基因的方法流程图;图3A为本专利技术优选实施例的以种子基因集为核心的蛋白作用网络示意图;图3B为本专利技术优选实施例的基因扩展后共有基因的蛋白作用网络示意图;图3C为本专利技术优选实施例的找到了两种疾病的共同致病基因的蛋白作用网络示意图。具体实施方式为更好地说明本专利技术,兹以一优选实施例,并配合附图对本专利技术作详细说明,具体如下:如图1所示,为本专利技术提供的预测两种疾病共同致病基因的方法,包括以下步骤S1~S3:S1:分别收集已知的两种疾病的致病基因,及获取该两种疾病的蛋白作用网络;具体包括:分别选取两种疾病的已知致病基因作为种子基因集a和b,种子基因集a内包含若干个疾病A的种子基因,种子基因集b内包含若干个疾病B的种子基因;S2:寻找上述两种疾病的致病基因对应的蛋白在蛋白网络中的位置;具体包括:根据两种疾病A和B已知的蛋白作用网络绘制以种子基因集a和b为核心的蛋白作用网络图。该蛋白作用网络图如图3A所示,该图中包括基因G1~G12共12个基因,分别对应12种蛋白,其中,G2~G4(图中的G2a~G4a)为疾病A所对应的种子基因集a中的种子基因;G11、G12(图中的G11b~G12b)为疾病B所对应的种子基因集b中的种子基因。S3:基于上述的位置在蛋白网络中进行基因扩展后从扩展基因中的重叠基因中寻找得到两种疾病的共同致病基因。如图2所示,步骤S3具体包括:S31:以每个所述种子基因为起点,在上述的蛋白作用网络中进行基因扩展以得到扩展基因,并赋予每个扩展基因一个分值。设分值为V,则该分值V...
一种预测两种疾病共同致病基因的方法

【技术保护点】
一种预测两种疾病共同致病基因的方法,其特征在于,包括以下步骤:S1:分别收集已知的两种疾病的致病基因,及获取该两种疾病的蛋白作用网络;S2:寻找上述两种疾病的致病基因对应的蛋白在所述蛋白网络中的位置;S3:基于所述位置进行基因扩展后从扩展基因中的重叠基因中寻找得到两种疾病的共同致病基因。

【技术特征摘要】
1.一种预测两种疾病共同致病基因的方法,其特征在于,包括以下步骤:
S1:分别收集已知的两种疾病的致病基因,及获取该两种疾病的蛋白作
用网络;
S2:寻找上述两种疾病的致病基因对应的蛋白在所述蛋白网络中的位置;
S3:基于所述位置进行基因扩展后从扩展基因中的重叠基因中寻找得到
两种疾病的共同致病基因。
2.根据权利要求1所述的预测两种疾病共同致病基因的方法,其特征在于,
所述步骤S1具体包括:分别选取两种疾病的已知致病基因作为种子基因
集a和b,种子基因集a内包含若干个疾病A的种子基因,种子基因集b内包
含若干个疾病B的种子基因;
所述步骤S2具体包括:根据两种疾病已知的蛋白作用网络绘制以所述种
子基因集a和b为核心的蛋白作用网络图;
所述步骤S3具体包括:
S31:以每个所述种子基因为起点,在所述蛋白作用网络中进行基因扩展
以得到扩展基因,并赋予每个所述扩展基因一个分值,所述分值与其所属的
扩展基因对应的疾病相关性的强弱相关;
S32:将所述扩展基因依据分值大小进行由高到低的排序;
S33:从所述排序中的最大值开始依次计算每个扩展基因的加和,如对任
意一个扩展基因i,其为种子基因集a中的种子基因扩展得到的,且其计算加
和时,加和中包括任意一个种子基因集b的扩展基因,则对扩展基因i进行加
分,否则减分;
S34:依据分值的预设阈值分别选取加和后的两种疾病的扩展基因;
S35:选取步骤S34中得到的两种疾病的扩展基因中...

【专利技术属性】
技术研发人员:宋月红黄涛蔡雷陈文忠贺林
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1