【技术实现步骤摘要】
一种基于复杂网络的肿瘤转移关键基因检索方法
本专利技术属于生物信息学
,具体涉及到一种基于复杂网络的肿瘤转移关键基因检索方法。
技术介绍
恶性肿瘤是危害人类健康的全球公共卫生问题之一,其中转移是恶性肿瘤发生和演变过程中最危险的阶段。肿瘤转移是一个多步骤、多阶段、多途径、涉及多基因变化的复杂过程。临床上,60%以上的恶性肿瘤患者在被确诊时已经发生转移,它是导致癌症患者死亡的主要原因之一。生物学研究证明,特定的遗传背景对肿瘤转移有着重要的影响。近年来,从基因组水平筛选与转移表型相关的功能基因已经成为肿瘤转移研究领域的热点,它可以为转移的诊疗提供分子标志和靶点,有利于在基因水平揭示肿瘤转移的本质,为改进肿瘤的诊断方法和治疗手段提供依据。目前,肿瘤转移相关基因的鉴定和验证主要依赖于临床医学及生物实验,需要花费大量的时间和经济成本,限制了发现的能力。随着生物信息学的发展,一些计算方法被应用于致病基因的发现,相对于临床医学与生物实验,计算方法具有高效、低成本的特点。
技术实现思路
针对上述问题,本专利技术提出一种基于复杂网络的肿瘤转移关键基因检索方法,来发现导致肿瘤转移的关键基因集。本专利技术的具体步骤如下:S1,通过从STRING等在线数据库中获取蛋白质相互作用数据,构建PPI(protein-proteininteraction)网络;S2,根据已知的肿瘤转移类型(肿瘤A向肿瘤B转移),从不同数据库中分别收集和整理肿瘤A和肿瘤B的相关基因数据,其集合定义为Sa ...
【技术保护点】
1.一种基于复杂网络的肿瘤转移关键基因检索方法,其特征即具体步骤如下:/nS1,通过从STRING等在线数据库中获取蛋白质相互作用数据,构建PPI(protein-protein interaction)网络;/nS2,根据已知的肿瘤转移类型(肿瘤A向肿瘤B转移),从不同数据库中分别收集和整理肿瘤A和肿瘤B的相关基因数据,其集合定义为S
【技术特征摘要】
1.一种基于复杂网络的肿瘤转移关键基因检索方法,其特征即具体步骤如下:
S1,通过从STRING等在线数据库中获取蛋白质相互作用数据,构建PPI(protein-proteininteraction)网络;
S2,根据已知的肿瘤转移类型(肿瘤A向肿瘤B转移),从不同数据库中分别收集和整理肿瘤A和肿瘤B的相关基因数据,其集合定义为Sa和Sb,并对基因数据进行预处理,使其对应在PPI网络中;
S3,将S2中得到的基因整合作为种子节点,在PPI网络上运行随机游走重启算法,得到网络中每个基因的概率得分,选择概率得分大于10-5的基因,称为RWR基因;
S4,通过置换检验删除p-value值大于0.1的基因,得到的基因称为候选基因;
S5,在PPI网络中选取S4中候选基因之间的相互作用,构建一个局部PPI网络,表示候选基因间的相互关系,并改变该网络的权重;
S6,在S5中的局部PPI网络上搜索Sa中所有基因到Sb中所有基因的最短路径;
S7,根据S6的结果,计算除种子节点外每个节点的介数中心性,选择介数中心性大于0.01的节点对应的基因,这些基因称为肿瘤转移关键基因;
S8,对S7中得到的肿瘤转移关键基因进行富集分析及文献挖掘验证。
2.根据权利要求1所述的一种结合随机游走重启算法和最短路径的计算方法,其特征在于,对于步骤S1,PPI(蛋白质-蛋白质相互作用)是指两个蛋白质分子通过非共价键形成蛋白质复合体的过程,PPI在细胞内和细胞间生化过程中起着重要作用,可用于遗传疾病的研究,其中蛋白质相互作用信息包含了蛋白质之间的物理和功能联系,可以更广泛地表达蛋白质之间的关系,研究证明,PPI中的两种蛋白更有可能具有类似的功能,因此,利用蛋白质相互作用信息构建PPI网络可以检索与肿瘤转移有关的关键基因,PPI网络中节点表示蛋白质,当两个蛋白质之间存在相互作用时,其对应节点之间存在一条连边,边权表示蛋白质之间的置信得分。
3.根据权利要求1所述的一种结合随机游走重启算法和最短路径的计算方法,其特征在于,对于步骤S2,将Sa和Sb中的基因整合并删去重复的基因,得到n个独特的基因作为随机游走算法的种子节点。
4.根据权利要求1所述的一种结合随机游走重启算法和最短路径的计算方法,其特征在于,对于步骤S3,随机游走重启算法是一种经典的排序算法,它从一些种子节点开始,模拟网络中节点的随机游走和重启,在算法的每一步中,节点都以相等的概率移动到其邻居节点,并以一定的概率返回种子节点,经过多次迭代后,算法的结果趋于稳定,根据概率得分对节点进行排名,随机...
【专利技术属性】
技术研发人员:杨天濠,徐晨曦,王子赫,
申请(专利权)人:中国石油大学华东,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。