当前位置: 首页 > 专利查询>南京大学专利>正文

一种利用网络结构信息识别显著生物通路的方法技术

技术编号:8682999 阅读:228 留言:0更新日期:2013-05-09 02:56
本发明专利技术公开了一种利用网络结构信息识别显著生物通路的方法,包括以下步骤:输入基因芯片数据;将基因芯片中测量的所有基因归属到已知的生物通路集合中;使用网络结构信息计算每条生物通路的差异性;构造随机对照数据,计算随机情况下每条生物通路差异性的分布,并且计算p值;对原始p值进行校正;判断每条生物通路的显著性是否符合阈值要求,如果判断结果为否,则抛弃;如果判断结果为是,则输出识别结果。本发明专利技术方法能够有效识别当生物条件发生变化时被显著影响的生物通路,同时也能从多种角度发现导致这些生物通路发生变化的关键基因和调控路径。

【技术实现步骤摘要】

本专利技术涉及高通量生物芯片基因表达检测方法,特别涉及基因表达谱芯片检测中利用网络结构信息识别被显著影响的生物通路的方法。
技术介绍
高通量技术和组学技术的发展,使得人们可以在系统水平上对生物体内部的分子过程进行检测,从而有助于了解基因及其它生物分子所参与的复杂的相互作用。基因芯片技术被广泛应用于测量基因组水平的基因表达值,从而产生出海量的生物数据,对这些数据的生物意义解读是当前基因芯片技术的一个难点。由于生物系统主要是通过基因与基因之间的相互作用而实现功能,因此,与传统的单基因分析方法不同,基因芯片数据处理的新挑战是如何找出被一组相关基因所影响的生物过程。特定生物过程常用其生物通路来表述,即指一组基因和小分子以化学反应、分子修饰或者信号传导的方式来实现特定生物功能的分子网络。由于生物通路通过基本的基因网络回路来实现特定的生物功能,那么对生物通路的干扰必定导致正常生物系统的紊乱。因此,在特定的生物条件下去寻找显著变化的生物通路能够有助于研究人员把注意力集中到对生物系统最为重要的一组基因上去。但是由于目前寻找显著的生物通路的方法把所有基因视为等同地位,因此在具体应用中还无法达到满意的效果。生物中通路包含着最重要的信息,即,其中的成员基因是如何与其他基因进行相互作用的。很明显对生物通路中关键基因的干扰要比对非关键基因的干扰对整个生物通路的影响更大。生物通路的形式是一个网络或者图,其中包含了节点和边,因此,网络的结构信息对于衡量生物通路的显著性是至关重要的。目前的方法并没有考虑到生物通路的结构信息,因此在实际的应用中对于揭示由于关键基因和关键调控路径所影响的生物通路还存在着很大的不足,无法找到真正起关键作用的生物通路。
技术实现思路
专利技术目的:本专利技术所要解决的技术问题是针对现有技术识别显著生物通路方法的不足,提出一种更加有效的利用网络结构信息的识别显著生物通路的方法,这种方法找到的生物通路能够揭示出其中重要的关键基因和调控路径。技术方案:本专利技术公开了,包括以下步骤:步骤1,输入基因芯片数据,选择基因ID类型;步骤2,整理和使用公共的生物通路数据集,将基因芯片所含基因归属到所属已知的生物通路中;步骤3,使用生物通路的网络结构信息和基因芯片的表达信息计算每条生物通路的差异性总得分;步骤4,构建随机对照数据,计算每条生物通路的显著性,即P值;步骤5,对计算出的P值进行多假设检验的FDR控制,即对原始p值进行校正;步骤6,根据设定的修正后的P值的阈值,判断每条生物通路的显著性是否符合阈值要求,如果判断结果为否,则抛弃;如果判断结果为是,则输出识别结果。本专利技术中,步骤I中,输入的基因芯片数据一般为矩阵格式,其中行对应着基因,列对应着不同的实验样本。基因统一使用Symbol来表不。本专利技术中,步骤2中,使用公共的生物通路数据集,对其中的每一条生物通路,判断基因芯片中的基因是否属于此生物通路。本专利技术中,步骤3中使用生物通路的网络结构信息和基因芯片表达信息计算每条生物通路的差异性具体包括以下步骤:步骤11将生物通路中的基因映射为网络节点;步骤12计算网络中心性指标;步骤13使用基因芯片数据判断网络节点被差异表达影响的程度;步骤14计算生物通路整体差异性的总得分;步骤11中,对生物通路中的每个节点判断其是否包含基因以及所包含基因的数目。步骤12中所述的网络中心性指标一共有三种:a)度:与网络中某个节点直接相连的节点个数,衡量一个基因调控其他基因的个数,按照网络边的方向,度分为入度和出度;b)最短路径中间性:衡量经过一个节点的信息流数量,在网络结构中,衡量起枢纽作用的关键基因,定义为,本文档来自技高网
...

【技术保护点】
一种利用网络结构信息识别显著生物通路的方法,其特征在于,包括以下步骤:步骤(1),输入基因芯片数据,选择基因ID类型;步骤(2),整理和使用公共的生物通路数据集,将基因芯片所含基因归属到所属已知的生物通路中;步骤(3),使用生物通路的网络结构信息和基因芯片的表达信息计算每条生物通路的差异性总得分;步骤(4),构建随机对照数据,计算每条生物通路的显著性p值;步骤(5),对计算出的p值进行多假设检验的FDR控制,即对原始p值进行校正;步骤(6),根据设定的修正后的p值的阈值,判断每条生物通路的显著性是否符合阈值要求,如果判断结果为否,则抛弃;如果判断结果为是,则输出识别结果。

【技术特征摘要】
1.种利用网络结构信息识别显著生物通路的方法,其特征在于,包括以下步骤: 步骤(I ),输入基因芯片数据,选择基因ID类型; 步骤(2),整理和使用公共的生物通路数据集,将基因芯片所含基因归属到所属已知的生物通路中; 步骤(3),使用生物通路的网络结构信息和基因芯片的表达信息计算每条生物通路的差异性总得分; 步骤(4),构建随机对照数据,计算每条生物通路的显著性P值; 步骤(5),对计算出的P值进行多假设检验的FDR控制,即对原始P值进行校正; 步骤(6),根据设定的修正后的P值的阈值,判断每条生物通路的显著性是否符合阈值要求,如果判断结果为否,则抛弃;如果判断结果为是,则输出识别结果。2.据权利要求1所述的一种利用网络结构信息识别显著生物通路的方法,其特征在于,步骤(3)中使用生物通路的网络结构信息和基因芯片的表达信息计算每条生物通路的差异性总得分具体包括以下步骤: (11)将生物通路中的基因映射为网络节点; (12)计算网络中心性指标; (13)使用基因芯片数据判断网络节点被差异表达影响的程度; (14)计算生物通路整体差异性的总得分。3.据权利要求2所述的一种利用网络结构信息识别显著生物通路的方法,其特征在于,步骤(12)中所述的网络中心性指标包括三种中心性值向量: a)度:与网络中某个节点直接相连的节点个数,衡量一个基因调控其他基因的个数,按照网络边的方向,度分为入度和出度; b)最短路径中间性:衡量经过一个节点的信息流数量,在网络结构中,衡量起枢纽作用的关键基因,定义为,4.据权利要求2所述的一种利用网络结构信息识别显著生物通路的方法,其特征在于,步骤(13)所述的使用基因芯片数据判断网络节点被差异表达影响的程度具体包括以下步骤:a)计算节点的表达值向量,如果节...

【专利技术属性】
技术研发人员:顾祖光范垚李捷王进
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1