当前位置: 首页 > 专利查询>GNI株式会社专利>正文

应用产生自多重破坏表达文库的基因调控网络的生物发现制造技术

技术编号:2865186 阅读:161 留言:0更新日期:2012-04-11 18:40
本发明专利技术的实施方案包括应用新的推导方法来分析复杂的生物信息,包括基因网络。在一些实施方案中,同时获得生物体中的大量基因的破坏体的数据和/或药物诱导/抑制数据。新方法包括布尔推导方法的改进以及采用这些方法来确定生物体中被表达的基因之间的关系。另外的新方法包括贝叶斯推导方法的改进以及采用那些方法来确定被表达的基因之间的因果关系,以及在一些实施方案中确定被调控基因的上游效应子。贝叶斯方法的其它改进包括使用异质方差和不同的曲线拟合方法,包括样条函数,来提高对被表达基因的网络的结构图的估计。其它实施方案包括使用自举方法和确定边缘效应来更精确地提供被表达基因之间的网络信息。用从先前研究以及新近进行的基因表达研究中获得的信息评价了本发明专利技术的方法。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术实施方案涉及用以阐明基因之间网络关系的方法。这些方法包括布尔逻辑(boolean logic)、贝叶斯估计(Bayesian estimation)、最大似然估计(maximum likelihood analysis)、样条函数(spline function)和其它曲线拟合法,以及用于确定彼此功能相关的各组基因之间的边缘关系(edge relationship)的方法。
技术介绍
从重要的基因组范围的实验数据所阐明的基因调控网络,有助于从观察已知和未知生物功能的基因之间的转录调控事件中发现新的基因功能信息和表达调控事件。旨在阐明基因调控路径的方法先前已经被报道(1,2,3)。这些研究报道的推导网络由来自时程、细胞周期和环境变动的基因表达数据组产生(4,5)。但是,从这些数据组推导得到的控制关系不是建立在用以阐明转录相关的调控控制功能的综合试验数据上,因此受到质疑。为了严格而精确地从全新表达数据组中确定新的、复杂的基因调控网络,结合了基因组删除突变的表达试验与适当计算方法的系统、全面的策略是必需的(6-9)。在建立推导调控网络中尤其重要的是产生推定控制关系的表达试验之间的生物相关性。产生自竞争杂交破坏试验的基因组范围的表达数据具有内部控制和定量测定一种基因存在与否对其它基因表达的直接作用的优点。选择详尽阐明控制关系的破坏试验对于产生有用的基因调控信息是有价值的。总结本专利技术提供用于确定系统中基因之间或者各组基因之间的相互关系的方法,例如确定系统中的基因路径或者基因网络的方法。在一个实施方案中,通过用本专利技术提供的改进的布尔方法(Boolean method)、改进的贝叶斯方法(Bayesian method),或者布尔方法和贝叶斯方法结合分析基因破坏表达图谱(disruption expression profile)来构建基因网络或者基因路径。在另一个实施方案中,通过分析受到试剂如药物作用的基因表达图谱来构建基因网络或者基因路径。还有在另一个实施方案中,通过分析从基因破坏表达图谱和试剂作用表达图谱得到的基因网络或路径来构建受试剂作用的基因网络或基因路径。总之,根据基因文库的表达图谱可以获得基因破坏表达图谱,其中各种基因各自地或者与其它基因一起被破坏,例如与相关功能的其它基因一起被破坏产生表达图谱。例如,可以选择基因文库(例如完整基因组或者根据(PCR)引物等其它标准选择的一系列基因)。无论选择怎样的基因文库,一旦选择,文库中的每个基因可以各自和/或与其它组合被破坏,产生一个文库集合,每个文库含有至少一个被破坏基因和其它未被破坏的基因。这样,如果选择100个基因,得到的文库将由至少101个不同的子文库组成,例如,一个未被破坏的基因或野生型的子文库和至少该100个基因的每个基因的一个破坏体(disruptant)子文库。因此,建立破坏基因的文库,得到各个子文库和整个文库的表达图谱。通过向含有选择基因的系统中加入一种或多种合适的试剂和收集不同剂量和不同试剂加入时间点的基因表达图谱,获得试剂作用表达图谱。有时试剂对基因表达不起作用,而有时起抑制作用(例如降低基因表达)和另些时候试剂增加基因表达(例如,为诱导物)。采用任何适当方法如采用微阵列,可以定量地得到基因表达图谱。在一个实施方案中,基因表达图谱被编成基因表达矩阵,如将基因分成被作用和未被作用的二元素矩阵。在另一个实施方案中,引入等价集合(equivalenceset),其中数据被归一化(normalized),从而揭示基因表达的定量关系。通过等价集合,可以建立基因间相互关联的网络信息。然后可以使用网络来确定基因之间的功能关系。然后利用推导的基因之间的功能关系来预测药物和/或生物效应。这些预测可以用如微阵列试验进行试验性检验。该过程产生所谓基因表达的“最终共同路径”,也就是说,一个基因功能的变化会产生对被改变的基因的“下游”的基因的影响。根据本专利技术的实施方案,利用本专利技术的改进的布尔方法可以分析来自直接被作用基因的“下游”效应。根据本专利技术的另一个实施方案,通过应用本专利技术的改进的贝叶斯方法可以分析被作用基因的“上游”。本专利技术给贝叶斯基因网络分析提供了新方法,其中使用非线性的和/或非参数的回归模型。采用这种方法意味着不需要对因果关系进行任何先验假设,而可以推导因果关系,从而提供“上游”或“初始路径”,通过该“上游”或者“初始路径”,被药物或者处理作用的所观察的基因,将被其上游关系中的其它基因诱导从而改变其表达。本专利技术提供一种改进的检验数(criterion),此处术语“BNRC”用于评估基因网络的贝叶斯结构图(graph)。因此,选择使BNRC检验数最小化的基因关系。在另一个实施方案中,提供其它的不依赖于数据中的高斯(Gaussian)或其它假定方差的新方法。而在一些实施方案中,测定数据的方差,用观察到的方差来影响BNRC检验数。利用这种具有异质误差方差(heterogeneous errorvariance)和相互作用(interaction)的非参数回归,可以优化所得到的数据的曲线拟合和预测需要多少试验来获得具有期望方差的数据。使用这些方法,可以获得具有期望精确度和可信度的并且提供上、下游效应的基因网络信息。在一些实施方案中,新的贝叶斯模型和所罚最大似然估计(penalizedmaximum likelihood estimation)(PMLE)得到相似结果。另外还有一些实施方案中,通过一种基因表达结构图和另一种基因表达的比较分析,可以阐明这两种基因的关系。这些结构图可能是线性或者非线性的。在一些实施方案中,采用线性样条函数、B-样条函数(B-splines)、傅立叶变换(Fourier transforms)、小波变换(wavelet transforms)或者其它基本函数来表征关系。有时,适宜应用B-样条函数。确定特定基因和系列基因对于调控其它基因是否重要是十分有用的。但是,在一些情况下,数据中的无关值(outlier)使结果解释复杂化。当无关值接近整个网络的基因群的边界时,这个问题尤其麻烦。因此,在一些实施方案中,可以阐明边界效应,在其中确定边缘强度(dege intensity)和贝叶斯因果关系方向(direction of Bayes causality)的置信度。在另一些实施方案中,用线性样条函数确定基因表达的时程(time-course)。采用样条函数比相对不灵敏的现有技术“倍数-变换”(fold-change)能更加可靠地分析时间排序数据。利用一种或多种上述常规方法,本专利技术提供有用的基因网络信息并用一些已知的酵母基因组结果进行验证。然而,这些方法可以广泛应用于任何基因网络(如“转录子组”(transcriptome))和蛋白质水平的相互作用(“蛋白质组”(proteome))。因此,利用一种或多种这样的新方法,本专利技术人已经确定与抗真菌治疗相关的功能性基因间的新关系。因此,应用本专利技术的方法,可以预测基于对基因表达的起始和最终共同路径的了解的假定治疗靶点。附图简述用特别实施方案描述本专利技术,其中附附图说明图1描述本专利技术基于模型的相互作用的生物发现的原理图。附图2描述用本专利技术的布尔方法构建基因调控子网络模型。附图2A描本文档来自技高网...

【技术保护点】
一种构建基因网络的方法,包括步骤:(a)给机体的一组基因提供定量破坏体数据文库,所述文库包括基于破坏所述组基因中的每个基因的表达结果,量化平均效应和每种破坏对每个其它所述基因的可变性测定结果;(b)从所述文库构建基因表达矩阵 ;(c)生成所述基因之间的网络关系;和(d)确定是否一组或多组基因表达区别于其它所述组基因的表达。

【技术特征摘要】
US 2001-9-26 60/325,016;US 2001-11-29 60/334,372;U1.一种构建基因网络的方法,包括步骤(a)给机体的一组基因提供定量破坏体数据文库,所述文库包括基于破坏所述组基因中的每个基因的表达结果,量化平均效应和每种破坏对每个其它所述基因的可变性测定结果;(b)从所述文库构建基因表达矩阵;(c)生成所述基因之间的网络关系;和(d)确定是否一组或多组基因表达区别于其它所述组基因的表达。2.权利要求1的方法,还包括步骤(e)提供一种贝叶斯计算模型,其中所述贝叶斯模型包括最小化BNRC检验数。3.权利要求2的方法,其中所述最小化BNRC检验数的步骤包括采用非线性曲线拟合方法,该方法选自多项式函数、傅立叶级数、小波函数、回归样条函数或B-样条函数。4.权利要求1的方法,其中所述数据文库是用药物改变基因表达而建立的。5.权利要求2的方法,其中所述最小化所述BNRC检验数的步骤还包括用修合算法选择贝叶斯模型。6.权利要求2的方法,其中所述最小化所述BNRC检验数的步骤还包括使用Akaike信息检验数。7.权利要求2的方法,其中所述最小化所述BNRC检验数的步骤还包括使用最大似然估计。8.权利要求1的方法,其中所述基因与细胞周期有关。9.权利要求2的方法,其中所述可变性测定结果是变量。10.权利要求3的方法,其中所述非线性曲线拟合方法是一种非参数方法。11.权利要求10的方法,其中所述用于最小化BNRC检验数的非参数方法包括使用异质误差方差。12.权利要求11的方法,其中所述最小化BNRC检验数的步骤还包括以下步骤(1)生成分值矩阵,其第(i,j)个元素是结构图基因i→基因j的BNRCjhetero的分值;(2)实施一个或多个增加、去除和反转而产生最小的BNRChetero;和(3)重复步骤2直到BNRChetero不再进一步减小。13.权利要求11的方法,其中所述最小化BNRC检验数的步骤还包括使用爬山算法来最小化BNRC(j)hetero。14.权利要求11的方法,其中用自举方法来确定边缘强度。15.权利要求14的方法,其中所述自举方法包括步骤(1)通过从原始基因文库表达数据中多次随机取样并置换,产生自举基因表达矩阵;(2)评估基因i和基因j的基因网络;(3)重复步骤(1)和(2)T次,从而生成T个基因网络;和(4)用(t1+t2)/T计算基因i和基因j之间的自举边缘强度。16.一种阐明基因网络的方法,包括步骤(a)给机体众多基因提供时程基因表达数据的原始数据库;(b)从所述原始数据库中减去背景信号强度;(c)对所述众多基因中的每一个计算基因表达的相对变化;(d)用Student t-检验分析所述基因表达的相对变化的统计学显著性;(e)将基因表达中的所述变化拟合成线性样条函数。17.权利要求16的方法,还包括从考虑中去除其表达水平极低以至于主要由噪声确定的那些基因的步骤。18.权利要求1的方法,其中所述分组步骤包括将所述基因分成一个或多个等价集合。19.一种评估基因网络关系和优化所述关系的超级参数的方法,包括步骤(1)确定超级参数pj;(2)初始化γjk=0,k-1,...,qj;(3)重复步骤3-1和步骤3-2寻找最佳βjk;(3-1)计算γjk=(BTjkWjkBjk+nβjkKjk)-1BTjkWjkx(x(j)-∑Bjk′γjk′)k′≠k来确定βjk,(3-2)针对候选的βjk值重复步骤3-1,选择使BNRChetero最小化的最佳βjk值;(4)以k=1,...,qj,1,...,qj,1,...重复步骤3直到满足合适的收敛检验数;和(5)针对候选的pj值重复步骤1到4,并选择使BNRChetero最小化的最佳pj值。20.一种构建含基因网络的系统的基因网络模型的方法,包括使用贝叶斯计算模型,其中贝叶斯计算模型包括最小化BNRC检验数。21.权利要求20的方法,其中最小化BNRC检验数包括采用非线性曲线拟合方法,该方法选自多项式函数、傅立叶级数、小波函数、回归样条函数或B-样条函数。22.权利要求20的方法,其中最小化BNRC检验数包括用修合算法选择贝叶...

【专利技术属性】
技术研发人员:井元清哉后藤多嘉绪官野悟田代康介米歇尔德胡恩克里斯托弗J萨瓦久原哲
申请(专利权)人:GNI株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利