用于询问功能性基因组区域中序列变异的方法,组合物和计算机软件产品技术

技术编号:1755944 阅读:239 留言:0更新日期:2012-04-11 18:40
一种询问基因变异的方法,包括:    获得多个基因组的功能区,其中功能区包含至少10,000个碱基;    确定多个个体在基因组的功能区中的序列变异。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】,组合物和计算机软件产品的制作方法相关申请本申请要求于2002年11月12日提交的美国临时申请NOs60/425,879和60/425,880的优先权,在此为所有目的引作参考。
技术介绍
本专利技术涉及基因分析,基因组,生物测定和生物信息学。具体而言,在本专利技术的一个方面,为了分析功能区中的基因变异,提供方法,组合物和计算机软件产品。基因组变异的分析(例如,单核苷酸多态性(SNPs),扩增和缺失)可能是有趣生物学的原因,已集中在将确定患病个体基因组中的这些变异的位置和使这些变异与那些区域(例如,编码区和调节区)中所列的注解相关组合在一起。由此,对基因型表型相关性的检索取决于现有的基因组的注解。然而,仍有需要,例如,监控基因组未注解的部分,以便获得基因组的转录活性的无偏覆盖。专利技术概述在本专利技术的一个方面,为了利于检索基因组中功能区中的序列变异(SNPs,扩增,缺失等),无需求助于现有注解,提供方法,组合物和计算机软件产品。在一些实施方案中,RNA转录位点,转录因子结合位点,起点,甲基化和染色质修饰位点等确定在生物样品中。通常,样品可反映各种不同的生理,病理,毒理或药理状态。RNA转录位点,转录因子结合位点,起点,甲基化和染色质修饰位点等赋予这些基因组区域特定的功能,并且把它们归因于分析序列变异存在的优先状态。诸如与具体生物功能相关的区域在本说明书中称为“功能区”。利用各种方法,包括使用高密度寡核苷酸探针阵列可确定功能区。通常,大规模确定序列变异,例如,至少500,1000,5000,10000,或100000个SNPs。例如,当结合或连接研究突出基因组的若干区域作为参与确定患病家族或个体的特征的可能位点时,功能区在这些区域中的存在可凭经验确定,并且缩小进一步分析的可能性。这些区域中的基因组和cDNA序列可凭经验确定,并且优先于其他区域通过测序或SNP测试或比较基因组杂交(CGH)测试而加以分析,所述其他区域对编码区域之外的序列变异是重要的(但不是唯一的)。利用各种不同的方法,包括使用高密度寡核苷酸探针阵列,可对转录因子(TF)结合位点进行检测。在一个实施方案中,受转录结合因子保护的DNA片段利用免疫沉淀获得,并且利用高密度阵列询问,以确定具有与转录结合因子结合的DNA序列的区域。一旦这类功能上重要位点沿基因组在一些个体中制图,这将是有用的,不必对每个患者中的每个因子或功能序列进行类似的免疫沉淀试验。例如,如果若干TFs(例如,cMyc和SP-1)似乎结合于基因组中同样的位点(即,1kb基因组序列),利用全基因组取样分析(WGSA)测试该区域的突变将是有益的。然而,如果沿基因组分散有许多这类普通位点,则找到最少的限制性核酸内切酶(REs)使得查看最大可能数目的位点就会变成优先。WGSA为一种通过获得代表性限制性片段减少基因组样品复杂性的分析。详细描述全基因组取样分析,参见例如,美国专利申请NOs.10/316,517和10/316,629(在此引作参考)。复杂性降低的基因组样品可用于杂交高密度寡核苷酸探针阵列以询问SNPs和进行再测序(序列变异检测)。由于参与细胞的各种功能性操作的序列表是限定的,应检查这些位点是否存在RE位点,所述功能性操作诸如转录因子结合,起点,甲基化和染色质修饰位点。对于具体的功能分类序列(例如,TF结合序列)而言的确如此,最少数目的REs可进行鉴定,从而能跨越基因组对最大数目的这类位点查看在这些序列中是否存在可能的序列变异。因此,本专利技术涉及一种询问基因变异的方法,包括获得多个基因组的功能区,其中功能区包含至少10,000个碱基,以及确定多个个体在基因组的功能区中的序列变异。在具体实施方案中,功能区包括多个转录因子结合位点,多个RNA蛋白结合结构域,多个染色质修饰位点,多个复制起点,和/或多个DNA甲基化位点。在一个实施方案中,所述获得步骤包括利用微阵列,例如高密度寡核苷酸阵列,确定功能区。在一个实施方案中,微阵列包括铺盖(tiling)基因组区域的寡核苷酸探针。在另一实施方案中,所述确定步骤包括确定多个个体的功能区的序列。在另一实施方案中,所述确定步骤包括确定多个个体的功能区的基因型,例如SNP基因型。在另一实施方案中,所述确定步骤包括用至少一种适用于询问至少一种功能区的限制性酶进行WGSA。在一个实施方案中,所述确定步骤包括确定序列拷贝数的变化。在一个实施方案中,功能区包括至少100000个碱基或至少500000个碱基。本专利技术还涉及一种询问基因变异的方法,包括获得至少一个目的基因组区段;获得目的基因组区段内的多个功能区,其中功能区包括至少5,000个碱基;以及确定多个个体在基因组功能区中的序列变异。在一个实施方案中,目的基因组区域通过结合或连接分析加以确定。在一个实施方案中,功能区包括多个转录因子结合位点,多个RNA蛋白结合结构域,多个染色质修饰位点,多个复制起点,和/或多个DNA甲基化位点。在一个实施方案中,所述获得步骤包括利用微阵列,例如高密度寡核苷酸阵列,确定功能区。在一个实施方案中,微阵列包括铺盖基因组区域的寡核苷酸探针。在另一实施方案中,所述确定步骤包括确定多个个体的功能区的序列。在另一实施方案中,所述确定步骤包括确定多个个体的功能区的基因型。在一个实施方案中,基因型为SNP基因型。在一个实施方案中,所述确定步骤包括用至少一种适用于询问至少一种功能区的限制性酶进行WGSA。在一个实施方案中,所述确定步骤包括确定序列拷贝数的变化。附图简述附图并入本说明书中,并形成说明书的部分,举例说明本专利技术的实施方案,以及与说明书一起,用于解释本专利技术的原理附图说明图1示意性表示在基因组中对功能区进行基因定型的典型方法。图2示意性表示在由结合或连接分析所鉴定的区域的功能区中确定序列变异的典型方法。专利技术详述本专利技术优选实施方案的描述如下。现在请详细参照本专利技术的示例性实施方案。尽管本专利技术结合示例性实施方案加以描述,但应理解,它们并不旨在使本专利技术的范围限制在这些实施方案中。相反,本专利技术理应覆盖包含在本专利技术实质和范围内的替代物,修饰和等同物。本专利技术涉及受分子相互作用的性质影响的多种领域,包括化学,生物学,医学和诊断学。本专利技术在快速需要大量信息的环境下尤其是有利的,所述环境诸如临床诊断实验室,或大规模工作,诸如人类基因组计划。本专利技术有许多优选的实施方案,并且依赖于许多专利,申请和详情为本领域技术人员所公知的其他参考文献。因此,当专利,申请或其他参考文献在下文引用或重复时,应理解的是,为所有目的和引用的命题以其全文引作参考。I.通则如本申请所用,单数形式包括复数,除非上下文另有清楚地说明。例如,术语“一种试剂”包括多种试剂,也包括其混合物。个体不限于人类,也可以是其他生物体,包括但不限于哺乳动物,植物,细菌或衍生自任何上述生物体的细胞。贯穿此公开内容,本专利技术的各种不同的方面可以范围形式呈现。应理解的是,范围形式的描述仅仅为了方便和简明,不应解释成对本专利技术范围的硬性限制。因此,范围描述应视为已具体公开了所有可能的子范围以及在此范围内的单个数值。例如,对1-6范围的描述应视为具有具体公开的子范围,诸如1-3,1-4,1-5,2-4,2-6,3-6等,以及范围内的各个数值,例如,1,2,3,4,5,和6。本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:托马斯·R·金杰拉斯
申请(专利权)人:阿菲梅特里克斯公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利