核酸测序的方法和手段技术

技术编号:1753809 阅读:381 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及核酸测序,特别涉及高密度指纹法(high-density  fingerprinting),其中将一组核酸探针与含有希望获得序列信息的模板的核酸退火,确定模板内是否存在与每个探针互补的序列,由此提供序列信息。使用与模板至少部分相关的参考序列。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及核酸测序。本专利技术特别涉及“高密度指纹法(high-density fingerprinting)”,其中将一组核酸探针与含有希望获得序列信息的模板的核酸退火,确定模板中是否存在与每个探针互补的序列,由此提供序列信息。本专利技术部分基于使用与模板至少部分相关的参考序列,克服了现有测序技术的各种问题,并且使得可以使用标准试剂和仪器在一天内获得非常大量的序列。优选的实施方案可以实现另外的优点。本专利技术还涉及序列分析的算法和技术,以及测序的仪器和系统。本专利技术仅使用本领域易于获得的标准实验室仪器即可使大量测序工作实现自动化。本专利技术包括一组探针在顺序步骤中杂交以确定每个探针是否与模板杂交,由此形成靶的“杂交谱”,其中每个探针均包含一或多个寡核苷酸分子。优选地,调整探针组和模板链的长度以确保任何给定的模板链与“指示探针(indicative probe)”(精确地与模板链杂交一次的探针)的致密覆盖。本专利技术进一步包括将获得的杂交谱与预期含有一或多个与模板链相似的序列的参考数据库进行对比,确定模板链在一或多个参考序列内的可能位置。本专利技术进一步可以比较模板链的杂交谱与在这些位置的预期的杂交谱,从而获得模板链的至少部分序列信息。尽管在基因组研究中使用许多不同方法,但是迄今为止直接测序仍是最有价值的。事实上,如果可以足够高效地进行测序,则基因组学中所有三个主要学术问题(序列确定、基因型分型和基因表达分析)均可以解决。可以对模型物种进行测序,可以通过完整基因组测序而确定个体基因型,及可以通过将RNA群转变为cDNA并进行测序而对其彻底分析(直接计数每个mRNA的拷贝数)。可以通过测序解决的其它学术和医学问题包括外因基因组学(epigenomics)(对基因组中甲基化胞嘧啶进行的研究,通过将未甲基化的胞嘧啶经亚硫酸化转变为尿苷,然后比较所得序列与未转变的模板序列进行)、蛋白质-蛋白质相互作用(通过对在酵母双杂交实验中获得的结果(hit)测序进行)、蛋白质-DNA相互作用(通过对在染色体免疫沉淀之后获得的DNA片段测序进行)及许多其它问题。因此,需要高效DNA测序方法。但是为了代替辅助方法如微阵列和PCR片段分析,需要极高测序通量。例如,活细胞含有大约300,000个拷贝的信使RNA,每个拷贝的平均长度为大约2,000个碱基。因此,为了对甚至一个细胞中的RNA进行完全测序,也需要探查6亿个核苷酸。在由许多不同细胞类型组成的复杂组织中,此任务变得甚至更加困难,因为细胞类型特异性转录体被进一步稀释。为了满足这些要求,需要千兆碱基(Gigabase)日通量。下表示出了对每个实验(指人,除非另有说明)需要的通量的一些估算 本专利技术在合理的成本内达到上述要求。附图简述附图说明图1示出凝胶图像,其示出用CviJ*在逐渐增加的时间内切割cDNA样品的结果(泳道4)。观察到平均片段长度逐步降低,接近于100bp(100bp是在大小标准物中的最小片段,泳道3)。最佳切割反应在泳道1上样,大约100bp的片段被纯化。图2示出衔接物(adapter)连接。泳道1是大小标记,泳道2是未连接的片段,泳道3和4是连接的片段。大多数片段是正确连接的。图3示出在环化之前(泳道1)和之后(泳道2)的片段样品。泳道3示出纯化后的结果。注意在泳道3中没有接头。图4示出使用TecanTMLS400在4μm分辨率使用488nm激光和6FAM滤波器扫描的随机阵列玻片(random array slide)的大约0.8×2.4mm截面。点代表从各个环状模板分子中产生的扩增产物。图5示出通过熔点分析(melting point analysis)测定的短寡核苷酸探针的稳定性图5A示出在100mM tris pH8.0,50mM NaCl中CTAB的作用;图5B示出在TaqExpress缓冲液(GENETIX,UK)中LNA的作用;图5C示出在TaqExpress缓冲液中LNA的特异性。图5D示出导入简并位置的作用具有5LNA的7聚体(7-mer)(左侧),具有5LNA及2个简并位置的7聚体(中间),具有3LNA及2个简并位置的7聚体(右侧)。图6示出与随机阵列杂交并通过荧光显微镜观察的FAM-标记的通用20聚体探针(左侧)和TAMRA-标记的7聚体探针(中间)。阵列是用两个模板合成的,这两个模板均应结合所述通用探针,但应该仅有一个模板在序列CGAACCT处结合所述7聚体探针。图象是使用Nikon DS1QM CCD照相机在Nikon TE2000倒置显微镜下以20×放大率记录的。右手侧示出有色复合物,表明正如所预期的所有TAMRA-标记的部分也是FAM阳性的。DNA测序方法使用荧光双脱氧核苷酸的Sanger测序方法(Sanger et al.PNAS 74no.125463-5467,1977)是最广泛应用的方法,并已经在96-毛细管测序仪、甚至384-毛细管测序仪中成功自动化。然而,这个方法依赖于对大量相应于模板每个碱基位置的片段进行物理分离,并因此不易于超高通量测序(目前最佳的仪器每天可产生大约2百万核苷酸的序列)。序列也可以通过用选自一组探针的探针探查靶多核苷酸而间接获得。通过杂交进行的测序(sequencing-by-hybridization,SBH)使用代表直至某一长度所有可能的序列的一组探针(即一组所有k聚体,其中k由可以安装在微阵列表面上的探针数目限制;对于1百万个探针,可以使用k=10)并且与模板杂交。从探针组中重新构建模板序列很复杂,并且杂交动力学的固有的不可预知性质及对更大的模板进行测序所需的极大数目的探针的组合使得所述重新构建更为困难。即使这些问题可以克服,通量也会较低,因为对于每个模板,一个微阵列需要携带几百万探针,并且所述阵列通常不可重复使用。SBH的另一种方案是将模板置于固体表面上,然后探针组顺序杂交。使用这种方案,可以对许多模板平行测序,但是探针组的大小受方案的连续性限制。结果,只有极短的模板可以被测序。事实上,可以用k聚体探针进行测序的预期长度仅为2k,或者说使用16384个探针(k=7)测序128个核苷酸。根据现实的杂交次数,这种方案不可行。Drmanac et al.Nature Biotech 1998(16)54-8)的作者通过在几百个可以进行平行杂交的单独的膜上复制每个模板而绕开这一问题。然而,这种变通限制了通量,并且对模板制备方法设置了额外的要求。纳米孔测序(Nanopore sequencing)(US Genomics,U.S.Patent6,355,420)利用这样的事实,即当长DNA分子由于压力通过分离两个反应室的纳米孔(nanopore)时,结合的探针可以根据反应室之间的电导率变化而检测到。通过用所有可能的k聚体的亚集修饰DNA,可以推导部分序列。迄今为止,还没有通过纳米孔方案获得完整序列的可行方案,尽管如果其是可能的,理论上可以达到惊人的通量(在30分钟内1个人基因组的级别)。已经设计了各种方案以通过合成进行测序(sequencing bysynthesis,SBS)。为了增加测序通量,希望能观察到在平行的大量模板上每个碱基的掺入,例如在玻璃表面或者类似的反应室上。这通过SBS达到(见例如Mal本文档来自技高网...

【技术保护点】
一种核酸测序方法,包括:提供含有多个环状单链DNA模板分子的DNA样品,每个模板分子均包含一个引物退火序列和一个靶序列;形成一个固定化的和扩增的模板分子的随机阵列,所述阵列如下形成:将所述模板分子与扩增引物接触以与所述引物退火序列退火,从而形成退火的引物/模板复合物,通过滚环扩增方法扩增所述模板分子,通过在与模板退火之前固定扩增引物、在扩增之前固定引物/模板复合物或者在扩增之后固定扩增的模板,确保所述扩增的模板分子固定在一固体支持物上;用一组探针在测试条件下探查串联重复的扩增产物,确定每个探针在测试条件下是否与靶序列杂交,从而获得靶的杂交谱;将所述杂交谱与包含多个参考序列的参考数据库中的参考序列的杂交谱相对比,其中所述参考数据库预期含有一或多个针对所述DNA模板序列的参考序列,从而确定在一或多个参考序列中所述靶序列的可能的一或多个位置;任选地通过对比实际杂交谱与在所述一或多个位置的预期的杂交谱,计算所述靶序列的可能序列和/或与一或多个参考序列对比在所述靶序列的序列中存在的差异。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:斯滕林纳尔松
申请(专利权)人:基尼宗生物科学公司
类型:发明
国别省市:CA[加拿大]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1