用于单分子全基因组分析的方法和相关装置制造方法及图纸

技术编号:9547649 阅读:125 留言:0更新日期:2014-01-09 02:39
本发明专利技术提供了沿着至少一个大分子例如线性生物聚合物对特征进行标记和分析的方法,包括沿着单个解折叠的核酸分子对特定序列基序的分布和频率或这些序列基序的化学或蛋白质组修饰状态进行作图的方法。本发明专利技术还提供了沿着这些被标记的大分子来鉴定序列的特征模式或表观遗传变异以用于直接大规模并行单分子水平分析的方法。本发明专利技术还提供了适用于这样被标记的大分子的高通量分析的系统。

【技术实现步骤摘要】
【国外来华专利技术】用于单分子全基因组分析的方法和相关装置与相关申请的交叉参考本申请要求2009年10月21日提交的序号61/253,639的美国申请“用于单分子全基因组分析的方法和相关装置(Methods and Devices for Single Molecule WholeGenome Analysis)”的优先权,所述申请的全部内容在此引为参考。
本专利技术涉及纳米
和单分子基因组分析领域。
技术介绍
大分子例如DNA或RNA是由核苷酸组成的长聚合物链,其线性序列与源生物体的基因组和后基因组基因表达信息直接相关。序列区、基序和功能单元例如开放阅读框(0RF)、非翻译区(UTR)、外显子、内含子、蛋白因子结合位点、表观基因组位点例如CpG簇、microRNA位点、转座子、逆转座子以及其他结构和功能单元的直接测序和作图,在个体的基因组组成和“健康概况”的评估中是重要的。在某些情况下,核苷酸序列的复杂重排,包括片段复制、插入、缺失、倒置和易位,在个体的生命期内引起疾病状态,包括遗传畸变或细胞恶变。在其他情况下,序列差异、拷贝数变异(CNV)和不同个体的遗传构成之间的其他差异,反映出群体遗传构成的多样性和对环境刺激物和其他外部影响例如药物治疗的差异响应。其他进行过程例如DNA甲基化、组蛋白修饰、染色质折叠和改变DNA-DNA、DNA-RNA或DNA-蛋白质相互作用的其他 变化,影响基因调控、表达以及最终细胞功能,引起疾病和癌症。基因组结构变异(SV)甚至在健康个体中也广泛分布。理解基因组序列信息对人类健康的重要性,已变得越来越明显。常规细胞遗传学方法例如核型分析、FISH (荧光原位杂交),提供了对少至单个细胞中基因组组成的全面观察。这些方法揭示了基因组的总体变化,例如非整倍性、数千和数百万碱基对的大片段的获得、丢失或重排。然而,这些方法患于在检测中到小序列基序或病变中灵敏度和分辨率相对低,以及繁琐、速度有限和精确性不一致。更近的用于检测序列区、目标序列基序和SV的方法例如aCGH(阵列比较基因组杂交)、fiberFISH或大规模末端配对测序,具有提高的分辨率和通量。这些更近的方法仍然是间接、繁琐和不一致、昂贵的,并往往具有有限的固定分辨率,依赖于回到参比基因组进行作图以重新装配来提供推断的位置信息,或提供不能揭示平衡病变事件例如倒置或易位的比较性强度比率信息。据认为,功能单元和常见结构变异涵盖从数十碱基至数兆碱基以上的范围。因此,沿着大的天然基因组分子,跨越从不到千碱基(即长度小于约I千碱基)至数兆碱基的分辨率尺度揭示序列信息和SV的方法,在更多个体的测序和精细尺度作图计划中是非常合乎需要的,以便一览以前未表征的基因组特征。此外,生物系统、特别是多倍体生物例如人类的表型多态性或疾病状态,是从母系和父系遗传的两个单倍体基因组之间相互作用的结果。癌症常常是二倍体染色体病变中杂合性丢失的结果。当前的测序分析方法多半基于源自于具有有限单倍型信息的平均化多倍体基因组材料的样品。这大多是由于目前使用的现有前端样品制备方法从非均质细胞群体提取混合二倍体基因组材料、然后将它们破碎成随机的较小碎片所造成的。然而,这种方法破坏了二倍体基因组的天然结构信息。最近开发的第二代测序方法,尽管通量提高,但由于从短得多的测序读出结果进行装配更加困难,因此使勾勒复杂基因组信息进一步复杂化。一般来说,短读出结果更难在复杂基因组内进行唯一比对,需要其他序列信息来破译短的靶区的线性次序。需要25倍量级的测序覆盖度才能达到在常规BAC和鸟枪法Sanger测序中需要8-10倍覆盖率所达到的近似的装配可信度(Wendl MC, Wilson RK,医学DNA 测序中的覆盖度情况(Aspects of coverage in medical DNA sequencing), BMC Bioinformatics 2008 May 16;9:239)。这对测序成本降低提出了进一步挑战,并使将测序成本显著降低至1000美元目标标杆以下的初始主要目标受挫。大的完整基因组分子的单分子水平分析,通过不使用克隆过程或扩增对序列基序进行原位精细作图,提供了保留准确的天然基因组结构的可能性。基因组片段越大,基因组分析物中样品群体的复杂性越低。在理想情形下,只需要对46个染色体片段进行单分子水平分析,就能覆盖整个二倍体人类基因组;从这样的方法得到的序列在其本质上具有完整的单倍型信息。在实践水平上,可以从细胞提取并保存兆碱基基因组片段用于直接分析。这将降低复杂算法和装配的负担,并且也将处于原始背景中的基因组和/或表观基因组信息共同与个体的细胞表型更直接地相关联`。大分子例如基因组DNA常为半柔性蠕虫状聚合链的形式。通常假定这些大分子在自由溶液中具有随机卷曲构型。对于生物溶液中未修饰的dsDNA来说,持续长度(定义其刚性的参数)典型约为50nm。为了实现对沿着大的完整大分子的标记特征进行一致分离以便定量测量,一种方法是将这样的聚合分子在平表面、化学或拓扑学预定的表面模式、优选为长的纳米轨道上或受限的微米/纳米通道上拉伸成一致的线性形式。延长和拉伸长基因组分子的方法,已通过使用外力例如光学镊子、液体-空气边界对流(梳理)或流体力学层流得以演示。分子的拉伸形式将或者在保持外力维持时暂时稳定,或者通过附着到经静电或化学处理修饰被增强的表面上而更持久地稳定。所演示的聚合大分子在微米/纳米通道内的拉伸,已通过物理熵限制被证实(参见Cao等,Applied Phys.Lett.2002a ;Cao等,AppliedPhys.Lett.2002b ;美国专利申请10/484,293号;在此以其全文引为参考)。已显示,直径在IOOnm左右的纳米通道将长达数十万碱基至兆数碱基的dsDNA基因组片段线性化(Tegenfeldt等,Proc.Natl.Acad.Sc1.2004)。使用纳米流体学拉伸的半柔性靶分子可以悬浮在生物离子浓度和PH值范围内的缓冲条件下,因此更适于对这样的分子执行生物功能分析。这种拉伸形式也相对容易操作,例如在电场或压力梯度下,以精确受控方式的从高速度到完全静止状态的大范围速度移动带电荷核酸分子。此外,流体在纳米尺度环境中流动的性质,排除了否则可能打断长DNA分子的湍流和许多剪切力。这对于大分子线性分析、特别是在可以使用ss-DNA的测序应用中,特别有价值。最终,有效读取长度可以只取决于能够维持的最大完整片段。除了基因组学之外,由于在人类疾病例如癌症中的作用,表观基因组学领域也已被认为是非常重要的。随着基因组学和表观基因组学两者知识的积累,主要的挑战在于理解如何将基因组和表观基因组因素直接或间接地与多态性或人类疾病和恶性肿瘤中的病理生理状况相关联。全基因组分析的概念已经从基因组测序、表观遗传学甲基化分析和功能基因组学领域主要分开进行研究的划区方法,演化到更多面的整体方法。已经以更系统的方式考虑了 DNA测序、结构变异作图、CpG岛甲基化模式、组蛋白修饰、核小体重塑、microRNA功能和转录表达谱。然而,检查细胞分子状态的上述每个方面的技术通常是孤立、繁琐和不相容的,使需要相干实验数据结果的系统生物学分析严重复杂化。大的完整天然生物样品的单分子水平分本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2009.10.21 US 61/253,6391.一种对双链DNA样品进行分析的方法,所述方法包含: 对双链DNA样品进行处理以产生从双链DNA样品置换下来的双链DNA样品的第一链的瓣片, 所述瓣片的长度在约I至约1000个碱基的范围内,并且 所述瓣片在双链DNA样品的第一链中产生对应于所述瓣片的间隙; 将一个或多个碱基掺入到双链DNA中,以消除间隙的至少一部分; 用一个或多个标签标记处理过的双链DNA的至少一部分;以及 将一个或多个标记物的位置与所述DNA样品的结构特征相关联。2.权利要求1的方法,其中处理包含使双链DNA的第一链形成切口。3.权利要求2的方法,其中形成切口在双链DNA上的一个或多个序列特异性位置处实现。4.权利要求2的方法,其中形成切口在双链DNA上的一个或多个非特异性位置处实现。5.权利要求2的方法,其中形成切口通过将双链DNA样品暴露于形成切口的内切核酸酶、引起单链断裂的酶、电磁辐射、自由基或其任意组合来实现。6.权利要求1的方法,其中将一个或多个替代碱基掺入双链DNA的第一链包含将双链DNA的第一链与聚合酶、一种或多种核苷酸、连接酶或其任意组合相接触。7.权利要求1的方法,其中瓣片的产生通过聚合酶延伸、一种或多种核苷酸的掺入、反应时间、反应终止物的存在或其任意组合来调节。8.权利要求6的方法,其中聚合酶具有5’至3’置换活性。9.权利要求8的方法,其中聚合酶包含vent外切聚合酶。10.权利要求7的方法,其中一种或多种核苷酸包含dATP、dCTP、dTTP、dGTP或其任意组合。11.权利要求7的方法,其中反应终止物包含ddNTP、acylo-dNTP或其任意组合。12.权利要求1的方法,其中标记通过将至少一种互补的标记探针与瓣片的一部分、DNA第一链的一部分、DNA第二链的一部分或其任意组合相结合来实现。13.权利要求1的方法,其还包含将两种以上互补探针与DNA样品杂交并将所述探针连接在一起。14.权利要求1的方法,其还包含将两种以上互补探针与DNA样品杂交,在所述探针之间有一个或多个碱基的间隙。15.权利要求14的方法,其还包含用一个或多个核苷酸填充间隙的至少一部分。16.权利要求14的方法,其还包含用一个或多个标记的核苷酸填充间隙的至少一部分。17.权利要求15的方法,其中一个或多个核苷酸连接在一起。18.权利要求16的方法,其中一个或多个标记的核苷酸连接在一起。19.权利要求1的方法,其还包含用切口内切核酸酶移除瓣片。20.权利要求1的方法,其还包含拉伸双链DNA样品的至少一部分。21.权利要求1的方法,其还包含将一个或多个瓣片附着到基质上。22.—种从DNA获得结构信息的方法,所述方法包含: 在第一个双链DNA样品上,标记所述第一个样品上的一...

【专利技术属性】
技术研发人员:肖明索梅斯库玛·达斯
申请(专利权)人:生物纳米基因公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1