The present invention relates to a method, a composition and a system for analyzing sequence information from a targeted region of the genome. This target area can include the poor characterization of the genome, the high polymorphism, or the region that deviates from the reference genome sequence.
【技术实现步骤摘要】
【国外来华专利技术】用于靶向核酸序列覆盖的方法相关申请的交叉引用本申请要求2015年4月13日提交的美国临时申请No.62/146,834和2015年2月24日提交的美国临时申请No.62/119,996的权益,所述专利在此出于所有目的以引用的方式整体并入。专利技术背景尽管测序技术取得了显著的进步,但人基因组中的约5%至10%保持未装配、未作图,并且不良表征。参考组装序列(referenceassembly)通常将这些缺少区域注释为多兆碱基异染色质空位。基因组的此缺少部分包括保持对使用通常所用的测序技术进行精确表征的抗性的结构特征。对整个基因组进行从头测序在经济上是不可行的,因此仍然需要降低与基因组测序相关的成本,同时保留大规模基因组分析的益处。专利技术概述因此,本公开提供了用于提供对基因组的所选区域的靶向覆盖以允许对那些所选区域进行从头序列装配,并且在一些方面允许将从头覆盖与基因组的剩余区域的高通量和高精度的重新测序组合的方法、系统和组合物。在一些方面,本公开提供了一种对基因组的一个或多个所选部分进行测序的方法,其中该方法包括以下步骤:(a)提供起始基因组材料;(b)将单独核酸分子从 ...
【技术保护点】
一种用于对基因组的一个或多个所选部分进行测序的方法,所述方法包括:(a)提供起始基因组材料;(b)将单独核酸分子从所述起始基因组材料分布到离散分区中,使得每个离散分区含有单独核酸分子;(c)扩增所述离散分区中的至少一些所述单独核酸分子的所选部分以形成扩增子群;(d)对所述扩增子群进行条形码编码以形成所述扩增子的多个带条形码的片段,其中给定离散分区中的片段各自包含共同条形码,从而将每个片段与其所来源于的所述单独核酸分子关联;(e)从所述多个片段获得序列信息,从而对基因组的一个或多个所选部分进行测序。
【技术特征摘要】
【国外来华专利技术】2015.02.24 US 62/119996;2015.04.13 US 62/1468341.一种用于对基因组的一个或多个所选部分进行测序的方法,所述方法包括:(a)提供起始基因组材料;(b)将单独核酸分子从所述起始基因组材料分布到离散分区中,使得每个离散分区含有单独核酸分子;(c)扩增所述离散分区中的至少一些所述单独核酸分子的所选部分以形成扩增子群;(d)对所述扩增子群进行条形码编码以形成所述扩增子的多个带条形码的片段,其中给定离散分区中的片段各自包含共同条形码,从而将每个片段与其所来源于的所述单独核酸分子关联;(e)从所述多个片段获得序列信息,从而对基因组的一个或多个所选部分进行测序。2.如权利要求1所述的方法,其中所述基因组的一个或多个所选部分包含所述基因组的高度多态性区域。3.如权利要求1-2所述的方法,其中所述基因组的一个或多个所选部分的测序是从头测序。4.如权利要求1-3所述的方法,其中所述扩增包括跨至少3.5兆碱基对(Mb)的区域的PCR扩增。5.如权利要求1-4所述的方法,其中所述扩增包括利用跨至少3.0Mb的区域交错的多个引物对的PCR扩增。6.如权利要求5所述的方法,其中所述多个引物对含有尿嘧啶以防止所述引物序列的扩增。7.如权利要求1-6所述的方法,其中获得步骤(e)包括选自由以下项组成的组的测序反应:短读段长度测序反应和长读段长度测序反应。8.如权利要求7所述的方法,其中所述测序反应是短读段、高精度测序反应。9.如权利要求1-8所述的方法,其中在获得步骤(e)中产生的所述序列信息保留了其来源的单独核酸的分子环境。10.如权利要求1-9所述的方法,其中在所述获得步骤(e)之前,通过以下步骤从所述多个片段进一步富集包含所述基因组的一个或多个所选部分的至少一部分的片段:(i)将与所述基因组的一个或多个所选部分中或附近的区域互补的探针与所述片段杂交以形成探针-片段复合物;(ii)将探针-片段复合物捕获到固体支撑物的表面。11.如权利要求10所述的方法,其中所述固体支撑物包括珠粒。12.如权利要求1-11所述的方法,其中所述方法还包括基于所述多个片段的重叠序列来在推断的重叠群中连接两个或更多个所述单独核酸分子,其中所述推断的重叠群包含至少10kb的长度N50。13.如权利要求12所述的方法,其中所述推断的重叠群包含至少20kb的长度N50。14.如权利要求12所述的方法,其中所述推断的重叠群包含至少40kb的长度N50。15.如权利要求12所述的方法,其中所述推断的重叠群包含至少50kb的长度N50。16.如权利要求12所述的方法,其中所述推断的重叠群包含至少100kb的长度N50。17.如权利要求12所述的方法,其中所述推断的重叠群包含至少200kb的长度N50。18.如权利要求1-17所述的方法,其中所述带条形码的片段的条形码还包括附加的序列区段。19.如权利要求18所述的方法,其中所述附加的序列区段包含选自由以下项组成的组的一个或多个成员:引物、附接序列、随机n聚体寡核苷酸、包含尿嘧啶核碱基的寡核苷酸。20.如权利要求1-19所述的方法,其中所述条形码编码包括附接从至少70万条条形码的文库中选择的条形码。21.如权利要求1-20所述的方法,其中所述离散分区内的所述扩增子的带条形码的片段代表对所述基因组的一个或多个所选部分的约100X-5000X的覆盖。22.如权利要求1-20所述的方法,其中所述离散分区内的所述扩增子的带条形码的片段代表对所述基因组的一个或多个所选部分的约200X-1000X的覆盖。23.如权利要求1-20所述的方法,其中所述离散分区内的所述扩增子的带条形码的片段代表对所述基因组的一个或多个所选部分的至少1000X的覆盖。24.如权利要求1-20所述的方法,其中所述离散分区内的所述扩增子的带条形码的片段代表对所述基因组的一个或多个所选部分的至少2000X的覆盖。25.如权利要求1-20所述的方法,其中所述离散分区内的所述扩增子的带条形码的片段代表对所述基因组的一个或多个所选部分的至少5000X的覆盖。26.一种从基因组样品的一个或多个不良表征的部分获得序列信息的方法,所述方法包括:(a)在离散分区中提供所述基因组样品的单独第一核酸片段分子;(b)将所述离散分区内的所述单独第一核酸片段分子片段化以从所述单独第一核酸片段分子产生多个第二片段;(c)扩增不良表征的所述多个第二片段的所选区域以形成扩增子群;(d)将共同条形码序列附接至每个所述离散分区内的所述扩增子,以使得每个所述扩增子可归属于其所被包含的所述离散分区;(e)鉴定所述扩增子的序列,从而从所述基因组样品的一个或多个不良表征的部分获得序列信息。27.根据权利要求26所述的方法,其中所述扩增包括跨至少3.5兆碱基对(Mb)的区域的PCR扩增。28.如权利要求26-27所述的方法,其中所述扩增包括利用跨至少3.0Mb的区域交错的多个引物对的PCR扩增。29.如权利要求28所述的方法,其中所述多个引物对含有尿嘧啶以防止所述引物序列的扩增。30.如权利要求26-29所述的方法,其中鉴定步骤(e)包括选自由以下项组成的组的测序反应:短读段长度测序反应和长读段长度测序反应。31.如权利要求30所述的方法,其中所述测序反应是短读段、高精度测序反应。32.如权利要求26-31所述的方法,其中所述鉴定步骤(e)保留所述扩增子序列的分子环境,使得所述鉴定进一步包括鉴定来源于所述相同的单独第一核酸片段分子的扩增子。33.如权利要求26-32所述的方法,其中所述方法还包括基于所述多个第二片段的重叠序列来在推断的重叠群中连接两个或更多个单独第一片段分子,其中所述推断的重叠群包含至少10kb的长度N50。34.如权利要求33所述的方法,其中所述推断的重叠群包含至少20kb的长度N50。35.如权利要求33所述的方法,其中所述推断的重叠群包含至少40kb的长度N50。36.如权利要求33所述的方法,其中所述推断的重叠群包含至少50kb的长度N50。37.如权利要求33所述的方法,其中所述推断的重叠群包含至少100kb的长度N50。38.如权利要求33所述的方法,其中所述推断的重叠群包含至少200kb的长度N50。39.如权利要求26-38所述的方法,其中所述条形码序列还包括附加的序列区段。40.如权利要求39所述的方法,其中所述附加的序列区段包含选自由以下项组成的组的一个或多个成员:引物、附接序列、随机n聚体寡核苷酸、包含尿嘧啶核碱基的寡核苷酸。41.如权利要求26-40所述的方法,其中附接步骤(d)包括附接从至少70万条条形码的文库中选择的条形码。42.如权利要求26-41所述的方法,其中每个离散分区内的所述基因组样品包含来自单个细胞的基因组DNA。43.如权利要求26-41所述的方法,其中每个离散分区包含来自不同染色体的基因组DNA。44.如权利要求26-43所述的方法,其中所述离散分区包含乳液中的液滴。45.如权利要求26-44所述的方法,其中在所述鉴定步骤(e)之前,所述扩增子被进一步扩增使得所得扩增产物能够形成部分或完全的发夹结构。46.如权利要求26-45所述的方法,其中所述离散分区内的所述带条形码的扩增子代表对所述基因组的一个或多个不良表征的部分的约100X-5000X的覆盖。47.如权利要求26-45所述的方法,其中所述离散分区内的所述带条形码的扩增子代表对所述基因组的一个或多个不良表征的部分的约200X-1000X的覆盖。48.如权利要求26-45所述的方法,其中所述离散分区内的所述带条形码的扩增子代表对所述基因组的一个或多个不良表征的部分的至少1000X的覆盖。49.如权利要求26-45所述的方法,其中所述离散分区内的所述带条形码的扩增子代表对所述基因组的一个或多个不良表征的部分的至少2000X的覆盖。50....
【专利技术属性】
技术研发人员:M施纳尔莱文,M贾罗什,
申请(专利权)人:一零X基因组学有限公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。