条形码序列和有关系统与方法技术方案

技术编号:17816478 阅读:42 留言:0更新日期:2018-04-28 07:43
本发明专利技术提供了样本鉴定的方法、系统和套件,具体而言,提供了样本区分码的设计和/或制作和/或使用的方法、系统和套件,用于鉴定样本核酸或其它生物分子或聚合物。例如,可生成多个流空间码字,所述码字由一串字符组成。可确定所述流空间码字内至少一个填充字符的位置。可将所述填充字符插入所述流空间码字的确定位置。插入后,在满足预定最小距离准则的基础上,可选定多个流空间码字,其中,所选码字按预定流序对应于有效的碱基空间序列。并可制备对应于所选码字的条形码序列。

【技术实现步骤摘要】
【国外来华专利技术】条形码序列和有关系统与方法优先权本申请书主张62/161,309号美国临时专利申请中的权益,该临时专利申请于2015年5月14日提交,并通过整体引用而成为本文的一部分。序列表本申请含有序列表,所述序列表已经以ASCII格式以电子方式提交并且以全文引用的方式并入本文中。创建于2016年5月12日的所述ASCII拷贝的名称为LT01016_SL.txt且大小为18,815个字节。领域本公开一般涉及样本鉴定的方法、系统和套件,具体涉及样本区分码或样本区分条形码的设计和/或制作和/或使用的方法、系统和套件,所述样本区分码或样本区分条形码被用于鉴定样本核酸或其它生物分子或聚合物。
各仪器、装置和/或系统采用边合成边测序的方式进行核酸测序,例如包括基因组分析仪/HiSeq/MiSeq平台(Illumina公司;例如参见美国专利6,833,246号和5,750,341号);GSFLX、GSFLXTitanium和GSJunior平台(罗氏/454生命科学公司;例如参见Ronaghietal.,SCIENCE,281:363-365(1998)和Marguliesetal.,NATURE,437:376-380(2005));以及IonPGMTM测序仪和IonProtonTM测序仪(生命科学公司/IonTorrent;例如参见美国专利7,948,015号和美国专利申请公开说明书2010/0137143号、2009/0026082号和2010/0282617号,这些专利均通过整体引用的方式并入本文作为参考)。为增加测序通量和/或降低边合成边测序(和其它测序方法,诸如边杂交边测序、边连接边测序等)的成本,需要新的方法、系统、可机读介质和套件需允许高效制备和/或鉴定可能高度复杂的样本。专利技术概述本公开一般涉及样本鉴定的方法、系统和套件,具体涉及样本区分码或样本区分条形码的设计和/或制作和/或使用的方法、系统和套件,所述样本区分码或样本区分条形码被用于鉴定样本核酸或其它生物分子或聚合物。一个实施例提供了一种方法,用于设计与流空间码字对应的条形码序列。可生成多个由一串字符组成的流空间码字。可确定所述流空间码字内至少一个填充字符的位置。可将所述填充字符插入所述流空间码字的确定位置。插入后,在满足预定最小距离准则的基础上,可选定多个流空间码字,其中,所选码字按预定流序对应于有效的碱基空间序列。并可制备对应于所选码字的条形码序列。若干实施例中,在插入填充字符后,按预定流序至少可过滤一个码字,包括一个无效碱基空间平移。若干实施例中,所选码字全体包括一个符合预定最小距离准则的容错码。若干实施例中,流空间码字内的填充字符的位置确定还可包括在码字内该填充字符的多个位置迭代。此外,每次迭代时,可计算按预定流序对应于某一有效碱基空间序列的码字的数量。然后可在所述多个位置中选定对应于某一有效碱基空间序列的码字的计算数量最高的位置。若干实施例中,流空间码字内的填充字符的位置确定还可包括,每次迭代时确定对应于流空间码字的碱基空间序列,当把该填充字符插入到所述码字的迭代位置处后,所述碱基空间序列对应于有效碱基空间序列。每次迭代时,根据所定序列的至少一个长度准则,可过滤所定的碱基空间序列。并可计算过滤后迭代位置的有效碱基空间序列的数量。若干实施例中,每次迭代时的过滤还包括,根据核苷酸百分含量准则,过滤所定的碱基空间序列。若干实施例中,插入至少一个填充字符后,容错码的码字在流空间内同步。若干实施例中,生成的流空间码字包括码字间的一个初始距离,如此使得所选码字间的最小距离大于所生成的码字间的最小距离。插入填充字符后,可保持码字间的该初始距离。若干实施例中,多个码字的选择还包括码字分组,如此使得各组内的码字间的组内最小距离由一个第一值构成,且不同组间的码字组外最小距离由一个第二值构成,第一值大于第二值。若干实施例中,可确定所选码字的一个子集,包含一个不表示合并的终止流。可制得对应于所选码字子集的条形码序列子集,如此使得根据不表示合并的码字子集所对应的终止流,选定所述条形码序列子集的一个接头。若干实施例中,条形码序列的制备还包括给该条形码序列附加一系列关键碱基,其中,对于此条形码序列的首段,所附加的关键碱基以一个重复碱基终止。例如,首段可包含一半的条形码序列。若干实施例中,对于条形码序列的第二段,所附加的关键碱基可由一个非重复碱基终止。若干实施例中,所选码字全体包含一个容错码,由码字间的最小距离构成,如此使得对应于所选码字的所制条形码所附加的终止关键碱基的变化增大码字间的最小距离。一个实施例提供了一种方法,用于对包含条形码序列的多核苷酸样本进行测序。多个条形码中至少有若干可并入多个目标核酸中,形成多核苷酸,其中,多个条形码的设计使得这些条形码按某一预定流序对应于某一流空间码字,该流空间码字由一个或多个容错码组成,且所述多个条形码至少包括1000个条形码。按照预定流序,在多核苷酸中,可引入一系列核苷酸。由于往目标核酸中引入核苷酸,可获得一系列信号。该系列信号可在条形码范围内解析,呈递流空间字符串,使得所呈递的流空间字符串匹配码字,其中,在存在一个或多个错误的情况下,至少一个呈递的流空间字符串匹配至少一个码字。若干实施例中,在存在一个或多个错误的情况下,至少匹配一个流空间码字的至少一个呈递的流空间字符串被用于鉴定从多个目标核酸序列之一所获得的信号,关联于对应所匹配流空间码字的码字。若干实施例中,提供了一个与核酸测序仪器配套的使用套件。该套件可由多个符合以下准则的条形码序列组成:按某一预定流序,条形码序列对应于流空间码字,如此使得所对应的码字包括最小距离至少为三的一个容错码;该条形码序列的长度位于某一预定长度范围内;该条形码序列在流空间里同步;且所述多个条形码序列至少是500个不同的条形码序列。若干实施例中,所述多个条形码序列至少是1000个不同的条形码序列。附图简略说明并入到说明书中并且形成说明书的一部分的随附图式说明一个或多个示例性实施例并且用以解释各个示例性实施例的原理。附图仅是示例性和解释性的,并且不应解释为以任何方式限制或约束。图1为说明某一示例性核酸测序系统的组件的框图。图2A说明了某一示例性核酸测序流通池的横截面视图和详细视图。图2B说明了流过一个示例性反应室阵列一部分的连续试剂之间的一个示例性均匀流锋。图3说明了一个示例性无标记、基于pH的测序过程。图4为说明一个用于获取、处理和/或分析多重核酸测序数据的示例性系统的框图。图5显示一个表示可实现碱基响应的信号的示例性电离图。图6A和6B演示了一个碱基空间序列与一个流空间矢量之间的关系。图7说明了一个用于设计对应于流空间码字的条形码序列的示例性方法。图8说明了一个用于测序含有一个条形码序列的多核苷酸样本的示例性方法。图9说明了一组各不相同的多核苷酸链,各链均有一个唯一的条形码序列。图10A-10C说明了一个用于制备一个多重样本的示例性工作流程。图11说明了一个包含一个条形码序列的示例性微珠模板。图12说明了另一个包含一个条形码序列的示例性微珠模板。详细说明以下说明和本文件所述的各种实施例仅是示例性和解释性的,并且不应理解为以任何方式限制或约束。通过说明书、附图和权利要求,本资料的其它实本文档来自技高网...
条形码序列和有关系统与方法

【技术保护点】
用于设计对应于流空间码字的条形码序列的方法,包括:生成多个流空间码字,所述码字包含一串字符;确定位于所述流空间码字内的至少一个填充字符的位置;在所确定位置将所述填充字符插入所述流空间码字;插入后,根据满足预定最小距离准则选择多个流空间码字,其中,所选码字按预定流序对应于有效碱基空间序列;以及制备对应于所选码字的条形码序列。

【技术特征摘要】
【国外来华专利技术】2015.05.14 US 62/161,3091.用于设计对应于流空间码字的条形码序列的方法,包括:生成多个流空间码字,所述码字包含一串字符;确定位于所述流空间码字内的至少一个填充字符的位置;在所确定位置将所述填充字符插入所述流空间码字;插入后,根据满足预定最小距离准则选择多个流空间码字,其中,所选码字按预定流序对应于有效碱基空间序列;以及制备对应于所选码字的条形码序列。2.根据权利要求1所述的方法,还包括,插入后,过滤至少一个码字,包括按所述预定流序进行无效碱基的空间平移。3.根据权利要求1所述的方法,其中,所选码字全体包含符合所述预定最小距离准则的容错码。4.根据权利要求3所述的方法,其中,确定所述填充字符在所述流空间码字内的位置,还包括:在所述填充字符在所述流空间码字内的多个位置处迭代;每次迭代时,计算按所述预定流序对应于有效碱基空间序列的码字的数量;以及在所述多个位置中选择对应于有效碱基空间序列的码字的计算数量最高的位置。5.根据权利要求4所述的方法,其中,确定所述填充字符在所述流空间码字内的位置,还包括:在所述迭代位置将所述填充字符插入所述码字后,确定对应于所述流空间码字的每次迭代的碱基空间序列,所述流空间码字对应于有效碱基空间序列;每次迭代时,根据针对所确定序列的至少一个长度准则,过滤所确定的碱基空间序列;以及过滤后,计算所迭代位置处的有效碱基空间序列的数量。6.根据权利要求5所述的方法,其中,每次迭代时的过滤还包括:根据核酸百分含量准则,过滤所确定的碱基空间序列。7.根据权利要求4所述的方法,其中,至少插入一个填充字符后,所述容错码的码字在流空间内同步。8.根据权利要求3所述的方法,其中,所生成的流空间码字包括码字间的初步距离,这使得所选码字间的最小距离大于所生成的码字间的最小距离。9.根据权利要求8所述的方法,其中,在插入所述填充字符后,保持所述码字间的初步距离。10.根据权利要求9所述的方法,其中,选择多个码字还包括:将所述码字分组,这使得组内的码字间的组内最小距离包括第一值,而不同组间的码字的组外最小距离包括第二值,所述第一值大于所述第二值。...

【专利技术属性】
技术研发人员:C科勒MD艾伦
申请(专利权)人:生命科技公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1