包含聚合物单元的聚合物的分析制造技术

技术编号:10462811 阅读:105 留言:0更新日期:2014-09-24 16:19
在聚合物(3)例如DNA中的聚合物单元的序列由涉及聚合物的至少一个测量的系列例如作为移位通过纳米孔(1)的函数的离子电流来估计,其中每个测量值取决于k聚体,所述k聚体是k个聚合物单元(4)的组。提供了尤其是隐马尔可夫模型(HMM)的概率模型,对于一组可能的k聚体,所述模型包括:表示从起源k聚体到目标k聚体的过渡的机会的过渡权重;以及表示观测k聚体的测量的给定值的机会的关于每个k聚体的发射权重。利用参考模型的分析技术例如维特比解码来分析测量的系列,并基于通过由聚合物单元的序列产生的测量的系列的模型所预测的似然来估计在聚合物中的聚合物单元的至少一种估计的序列。在进一步的实施方式中,在移位期间跨越纳米孔施加不同的电压以便改善聚合物单元的分辨力。

【技术实现步骤摘要】
【国外来华专利技术】包含聚合物单元的聚合物的分析 本专利技术总体上涉及通过进行涉及聚合物的测量来分析包含聚合物单元的聚合物 例如但不限于多核苷酸的领域。本专利技术的第一方面特别涉及在聚合物中聚合物单元的序列 的估计。本专利技术的第二和第三方面涉及在聚合物的移位期间测量流过纳米孔(nanopore) 的离子电流,用于聚合物的分析。 存在许多类型的测量系统,其提供聚合物的测量,用于分析聚合物和/或确定聚 合物单元的序列的目的。 例如但不限于,一种类型的测量系统采用聚合物通过其移位的纳米孔。系统的一 些性能取决于在纳米孔中的聚合物单元,并进行上述性能的测量。例如,可以通过将纳米孔 放置在绝缘膜中并在有分析物分子存在的条件下测量通过纳米孔的电压驱动的离子转运 来产生测量系统。取决于纳米孔的特性,通过它的独特的离子电流特征,可以揭示分析物的 同一'丨生(特性,identity),尤其是电流单元(current block)的持续时间和程度以及电流 水平的变化。上述类型的使用纳米孔的测量系统大有前途,尤其是在多核苷酸如DNA或RNA 的测序领域,并且一直是最近很大发展的主题。 在广泛的应用范围内,目前需要快速和廉价的核酸(例如DNA或RNA)测序技术。 现有技术是缓慢和昂贵的,主要是因为它们依靠扩增技术来产生大量的核酸并需要大量的 用于信号检测的专门荧光化学物质。通过减少所需要的核苷酸和试剂的量,纳米孔检测有 可能提供快速和廉价的核酸测序。 本专利技术涉及一种情况,其中每个测量的值取决于k个聚合物单元的组,其中k是正 整数(即'k聚体')。 此外,典型的是,用于每个测量的值的许多类型的测量系统,包括大多数目前已知 的生物纳米孔,是取决于k聚体,其中k是复整数(plural integer)。这是因为,多于一个 的聚合物单元有助于观测到的信号并且可以概念上被认为是具有大于待测量的聚合物单 元的钝性读出头的测量系统。在这样的情况下,待解析的不同k聚体的数目增加到k的 乘方。例如,如果存在η个可能的聚合物单元,则待解析的不同k聚体的数目是n k。虽然 期望的是,在不同k聚体的测量之间具有清晰的分离,但常见的是,这些测量的一些是重叠 的。尤其是在k聚体中聚合物单元的高数目(即k的高值)的情况下,可以变得难以解析 由不同k聚体产生的测量,从而不利于导出关于聚合物的信息,例如聚合物单元的基本序 列的估计。 因此,许多开发工作一直是针对可以改善测量的分辨率的测量系统的设计。这在 实际测量系统中是困难的,这是由于测量的变化,其可以在不同程度上由基本物理或生物 系统的内在变化和/或由于待测量性能的较小幅度不可避免的测量噪声产生。 许多研究已旨在测量系统的设计,上述测量系统提供可分辨的测量,其取决于单 个聚合物单元。然而,这在实践中已被证明是困难的。 其它工作已接受取决于k聚体的测量,其中k是复整数,但已旨在设计这样的测量 系统,其中来自不同k聚体的测量是彼此可分辨的。然而,实际限制再次意味着这是非常困 难的。由一些不同k聚体产生的信号的分布经常可以重叠。 原则上,也许可以结合来自k个测量的信息,其中k是复整数,其各自部分地取决 于相同的聚合物单元以获得在聚合物单元的水平上被解析的单值。然而,这在实践中是困 难的。首先,这依赖于确定适宜的变换以变换一组k个测量的可能性。然而,对于许多测量 系统,由于在基本物理或生物系统中相互作用的复杂性,这样的变换并不存在或对其加以 确定是不切实际的。其次,即使对于给定测量系统而言这样的变换可以原则上存在,但测量 的变化使得这种变换难以确定和/或变换仍可能提供不能彼此加以解析的值。第三,借助 于这样的技术,难以或不可能考虑到错过的测量,即其中取决于给定k聚体的测量在聚合 物单元的序列中失去,如在实际测量系统中有时可以是这种情况,例如由于测量系统未能 进行测量或由于在随后数据处理中的错误。 本专利技术的第一方面涉及提供这样的技术,其改善由取决于k聚体的这种测量来估 计在聚合物中聚合物单元的序列的准确性。 按照本专利技术的第一方面,提供了用于由涉及聚合物的至少一个测量的系列来估计 在聚合物中聚合物单元的序列的方法,其中每个测量的值取决于k聚体,k聚体是k个聚合 物单元的组,其中k是正整数,上述方法包括: 提供模型,对于一组可能的k聚体所述模型包括: 过渡权重(transition weightings),其表示从起源k聚体(起点k聚体,origin k-mers)到目标 k聚体(目的 k聚体,destination k-mers)的过渡(转变,transitions) 的机会(chances),以及 关于每个k聚体的发射权重(emission weightings),其表示观测k聚体的测量的 给定值的机会;以及 利用其指的是模型的分析技术来分析测量系列,并基于通过由聚合物单元的序列 产生的测量系列的模型所预测的似然(可能性,likelihood)来估计在聚合物中的聚合物 单元的至少一种估计的序列。 进一步根据本专利技术的第一方面,提供了实施类似方法的分析设备。 因此,本专利技术的第一方面利用了产生测量的测量系统的模型。给定任何测量系列, 模型表示已产生那些测量的k聚体的不同序列的机会。本专利技术的第一方面特别适合于这样 的情况,其中每个测量的值取决于k聚体,其中k是复整数。 上述模型考虑可能的k聚体。例如,在聚合物中,其中每个聚合物单元可以是4个 聚合物单元(或者更一般地η个聚合物单元)的一个,存在4 k种可能的k聚体(或者更一 般地nk种可能的k聚体),除非任何特定的k聚体物理上并不存在。对于可以存在的所有 k聚体,发射权重考虑到观测测量的给定值的机会。关于每种k聚体的发射权重表示观测k 聚体的测量的给定值的机会。 过渡权重表示从起源k聚体到目标k聚体的过渡的机会,因此,考虑到k聚体的机 会,在不同k聚体之间的过渡的测量取决于上述k聚体。因此过渡权重可以考虑到更多和 更少可能的过渡。通过举例的方式,其中k是复整数,对于给定起源k聚体,这可以表示与 非优选过渡相比优选过渡的更大的机会,所述优选过渡是到具有其中第一(k-Ι)聚合物单 元是起源k聚体的最后(k-Ι)聚合物单元的序列的目标k聚体的过渡,所述非优选过渡是 到具有不同于起源k聚体以及其中第一(k-Ι)聚合物单元不是起源k聚体的最后(k-Ι)聚 合物单元的序列的目标k聚体的过渡。例如,对于其中聚合物单元是天然存在的DNA碱基 的3聚体,状态CGT具有到GTC、GTG、GTT和GTA的优选过渡。通过举例而非限制性地,模型 可以是其中过渡权重和发射权重是概率(probabilities)的隐马尔可夫模型。 这允许利用指的是模型的分析技术来分析测量系列。基于通过由聚合物单元的序 列产生的测量系列的模型所预测的似然来估计在聚合物中的聚合物单元的至少一种估计 的序列。例如但不限于,分析技术可以是概率技术。 尤其是,来自单独k聚体的测量不需要是彼此可分辨的,并且并不需要存在从取 决于相同聚合物单元的k个测量的组到关于变换的值的变换,即观测到的状态的组并不需 要是较小数目的参数的函数(虽然这并不被排除)。相反,上述模型的使用可以提供准确估 计,其中通过在考虑通过聚合物单元的序列产生的测量系列的模型所预本文档来自技高网...
包含聚合物单元的聚合物的分析

【技术保护点】
一种由涉及聚合物的至少一个测量的系列来估计所述聚合物中的聚合物单元的序列的方法,其中,每个测量的值取决于k聚体,所述k聚体是k个聚合物单元的组,其中k是正整数,所述方法包括:提供模型,对于一组可能的k聚体,所述模型包括:过渡权重,所述过渡权重表示从起源k聚体到目标k聚体的过渡的机会,和关于每个k聚体的发射权重,所述发射权重表示观测该k聚体的测量的给定值的机会;以及利用参考所述模型的分析技术来分析所述测量的系列并且基于通过由聚合物单元的序列产生的所述测量的系列的模型所预测的似然来估计所述聚合物中的聚合物单元的至少一种估计的序列。

【技术特征摘要】
【国外来华专利技术】2011.09.23 US 61/538,721;2012.03.30 US 61/617,8801. 一种由涉及聚合物的至少一个测量的系列来估计所述聚合物中的聚合物单元的序 列的方法,其中,每个测量的值取决于k聚体,所述k聚体是k个聚合物单元的组,其中k是 正整数,所述方法包括: 提供模型,对于一组可能的k聚体,所述模型包括: 过渡权重,所述过渡权重表示从起源k聚体到目标k聚体的过渡的机会,和 关于每个k聚体的发射权重,所述发射权重表示观测该k聚体的测量的给定值的机会; 以及 利用参考所述模型的分析技术来分析所述测量的系列并且基于通过由聚合物单元的 序列产生的所述测量的系列的模型所预测的似然来估计所述聚合物中的聚合物单元的至 少一种估计的序列。2. 根据权利要求1所述的方法,其中,所述过渡权重和所述发射权重中的至少一种包 含非二进制变量的值。3. 根据权利要求2所述的方法,其中,所述过渡权重和所述发射权重中的两者包含非 二进制变量的值。4. 根据权利要求1至3中任一项所述的方法,其中,所述发射权重表示观测所有可能的 测量的非零机会。5. 根据权利要求1至4中任一项所述的方法,其中,关于每个k聚体的所述发射权重相 对于测量的值具有单峰或多峰分布。6. 根据权利要求5所述的方法,其中,关于每个k聚体的所述发射权重相对于测量的值 具有高斯、拉普拉斯、正方或三角分布。7. 根据权利要求1至6中任一项所述的方法,其中,k是复整数。8. 根据权利要求7所述的方法,其中,所述过渡权重表示优选过渡的非零机会,所述优 选过渡是从起源k聚体到具有其中第一(k-Ι)聚合物单元是所述起源k聚体的最后(k-1) 聚合物单元的序列的目标k聚体的过渡,并且表示非优选过渡的较低机会,所述非优选过 渡是从起源k聚体到具有不同于所述起源k聚体并且其中所述第一(k-Ι)聚合物单元不是 所述起源k聚体的最后(k-Ι)聚合物单元的序列的目标k聚体的过渡。9. 根据权利要求8所述的方法,其中,所述过渡权重表示至少一些所述非优选过渡的 非零机会。10. 根据权利要求9所述的方法,其中,所述过渡权重表示从起源k聚体到具有其中第 一(k-2)聚合物单元是所述起源k聚体的最后(k-2)聚合物单元的序列的目标k聚体的非 优选过渡的非零机会。11. 根据权利要求1至10中任一项所述的方法,其中,所述分析技术是概率技术。12. 根据权利要求1至11中任一项所述的方法,其中,所述过渡权重是概率,和/或所 述发射权重是概率。13. 根据权利要求1至12中任一项所述的方法,其中,所述模型是隐马尔可夫模型。14. 根据权利要求1至13中任一项所述的方法,其中,所述分析步骤进一步包括导出关 于所述估计序列或每个估计序列的质量得分,所述质量得分表示通过由聚合物单元的估计 序列产生的测量的系列的模型预测的似然。15. 根据权利要求1至14中任一项所述的方法,其中,所述分析步骤进一步包括导出关 于对应于聚合物单元的估计序列的单独k聚体的质量得分,所述质量得分表示通过由包括 所述单独k聚体的序列产生的测量的系列的模型所预测的似然。16. 根据权利要求1至15中任一项所述的方法,其中,所述分析步骤进一步包括导出 关于对应于聚合物单元的估计序列的k聚体的序列的质量得分,所述质量得分表示通过由 k聚体的给定序列产生的测量的系列的模型所预测的似然。17. 根据权利要求1至16中任一项所述的方法,其中,所述分析步骤导出在所述聚合物 中的聚合物单元的多个估计序列。18. 根据权利要求1至17中任一项所述的方法,其中,估计所述聚合物中的聚合物单元 的至少一种估计序列的步骤包括: 基于通过由单独k聚体产生的测量的系列的模型所预测的似然来估计k聚体的序列; 以及 由k聚体的估计序列来估计聚合物单元的序列。19. 根据权利要求1至18中任一项所述的方法,其中,估计所述聚合物中的聚合物单元 的至少一种估计序列的步骤包括: 基于通过由k聚体的整个序列产生的测量的系列的模型所预测的似然来估计k聚体的 至少一种序列;以及 由k聚体的估计序列来估计聚合物单元的序列。20. 根据权利要求1至19中任一项所述的方法,其中,在所述至少一个测量的系列中, 测量的预定数目取决于每个k聚体,所述预定数目是一个或多个。21. 根据权利要求20所述的方法,其中 所述方法包括接收至少一种输入信号,所述输入信号包含测量的输入系列,其中,多个 测量的组取决于相同的k聚体,而没有在所述组中测量的数目的先验知识,以及 在所述分析步骤以前,处理所述至少一种输入信号以确定测量的连续组以及导出关于 每个确定组的测量的所述预定数目,对由此导出的所述测量的系列或每个测量的系列进行 所述分析步骤。22. 根据权利要求1至19中任一项所述的方法,其中,在所述至少一个测量的系列中, 多个测量的组取决于相同的k聚体,而没有在所述组中测量的数目的先验知识。23. 根据权利要求1至22中任一项所述的方法,进一步包括进行聚合物的所述测量。24. 根据权利要求23所述的方法,其中,在所述聚合物移位通过纳米孔期间进行所述 聚合物的所述测量。25. 根据权利要求24所述的方法,其中,进行所述聚合物的移位,使得多个测量的组取 决于相同的k聚体。26. 根据权利要求24或25所述的方法,其中,以棘轮方式进行所述聚合物通过所述纳 米孔的移位。27. 根据权利要求24至26中任一项所述的方法,其中,所述聚合物是多核苷酸,并且所 述聚合物单元是核苷酸。28. 根据权利要求24至27中任一项所述的方法,其中,所述测量的系列是在所述聚合 物移位通过纳米孔期间进行的测量。29. 根据权利要求24至28中任一项所述的方法,其中,所述纳米孔是生物孔。30. 根据权利要求24至29中任一项所述的方法,其中,所述测量包括电流测量、阻抗测 量、隧道效应测量、FET测量和光学测量中的一种或多种。31. 根据权利要求24至30中任一项所述的方法,其中 对各自涉及所述聚合物的多个测量的系列进行所述方法,其中每个测量的值取决于k 聚体, 所述分析技术处理以多个、各自的维度安排的多个测量的系列。32. 根据权利要求31所述的方法,其中,每个测量的系列是相同聚合物的相同区的测 量。33. 根据权利要求31所述的方法,其中,所述多个测量的系列包括测量的两个系列,其 中测量的第一系列是聚合物的第一区的测量以及测量的第二系列是与所述第一区相关的 聚合物的第二区的测量。34. 根据权利要求33所述的方法,其中,所述第一区和第二区是相同聚合物的相关区。35. 根据权利要求33或34所述的方法,其中,所述相关区是互补的。36. 根据权利要求1至35中任一项所述的方法,其中,所述模型被存储在存储器中。37. 根据权利要求1至36中任一项所述的方法,其中,在硬件设备中或在计算机设备中 实施提供模型和分析测量的步骤。38. -种被构造成进行根据权利要求1至37中任一项所述的方法的装置。39. -种用于由涉及聚合物的至少一个测量的系列来估计所述聚合物中的聚合物单元 的序列的分析装置,其中每个测量的值取决于k聚体,所述k聚体是k个聚合物单元的组, 其中k是复整数,所述方法包括: 存储模型的存储器,对于一组可能的k聚体,所述模型包括: 过渡权重,所述过渡权重表示从起源k聚体到目标k聚体的过渡的机会,和 关于每个k聚体的发射权重,所述发射权重表示观测该k聚体的测量的给定值的机会; 以及 分析单元,被构造成利用参考所述模型的分...

【专利技术属性】
技术研发人员:斯图尔特·威廉·里德加文·哈珀克莱夫·加文·布朗詹姆斯·安东尼·克拉克安德鲁·约翰·赫伦
申请(专利权)人:牛津楠路珀尔科技有限公司
类型:发明
国别省市:英国;GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1