System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 产生用于确定核苷酸碱基检出的簇特异性信号校正制造技术_技高网

产生用于确定核苷酸碱基检出的簇特异性信号校正制造技术

技术编号:40467648 阅读:5 留言:0更新日期:2024-02-22 23:22
本公开描述了方法、系统和非暂态计算机可读介质的实施方案,这些实施方案准确且有效地估计特定寡核苷酸簇的定相和预定相的影响,并确定该簇的簇特异性定相校正。例如,所公开的系统可动态地识别表现出误差诱导序列的寡核苷酸簇,这些误差诱导序列频繁引起定相或预定相。当所公开的系统在循环期间在此类误差诱导序列之后的读段位置处检测到信号时,所公开的系统可生成簇特异性定相系数并且根据这样的簇特异性定相系数来校正信号。例如,所公开的系统可利用线性均衡器、判决反馈均衡器或最大似然序列估计器来生成簇特异性定相系数。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、近年来,生物技术公司和研究机构已经改进了用于确定样品基因组或其他核酸聚合物中核苷酸碱基序列的硬件和软件平台。例如,一些现有的核酸测序平台通过使用常规桑格测序或边合成边测序(sbs)来确定核酸序列的各个核苷酸碱基。当使用sbs时,现有平台可监测成簇分组且并行合成的数千、数万或更多寡核苷酸以检测更准确的核苷酸碱基检出。例如,sbs平台中的照相机可捕获来自掺入此类成簇的和合成的寡核苷酸中的核苷酸碱基的经照射荧光标签的图像。在捕获图像之后,现有的sbs平台将图像数据发送到具有测序数据分析软件的计算设备,以确定基因组或其他核酸聚合物的核苷酸碱基序列。例如,测序数据分析软件可基于在图像数据中捕获的光信号来确定在给定图像中照射的具有标签的核苷酸碱基。通过循环地将核苷酸碱基掺入寡核苷酸中并在各种测序循环中捕获所发射光信号的图像,sbs平台可确定与特定簇对应的核苷酸读段并确定核酸聚合物的全基因组样品或其他样品中存在的核苷酸碱基序列。

2、尽管有这些最近的进展,现有的核酸测序平台和测序数据分析软件(统称为“现有的测序系统”)常常受到技术限制,这些限制阻碍了检测和校正信号以进行定相的准确度、适用性和效率。当现有的核酸测序平台执行循环以掺入和检测各种簇的寡核苷酸的核苷酸碱基时,该平台经常异相地掺入和检测一些核苷酸碱基。当定相和预定相发生时,核酸测序平台分别掺入与前一循环(定相)对应的核苷酸碱基或与后一循环(预定相)对应的核苷酸碱基。由于定相或预定相,核酸测序平台捕获来自簇的光信号的图像,这些簇具有用于当前循环的掺入的核苷酸碱基以及与先前或后续循环对应的掺入的核苷酸碱基的混合物。现有的测序系统经常无法准确地检测和校正此类定相和预定相影响,因此有时会确定与特定循环中的簇对应的核苷酸读段的不正确的核苷酸碱基检出。即使当现有的测序系统产生正确的核苷酸碱基检出时,此类系统也可部分地由于定相和预定相而产生具有较低质量测序度量的读段的碱基检出。例如,在某些重复核苷酸序列之后的读段位置处捕获混合信号的现有的测序系统经常会产生具有较低质量分数(诸如phred质量分数(例如,低于q30))的碱基检出。

3、现有的测序系统经常试图规避由上述定相和预定相引起的不准确性。但这些系统通常是僵化的,并且依赖于一刀切的方法。例如,常规的测序系统通常依赖于全局定相和全局预定相校正来最大化每个循环的强度数据的纯度。纯度值指示最亮的碱基强度除以最亮的和第二亮的碱基强度之和的比值。全局定相和全局预定相校正的使用限制了对载玻片大部分(例如,流通池)的信号进行定相校正的有效性。实际上,常规测序系统通常无法解释簇水平的可变性。例如,载玻片的一部分(例如,区块)内的第一簇可表现出显著的定相影响,该部分内的第二簇可表现出显著的预定相影响,并且同一部分内的第三簇可表现出很少甚至没有定相或预定相。因此,依赖于全局定相和全局预定相校正的常规测序系统通常无法解释簇内的细微差别。

4、此外,常规测序系统通常包括有限的存储资源和其他计算资源以有效地捕获和分析各种簇的图像数据。具体地,作为应用定相校正的一部分,常规测序系统频繁地存储和分析测序图像数据或测序强度数据。为了说明,常规测序系统通常收集每个循环的信号数据、存储数据并分析数据。由于逐循环地保存此类图像数据所需的存储负载,利用测序机的存储器设备来存储和处理图像或信号数据通常是不切实际的。为了说明,常规系统通常收集每个循环的信号数据,将数据存储在测序设备上,将数据转移到服务器,将数据存储在服务器中,并且在服务器上处理来自每个循环的数据。因此,常规系统不仅低效地利用资源,而且还通过转移和处理信令数据而引入显著的延迟。

5、这些以及另外的问题和难题存在于现有的测序系统中。


技术实现思路

1、本公开描述了解决上述问题中的一个或多个问题或提供优于现有技术的其他优点的系统、方法和非暂态计算机可读存储介质的一个或多个实施方案。具体地,所公开的系统可准确且有效地估计特定寡核苷酸簇的定相和预定相的效果,并确定该簇的簇特异性定相校正。例如,所公开的系统可动态地识别表现出误差诱导序列的寡核苷酸簇,这些误差诱导序列频繁引起定相或预定相。当所公开的系统在循环期间在此类误差诱导序列之后的读段位置处检测到信号时,所公开的系统可生成簇特异性定相系数并且根据这样的簇特异性定相系数来校正信号。例如,所公开的系统可利用线性均衡器、判决反馈均衡器、最大似然序列估计器或机器学习模型来生成簇特异性定相系数。在一些情况下,所公开的系统可相应地识别误差诱导序列之后的读段位置,并且在测序设备上几乎实时地生成具有很少甚至没有缓冲的簇特异性定相系数。

2、本公开的一个或多个实施方案的附加的特征部和优点将在随后的描述中阐述,并且部分地将从该描述中显而易见,或者可以通过此类示例性实施方案的实践获知。

本文档来自技高网...

【技术保护点】

1.一种包括指令的非暂态计算机可读存储介质,所述指令当由至少一个处理器执行时使得计算设备:

2.根据权利要求1所述的非暂态计算机可读存储介质,其中所述误差诱导序列包括一个或多个重复核苷酸碱基的序列、序列基序或由序列识别模型识别的触发序列。

3.根据权利要求2所述的非暂态计算机可读存储介质,其中一个或多个重复核苷酸碱基的所述序列或所述序列基序包括相同核苷酸碱基的均聚物、近均聚物、鸟嘌呤四链体、可变数目串联重复(VNTR)、二核苷酸重复序列、三核苷酸重复序列、反向重复序列、小卫星序列、微卫星序列或回文序列。

4.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述至少一个处理器执行时使得所述计算设备通过如下方式确定所述簇特异性定相校正:

5.根据权利要求4所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述至少一个处理器执行时使得所述计算设备通过如下方式基于所述簇特异性定相系数和所述簇特异性预定相系数来确定所述簇特异性定相校正:

6.根据权利要求5所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述至少一个处理器执行时使得所述计算设备进一步基于与所述前一循环对应的信号强度、与所述循环对应的信号强度以及与所述后一循环对应的信号强度来确定所述簇特异性定相校正。

7.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述至少一个处理器执行时使得所述计算设备通过如下方式确定所述簇特异性定相校正:

8.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述至少一个处理器执行时使得所述计算设备:

9.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述至少一个处理器执行时使得所述计算设备针对所述寡核苷酸簇和随后的读段位置确定不同的簇特异性定相校正,以校正来自所述寡核苷酸簇的用于后一循环的信号,从而对用于所述后一循环的所述信号进行定相和预定相。

10.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述至少一个处理器执行时使得所述计算设备:

11.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述至少一个处理器执行时使得所述计算设备利用测序设备的处理器确定所述簇特异性定相校正。

12.一种系统,所述系统包括:

13.根据权利要求12所述的系统,所述系统还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统在所述系统的测序机上利用线性均衡器、判决反馈均衡器、最大似然序列估计器、前向-后向模型或机器学习模型来确定所述簇特异性定相系数和所述簇特异性预定相系数。

14.根据权利要求12所述的系统,所述系统还包括指令,所述指令当由所述至少一个处理器执行时,使得所述系统在测序运行之后确定所述簇特异性定相系数和所述簇特异性预定相系数。

15.根据权利要求12所述的系统,所述系统还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统:

16.根据权利要求12所述的系统,所述系统还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统通过如下方式来调节所述信号:

17.根据权利要求12所述的系统,所述系统还包括指令,所述指令当由所述至少一个处理器执行时,使得所述系统基于所述簇特异性定相系数和所述簇特异性预定相系数通过以下方式来调节所述信号:

18.一种计算机实现的方法,所述方法包括:

19.根据权利要求18所述的计算机实现的方法,其中所述误差诱导序列包括一个或多个重复核苷酸碱基的序列或方向特异性序列基序。

20.根据权利要求18所述的计算机实现的方法,其中确定所述簇特异性定相校正包括:

21.根据权利要求18所述的计算机实现的方法,其中确定所述簇特异性定相校正包括:

22.根据权利要求18所述的计算机实现的方法,所述方法还包括:

...

【技术特征摘要】
【国外来华专利技术】

1.一种包括指令的非暂态计算机可读存储介质,所述指令当由至少一个处理器执行时使得计算设备:

2.根据权利要求1所述的非暂态计算机可读存储介质,其中所述误差诱导序列包括一个或多个重复核苷酸碱基的序列、序列基序或由序列识别模型识别的触发序列。

3.根据权利要求2所述的非暂态计算机可读存储介质,其中一个或多个重复核苷酸碱基的所述序列或所述序列基序包括相同核苷酸碱基的均聚物、近均聚物、鸟嘌呤四链体、可变数目串联重复(vntr)、二核苷酸重复序列、三核苷酸重复序列、反向重复序列、小卫星序列、微卫星序列或回文序列。

4.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述至少一个处理器执行时使得所述计算设备通过如下方式确定所述簇特异性定相校正:

5.根据权利要求4所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述至少一个处理器执行时使得所述计算设备通过如下方式基于所述簇特异性定相系数和所述簇特异性预定相系数来确定所述簇特异性定相校正:

6.根据权利要求5所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述至少一个处理器执行时使得所述计算设备进一步基于与所述前一循环对应的信号强度、与所述循环对应的信号强度以及与所述后一循环对应的信号强度来确定所述簇特异性定相校正。

7.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述至少一个处理器执行时使得所述计算设备通过如下方式确定所述簇特异性定相校正:

8.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述至少一个处理器执行时使得所述计算设备:

9.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述至少一个处理器执行时使得所述计算设备针对所述寡核苷酸簇和随后的读段位置确定不同的簇特异性定相校正,以校正来自所述寡核苷酸簇...

【专利技术属性】
技术研发人员:E·J·奥贾德J·S·维切利G·D·帕纳比B·陆R·美雄
申请(专利权)人:因美纳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1