当前位置: 首页 > 专利查询>宽腾矽公司专利>正文

用于测序装置的机器学习使能脉冲及碱基判定制造方法及图纸

技术编号:26429039 阅读:27 留言:0更新日期:2020-11-20 14:27
一种方法,包括:从一个或多个测序装置获得在核苷酸掺入事件期间从与核苷酸相关联的发光标签检测的原始数据;及处理该原始数据以执行由该一个或多个测序装置的学习使能的自动碱基判定模块产生的碱基判定和与该原始数据相关联的实际值的比较,其中该等碱基判定从该原始数据标识一个或多个个体核苷酸。基于该比较,使用至少一些所获得原始数据形成该学习使能的自动碱基判定模块的更新,且使该更新可用于该一个或多个测序装置。

【技术实现步骤摘要】
【国外来华专利技术】用于测序装置的机器学习使能脉冲及碱基判定相关申请的交叉引用本申请依据35U.S.C.§119要求享有2018年1月26日递交的、标题为“MACHINELEARNINGENABLEDPULSEANDBASECALLINGFORSEQUENCINGDEVICES(用于测序装置的机器学习使能脉冲和碱基判定)”、序列号为62/622,754的美国临时申请的优先权,该申请的全部内容以引用方式并入本文中。
技术介绍
本公开总体上涉及用于生物测序的自动化脉冲及碱基判定方法,且更具体地涉及关于用于测序装置的机器学习使能脉冲及碱基判定。核酸(例如,脱氧核糖核酸(DNA)、核糖核酸(RNA))的测序包含标识靶核酸中的各个核苷酸。一些核酸测序方法包含在各个核苷酸掺入与靶核酸互补的核酸链中时标识该各个核苷酸。然后,在测序过程期间标识的互补链的核苷酸系列可允许标识靶核酸链的核苷酸序列。
技术实现思路
根据一个方面,提供了一种用于标识核酸的核苷酸的方法。该方法包括:使用至少一个计算机硬件处理器来执行如下操作:存取在该核酸的核苷酸掺入事件期间从所检测到的与核苷本文档来自技高网...

【技术保护点】
1.一种用于标识核酸的核苷酸的方法,所述方法包括:/n使用至少一个计算机硬件处理器执行如下操作:/n存取在所述核酸的核苷酸掺入事件期间从所检测到的与核苷酸相关联的发光标签的光发射所获得的数据;以及/n将所述数据作为输入提供至经过训练的深度学习模型,以获得标识所述核酸的核苷酸的输出。/n

【技术特征摘要】
【国外来华专利技术】20180126 US 62/622,7541.一种用于标识核酸的核苷酸的方法,所述方法包括:
使用至少一个计算机硬件处理器执行如下操作:
存取在所述核酸的核苷酸掺入事件期间从所检测到的与核苷酸相关联的发光标签的光发射所获得的数据;以及
将所述数据作为输入提供至经过训练的深度学习模型,以获得标识所述核酸的核苷酸的输出。


2.根据权利要求1所述的方法,其中,所述深度学习模型包括卷积神经网络。


3.根据权利要求1或任何其它前述权利要求所述的方法,其中,所述深度学习模型包括连接时序分类(CTC)-拟合的神经网络模型。


4.根据权利要求1或任何其它前述权利要求所述的方法,其中,用于标识所述核酸的核苷酸的所述输出包括针对多个核苷酸中的每一个的各自的时间系列值,所述值指示该核苷酸被掺入所述核酸中的概率。


5.根据权利要求1或任何其它前述权利要求所述的方法,还包括:
其中,用于标识所述核酸的核苷酸的所述输出包括针对多个核苷酸中的每一个的概率,所述概率指示该核苷酸被掺入所述核酸中的概率;并且
所述方法还包括当所述核酸中的多个核苷酸的第一核苷酸被掺入所述核酸中的概率超过阈值概率时,标识所述第一核苷酸。


6.根据权利要求1或任何其它前述权利要求所述的方法,其中,将所述数据作为输入提供至经过训练的深度学习模型包括:
将所述数据编组成多个时间段;以及
将所述多个时间段中的每个时间段的数据作为输入提供至所述经过训练的深度学习模型,以获得用于指示所述核酸的至少一个核苷酸的对应输出。


7.根据权利要求6或任何其它前述权利要求所述的方法,其中,作为输入提供至所述经过训练的深度学习模型的对应于各个时间段的输出指示针对多个核苷酸中的每一个的如下值,所述值指示该核苷酸在该时间段内被掺入所述核酸中的概率。


8.根据权利要求1或任何其它前述权利要求所述的方法,其中,将所述数据作为输入提供至所述经过训练的深度学习模型包括:
标识所述数据的多个部分,每个部分对应于相应的一个核苷酸掺入事件;以及
将所述数据的多个部分中的每一个作为输入提供至所述经过训练的深度学习模型,以获得对应于所述数据的该部分的输出。


9.根据权利要求8或任何其它前述权利要求所述的方法,其中,对应于所述数据的该部分的输出标识被掺入所述核酸中的核苷酸。


10.根据权利要求1或任何其它前述权利要求所述的方法,还包括:
存取在多个核酸的核苷酸掺入事件期间从所检测到的与核苷酸相关联的发光标签的光发射获得的训练数据;以及
使用所述训练数据以及指定所述多个核酸中的至少一些核苷酸的信息训练深度学习模型,以获得所述经过训练的深度学习模型。


11.根据权利要求1或任何其它前述权利要求所述的方法,其中,所述光发射响应于光脉冲系列,且针对至少一些光脉冲中的每个光脉冲,所述数据包括在该光脉冲之后的时间段的多个间隔中的每个间隔中所检测到的相应光子数量。


12.一种用于标识核酸的核苷酸的系统,所述系统包括:
至少一个计算机硬件处理器;以及
至少一个非暂态计算机可读存储介质,所述至少一个非暂态计算机可读存储介质存储指令,所述指令在由所述至少一个计算机硬件处理器执行时,使所述至少一个计算机硬件处理器执行如下操作:
存取在所述核酸的核苷酸掺入事件期间从所检测到的与核苷酸相关联的发光标签的光发射所获得的数据;以及
将所述数据作为输入提供至经过训练的深度学习模型,以获得标识所述核酸的核苷酸的输出。


13.至少一个非暂态计算机可读存储介质,所述至少一个非暂态计算机可读存储介质存储指令,所述指令在由至少一个计算机硬件处理器执行时,使所述至少一个计算机硬件处理器执行如下操作:
存取在所述核酸的核苷酸掺入事件期间从所检测到的与核苷酸相关联的发光标签的光发射所获得的数据;以及
将所述数据作为输入提供至经过训练的深度学习模型,以获得标识所述核酸的核苷酸的输出。


14.一种用于训练深度学习模型以标识核酸的核苷酸的方法,所述方法包括:
使用至少一个计算机硬件处理器来执行如下操作:
存取在多个核酸的核苷酸掺入事件期间从所检测到的与核苷酸相关联的发光标签的光发射所获得的数据;以及
使用所述数据以及指定所述多个核酸中的至少一些核苷酸的信息训练所述深度学习模型。


15.根据权利要求14所述的方法,其中,使用所述数据以及指定所述多个核酸的至少一些核苷酸的信息训练所述深度学习模型包括:
将所述数据的至少一部分作为输入提供至所述深度学习模型,以获得用于标识所述多个核酸中的至少一个的核苷酸的输出;以及
基于由所述输出标识的至少一个核酸的核苷酸与由所述信息指定的至少一个核酸的核苷酸之间的差异来训练所述深度学习模型。


16.根据权利要求14或任何其它前述权利要求所述的方法,还包括:
重新训练所述深度学习模型以获得更新的深度学习模型;以及
将所述深度学习模型的更新传播至一个或多个测序装置。


17.根据权利要求14或任何其它前述权利要求所述的方法,其中,所述深度学习模型包括卷积神经网络。


18.根据权利要求14或任何其它前述权利要求所述的方法,其中,所述深度学习模型包括连接时序分类(CTC)-拟合的神经网络模型。


19.根据权利要求14或任何其它前述权利要求所述的方法,其中,指定所述多个核酸中的至少一些核苷酸的信息包括所述多个核酸中的至少一个的核苷酸序列,并且所述数据包括对应于所述至少一个核酸的核苷酸掺入事件的数据,并且训练所述深度学习模型包括:
颠倒所述至少一个核酸的核苷酸序列;以及
使用对应于所述至少一个核酸的掺入事件的数据以及所述至少一个核酸的颠倒的核苷酸序列训练所述深度学习模型。


20.根据权利要求14或任何其它前述权利要求所述的方法,还包括:
存取在核酸的核苷酸掺入事件期间从所检测到与核苷酸相关联的发光标签的光发射所获得的数据;以及
将所述数据作为输入提供至所述经过训练的深度学习模型,以获得标识所述核酸的核苷酸的输出。


21.根据权利要求20或任何其它前述权利要求所述的...

【专利技术属性】
技术研发人员:乔纳森·M·罗斯伯格迈克尔·梅耶乌穆特·伊瑟
申请(专利权)人:宽腾矽公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利