用于重新校准对应于目标变体的核苷酸碱基检出的机器学习模型制造技术

技术编号:40430892 阅读:24 留言:0更新日期:2024-02-20 22:53
本公开描述了可利用机器学习模型来重新校准检出生成模型的核苷酸碱基检出(例如,变体检出)的方法、非暂态计算机可读介质和系统。例如,所公开的系统可训练并利用检出重新校准机器学习模型来基于与样品核苷酸序列相关联的测序度量生成预测变体检出分类的集合。利用该变体检出分类的集合,所公开的系统可进一步更新或修改对应于基因组坐标诸如多等位基因基因组坐标、单倍体基因组坐标和(由该检出生成模型)指示为表现出纯合参考基因型的基因组坐标的核苷酸碱基检出(例如,变体检出)。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、近年来,生物技术公司和研究机构已改进用于对核苷酸进行测序并且确定基因组样品的核苷酸碱基检出(例如,变体检出)的硬件和软件。例如,一些现有核苷酸碱基测序平台通过使用常规桑格测序或通过使用边合成边测序(sbs)方法来确定序列内的各个核苷酸碱基。当使用sbs时,现有平台可监测平行合成的数千个核酸聚合物,以根据更大碱基检出数据集预测核苷酸碱基检出。例如,许多sbs平台中的相机捕获掺入寡核苷酸中的辐照荧光标签的图像,以用于确定核苷酸碱基检出。在捕获此类图像之后,现有sbs平台向计算设备发送碱基检出数据(或图像数据),以应用确定核酸聚合物的核苷酸碱基序列的测序数据分析软件。在某些情况下,一些先前系统进一步利用变体检出器来识别变体,诸如单核苷酸多态性(snp)、插入或缺失(indel)或样品的核酸序列内的其他变体。

2、尽管在测序和变体检出方面取得这些最近进展,但现有核苷酸碱基测序平台和测序数据分析软件(在下文中一起称为现有测序系统)通常包括不准确地确定核苷酸碱基检出(和/或对应变体检出)的变体检出器。例如,现有测序系统不准确地确定—或不能够本文档来自技高网...

【技术保护点】

1.一种系统,包括:

2.根据权利要求1所述的系统,还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统:

3.根据权利要求1所述的系统,还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统:

4.根据权利要求1所述的系统,还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统:通过根据所述多等位基因基因组坐标处的三个或更多个候选等位基因预测两个核苷酸碱基来确定所述多等位基因基因组坐标的所述最终核苷酸碱基检出。

5.根据权利要求1所述的系统,还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统:通过确定所述多等...

【技术特征摘要】
【国外来华专利技术】

1.一种系统,包括:

2.根据权利要求1所述的系统,还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统:

3.根据权利要求1所述的系统,还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统:

4.根据权利要求1所述的系统,还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统:通过根据所述多等位基因基因组坐标处的三个或更多个候选等位基因预测两个核苷酸碱基来确定所述多等位基因基因组坐标的所述最终核苷酸碱基检出。

5.根据权利要求1所述的系统,还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统:通过确定所述多等位基因基因组坐标处的基因型相对于参考基因组是纯合基因型的概率来生成所述参考概率。

6.根据权利要求1所述的系统,还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统:通过确定所述多等位基因基因组坐标的预测基因型是不正确基因型或所述预测基因型中的不正确等位基因的概率来生成所述不同基因型概率。

7.根据权利要求1所述的系统,还包括指令,所述指令当由所述至少一个处理器执行时使得所述系统:通过确定所述多等位基因基因组坐标的预测基因型如由检出生成模型最初确定的那样正确的概率来生成所述正确变体概率。

8.一种计算机实现的方法,所述方法包括:

9.根据权利要求8所述的计算机实现的方法,其中:

10.根据权利要求8所述的计算机实现的方法,其中生成所述第一基因型概率和所述第二基因型概率包括:

11.根据权利要求8所述的计算机实现的方法,其...

【专利技术属性】
技术研发人员:G·帕纳比
申请(专利权)人:因美纳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1