基于人工智能预测的碱基判读来检测和过滤簇制造技术

技术编号:36769805 阅读:29 留言:0更新日期:2023-03-08 21:39
所公开的技术涉及识别不可靠的簇以提高碱基判读的准确性和效率。所公开的技术包括访问用于多个簇和用于测序运行的测序循环的第一子集的每循环簇数据,并对测序循环的第一子集中的每个测序循环处的多个簇中的每个簇进行碱基判读,包括针对每个簇和针对每个测序循环生成每循环概率四元组。所公开的技术包括基于由每个每簇、每循环概率四元组识别的概率确定其滤波值,将多个簇中其滤波值的序列包含至少“N”个滤波值低于阈值“M”的那些簇识别为不可靠的簇,并且在测序运行的测序循环的剩余部分处绕过对不可靠的簇进行碱基判读。分处绕过对不可靠的簇进行碱基判读。分处绕过对不可靠的簇进行碱基判读。

【技术实现步骤摘要】
【国外来华专利技术】基于人工智能预测的碱基判读来检测和过滤簇
[0001]优先权申请
[0002]本申请要求于2021年8月25日提交的名称为“DETECTING AND FILTERING CLUSTERS BASED ON ARTIFICIAL INTELLIGENCE

PREDICTED BASE CALLS”的美国临时申请第17/411,980号的优先权(代理人案卷号ILLM 1018

2/IP

1860

US),该临时申请要求于2020年8月28日提交的名称为“DETECTING AND FILTERING CLUSTERS BASED ON ARTIFICIAL INTELLIGENCE

PREDICTED BASE CALLS”的美国临时申请第63/072,032号的权益(代理人案卷号ILLM 1018

1/IP

1860

PRV)。优先权申请以引用的方式并入本文中。
[0003]文献并入<br/>[0004]本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种识别不可靠的簇以提高碱基判读的准确性和效率的计算机实现的方法,所述方法包括:访问用于多个簇和用于测序运行的测序循环的第一子集的每循环簇数据;在测序循环的所述第一子集中的每个测序循环处对所述多个簇中的每个簇进行碱基判读,包括处理所述每循环簇数据并生成所述每循环簇数据的中间表示,以及通过输出层处理所述中间表示,并针对每个簇和每个测序循环产生每簇、每循环概率四元组,其中特定每簇、每循环概率四元组识别在特定测序循环掺入特定簇中的碱基为A、C、T和G的概率;基于由每个每簇、每循环概率四元组识别的概率来确定其滤波值,从而生成每个簇的滤波值序列;将所述多个簇中其滤波值的序列包含至少“N”个滤波值低于阈值“M”的那些簇识别为不可靠的簇;以及在所述测序运行的测序循环的剩余部分处绕过对所述不可靠的簇进行碱基判读,从而在测序循环的所述剩余部分处仅对所述多个簇中那些未被识别为所述不可靠的簇进行碱基判读。2.根据权利要求1所述的计算机实现的方法,其中基于涉及所述概率中的一个或多个概率的算术运算来确定每簇、每循环概率四元组的所述滤波值。3.根据权利要求1至2所述的计算机实现的方法,其中所述算术运算是减法。4.根据权利要求1至3所述的计算机实现的方法,其中通过从所述概率中的最高概率中减去所述概率中的第二高概率来确定所述每簇、每循环概率四元组的所述滤波值。5.根据权利要求1至4所述的计算机实现的方法,其中所述算术运算是除法。6.根据权利要求1至5所述的计算机实现的方法,其中所述每簇、每循环概率四元组的所述滤波值被确定为所述概率中的所述最高概率与所述概率中的所述第二高概率的比率。7.根据权利要求1至6所述的计算机实现的方法,其中所述算术运算是加法。8.根据权利要求1至7所述的计算机实现的方法,其中所述算术运算是乘法。9.根据权利要求1至8所述的计算机实现的方法,其中所述“N”的范围为1至5。10.根据权利要求1至9所述的计算机实现的方法,其中所述“M”的范围为0.5至0.99。11.根据权利要求1至10所述的计算机实现的方法,其中所述第一子集包括所述测序运行的1个至25个测序循环。12.根据权利要求1至11所述的计算机实现的方法,其中所述第一子集包括所述测序运行的1个至50个测序循环。13.根据权利要求1至12所述的计算机实现的方法,其中所述输出层是softmax层,并且所述每簇、每循环概率四元组中的所述概率是指数归一化的分类得分,所述分类得分总和为一。14.根据权利要求1至13所述的计算...

【专利技术属性】
技术研发人员:D
申请(专利权)人:因美纳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1