用于蛋白质鉴定的方法和系统技术方案

技术编号:26896186 阅读:29 留言:0更新日期:2020-12-29 16:23
提供了用于蛋白质的准确且有效鉴定和定量的方法和系统。在一个方面,本文公开了一种迭代地鉴定未知蛋白质样品中的候选蛋白质的方法,该方法包括:接收多个亲和试剂探针中的每一个与未知蛋白质的结合测量的信息,每个亲和试剂探针被配置为选择性地与一种或多种候选蛋白质结合;将结合测量的信息的至少一部分与包含多个蛋白质序列的数据库进行比较,每个蛋白质序列对应于候选蛋白质;以及基于候选蛋白质的结合测量的信息与包含多个蛋白质序列的数据库的比较,迭代地生成该样品中存在一种或多种候选蛋白质中的每一种的概率。

【技术实现步骤摘要】
【国外来华专利技术】用于蛋白质鉴定的方法和系统交叉引用本申请要求2017年10月23日提交的第62/575,976号美国临时专利申请的优先权,该临时申请通过引用整体并入本文。
技术介绍
当前用于蛋白质鉴定的技术通常依赖于高度特异性和灵敏性亲和试剂(如抗体)的结合和随后读出,或者依赖于来自质谱仪的肽读取数据(长度通常为大约12-30个氨基酸)。可以将这类技术应用于样品中的未知蛋白质,以基于对高度特异性和敏感性亲和试剂与目的蛋白质的结合测量值的分析,确定候选蛋白质的存在、不存在或量。
技术实现思路
本文认识到需要改进未知蛋白质样品中蛋白质的鉴定和定量。本文提供的方法和系统可以显著减少或消除鉴定样品中的蛋白质的错误,从而改善所述蛋白质的定量。这类方法和系统可以实现未知蛋白质样品内候选蛋白质的准确和有效鉴定。这样的鉴定可以基于使用被配置为选择性地与一种或多种候选蛋白质结合的亲和试剂探针的结合测量信息的迭代计算。在一些实施方案中,未知蛋白质的样品可以迭代地暴露于单独的亲和试剂探针、合并的亲和试剂探针或单独的亲和试剂探针和合并的亲和试剂探针的组合。所述鉴定可以包括估计所述样品中本文档来自技高网...

【技术保护点】
1.一种迭代地鉴定未知蛋白质样品内候选蛋白质的计算机实现的方法,该方法包括:/n(a)通过所述计算机接收多个亲和试剂探针中的每一个与所述样品中所述未知蛋白质的结合测量值,每个亲和试剂探针被配置为选择性地与多种候选蛋白质中的一种或多种候选蛋白质结合;/n(b)通过所述计算机将结合测量值与包含多个蛋白质序列的数据库进行比较,每个蛋白质序列对应于所述多种候选蛋白质中的候选蛋白质;以及/n(c)对于所述多种候选蛋白质中的一种或多种候选蛋白质中的每一种,通过所述计算机,基于所述结合测量值与所述包含多个蛋白质序列的数据库的所述比较,迭代地生成所述样品中存在所述一种或多种候选蛋白质中的每一种的概率,所述数据...

【技术特征摘要】
【国外来华专利技术】20171023 US 62/575,9761.一种迭代地鉴定未知蛋白质样品内候选蛋白质的计算机实现的方法,该方法包括:
(a)通过所述计算机接收多个亲和试剂探针中的每一个与所述样品中所述未知蛋白质的结合测量值,每个亲和试剂探针被配置为选择性地与多种候选蛋白质中的一种或多种候选蛋白质结合;
(b)通过所述计算机将结合测量值与包含多个蛋白质序列的数据库进行比较,每个蛋白质序列对应于所述多种候选蛋白质中的候选蛋白质;以及
(c)对于所述多种候选蛋白质中的一种或多种候选蛋白质中的每一种,通过所述计算机,基于所述结合测量值与所述包含多个蛋白质序列的数据库的所述比较,迭代地生成所述样品中存在所述一种或多种候选蛋白质中的每一种的概率,所述数据库中的蛋白质序列各自对应于所述多种候选蛋白质中的候选蛋白质。


2.根据权利要求1所述的方法,其中生成所述多个概率进一步包括迭代地接收多个附加亲和试剂探针中的每一个的结合测量的附加信息,每个附加亲和试剂探针被配置为选择性地与所述多种候选蛋白质中的一种或多种候选蛋白质结合。


3.根据权利要求1所述的方法,其进一步包括针对所述一种或多种候选蛋白质中的每一种,生成所述候选蛋白质与所述样品中的所述未知蛋白质之一相匹配的置信水平。


4.根据权利要求1所述的方法,其中生成所述概率包括考虑与所述结合测量信息相关的检测器错误率。


5.根据权利要求4所述的方法,其中所述检测器错误率是从用来获取所述结合测量信息的一个或多个检测器的说明书中获得的。


6.根据权利要求4所述的方法,其中将所述检测器错误率设置为估计的检测器错误率。


7.根据权利要求6所述的方法,其中所述估计的检测器错误率由所述计算机的用户设置。


8.根据权利要求6所述的方法,其中所述估计的检测器错误率约为0.001。


9.根据权利要求1所述的方法,其中迭代地生成所述多个概率进一步包括从后续迭代中从所述多种候选蛋白质中去除一种或多种候选蛋白质,从而减少进行所述概率的所述迭代生成所必需的迭代次数。


10.根据权利要求9所述的方法,其中去除所述一种或多种候选蛋白质至少基于与所述候选蛋白质相关的所述结合测量的预定标准。


11.根据权利要求10所述的方法,其中所述预定标准包括所述一种或多种候选蛋白质与所述多个亲和试剂探针中的第一多个亲和试剂探针的结合测量值低于预定阈值。


12.根据权利要求1所述的方法,其中将每个所述概率相对于所述候选蛋白质的长度进行归一化。


13.根据权利要求1所述的方法,其中将每个所述概率相对于所述多种候选蛋白质的概率总和进行归一化。


14.根据权利要求1所述的方法,其中所述多个亲和试剂探针包含不超过50个亲和试剂探针。


15.根据权利要求1所述的方法,其中所述多个亲和试剂探针包含不超过100个亲和试剂探针。


16.根据权利要求1所述的方法,其中所述多个亲和试剂探针包含不超过500个亲和试剂探针。


17.根据权利要求1所述的方法,其中所述多个亲和试剂探针包含超过500个亲和试剂探针。


18.根据权利要求1所述的方法,其中迭代地生成所述概率,直到满足预定条件。


19.根据权利要求18所述的方法,其中所述预定条件包括以至少90%的置信度生成所述多个概率中的每一个。


20.根据权利要求19所述的方法,其中所述预定条件包括以至少95%的置信度生成所述多个概率中的每一个。


21.根据权利要求20所述的方法,其中所述预定条件包括以至少99.999%的置信度生成所述多个概率中的每一个。


22.根据权利要求1所述的方法,其进一步包括生成鉴定所述样品中的一种或多种未知蛋白质的纸质或电子报告。


23.根据权利要求1所述的方法,其中所述样品包括生物样品。


24.根据权利要求23所述的方法,其中所述生物样品从受试者获得。


25.根据权利要求24所述的方法,其进一步包括至少基于所述多个概率来确定所述受试者中的疾病状态。


26.一种鉴定未知蛋白质样品内候选蛋白质的计算机实现的方法,该方法包括:
(a)通过所述计算机接收多个亲和试剂探针中的每一个与所述样品中所述未知蛋白质的结合测量值,每个亲和试剂探针被配置为选择性地与多种候选蛋白质中的一种或多种候选蛋白质结合;
(b)通过所述计算机,将所述结合测量值的至少一部分与包含多个蛋白质序列的数据库进行比较,每个蛋白质序列对应于所述多种候选蛋白质中的候选蛋白质;以及
(c)至少基于所述结合测量信息的所述至少一部分与包含所述多...

【专利技术属性】
技术研发人员:苏贾尔·M·帕特尔帕拉格·马利克贾勒特·D·艾格特森
申请(专利权)人:诺迪勒思生物科技公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1