MS/MS数据处理制造技术

技术编号:4946662 阅读:169 留言:0更新日期:2012-04-11 18:40
一种从前体离子种类的碎片来识别这些前体离子种类的方法包括获得多个前体离子种类以及它们的碎片的质谱,该质谱达到高质量准确度。然后,扫描从裂解多个前体离子种类获得的该碎片质谱,它识别出其组合质量与这些前体离子种类中的一个的质量相匹配的多个碎片对。一旦已经将多个碎片离子对与前体离子相匹配,将复合的碎片离子谱分解成多个部分,每个碎片对一个部分。继续进行分析直到没有进一步的对被识别出。然后通过将该复合碎片谱的分解的多个部分整合在一起来对于每个前体样本离子重构一种简化的碎片离子谱。将这些得到的重构的简化的碎片谱发送给一种搜索引擎,该搜索引擎返回对每个合成的碎片离子谱的可能候选者的一个分数分类列表。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体上涉及质谱领域,并且更确切地涉及一种从前体离子种类的碎片来 识别这些前体离子种类的方法(MS/MS数据处理)。
技术介绍
由于存在具有非常相似的质荷比的许多不同的分子,分子的质谱分析是复杂 的。已经研发了多种裂解技术通过测量它们的特征性碎片的质核比来帮助识别不同的母 分子。将感兴趣的分子的离子连同具有非常相似的质荷比的其他分子离子通过一个质量 选择性离子光学装置根据质荷比进行选择。这些离子被称作母离子或前体离子。然后使 用一种或多种方法将这些母离子裂解,并且对碎片离子进行质量分析,从而提供一个所 谓的MS/MS质谱。具有不同结构的分子典型地裂解形成不同的碎片离子,并且通过研 究那些碎片离子的质荷比可以识别这些母分子。当碎片质谱同样包含干扰时,或者当要 求比MS/MS中存在的信息更多的信息量时,可以使用更多级的裂解,生成MS、质谱。 已经研发了多个蛋白质序列库,并且使用为此目的开发的算法对这些库进行搜索来使碎 片离子谱与可能的母分子相匹配。在有机质谱法中,这是一种强有力的并且使用广泛的方法。然而,它具有某些 缺点,这涉及要求多于一个质量选择步骤。这个要求增加了用于执行该方法所要求的仪 器的复杂度,并且增加了分析的时间。除了使用离子裂解技术来使得母分子离子能够被识别之外,可以使用一个高质 量分辨率的质谱仪来在具有非常相似的质荷比的分子离子之间进行区分。然而,通常此 类高质量分辨率的质谱仪与它们的低分辨率的对应物相比是更昂贵的并且经常是慢的多 的(由于更长的测量时间)。如果碎片离子质谱具有高的分辨率以及高的质量准确度,能够以更高级别的置 信度进行碎片离子和可能的母分子之间的匹配。因此,为了最有效地识别大分子离子, 分析者们通常使用一种高分辨率的质谱与裂解方法的组合。然而,将这两种方法组合导 致了甚至更长的分析时间。诸如以上概述的那些方法被常规地用于包含蛋白质的样本。典型地,将蛋白质 进行消化从而产生多肽,并且将这些多肽电离并且引入质谱仪中。将目标蛋白质或混合物(例如细胞裂解产物)进行预处理。预处理可以包括过 滤或清洗。然后用适当的裂解试剂将它消化掉。最常使用的是胰蛋白酶,但是也使用其 他的,如胰凝乳蛋白酶、溴化氰、亚碘酰苯甲酸盐。在消化并可能清洗之后,将混合物 放入质谱仪中,通常在色谱分离之后。色谱分离通常限制了可供串联的质谱过程使用的 时间。每个峰的色谱时间范围是从30秒到小于1秒,其中的趋势是时间更快。首先取得一个完整的质谱,从而生成一个所谓的前体离子谱。在该前体离子谱 中对于每个离子种类可以获得多个碎片离子谱(数据独立的MS/MS)。可替代地,经常 使用的一种方法是“依赖数据”的MS/MS。在这种方法中,获得一个完整的谱,并且 然后选出一个或多个最强的峰,这通常是自动进行的并且逐个地进行MS/MS裂解。将这些前体和碎片图谱存储起来。对此不同的增强包括用于避免重复测量强离子对前体 建立临时性黑名单;用于避免收集众所周知的肽类或溶剂组分的MS/MS数据对前体建 立永久性黑名单;对所感兴趣的质量建立白名单,以便在甚至不满足最苛刻的标准时允 许进行裂解。然而,对于这种依赖数据依赖的MS/MS方法存在两个问题。首先,对同 一个样本的不同次的处理可能产生非常不同的结果,这是因为(例如)即使是前体离子谱 中的峰高度的小的变化也可能导致自动地做出的不同的决定,从而导致选择不同的前体 离子种类用于裂解。其次,在许多情况下,由于之前的色谱过程,在可供使用的时间窗 口内可能没有足够的时间来裂解所有感兴趣的离子。在附图说明图1的流程图中作为一个实例示出了其中选择两个前体离子用于MS/MS的现 有技术的依赖数据过程。测量之后,或者有时在测量过程中,对所获得的数据进行评估。对此许多种方 法是已知的,如(1) “从头测序法”,在该方法中,从图谱中直接推断出氨基酸序列; (2) “序列标记法”,在该方法中,仅有部分氨基酸序列从谱中直接推断出来,并且这些 小段(“多个标签”)被用于数据库搜索例行程序中;(3)仅使用碎片离子谱来进行直接 的数据库搜索。进行数据库搜索从而将碎片离子与它们可能的肽前体相匹配。已经研发出多种 自动例行程序来进行这些搜索。其结果是多个可能前体的一个列表,该列表上用分数表 示匹配的可信度。可任选地,能够将搜索限制到已知的相关的肽前体的用户可以预先选 择有待搜索的数据库,例如,对于酵母的那些肽前体,其中该样品已知来自一种酵母。 可任选地,计算机搜索还可以提供从肽的得分中计算出的蛋白质的得分用以给出包含在 预先消化的样本中的可能的蛋白质的一种指示。典型地,搜索算法返回蛋白质或肽候选 者连同它们的分数的一个按分数分类的列表。然后典型地将该解译交给用户。标准的方法是将每个MS/MS谱连同对应的前体质量(通常这是在依赖数据设 置中触发MS/MS事件的质量)的一个峰值列表提交给一个“搜索引擎”用于与一个数 据库进行比较。通常在质量选择窗口中不进行多于一个的前体的检查。许多蛋白质的 数据库是公开可得到的。它们中的一些直接包含来自以前分析的蛋白质,其他的(例如 SwissProt(http://expasy.org/sprot/))是基因组序列的计算机翻译。由于搜索引擎使用的最终目标是提供一个或多个在被分析物的混合物中被确定 的蛋白质,数据库中的蛋白质被“电子地消化”为具有与用户选择的裂解试剂相匹配的 性质的多肽。这种“硅内的消化”可以即时生成,或者作为进行实际搜索之前的一个“索引”步骤。所有在由用户定义或从数据中推断出的一个容忍窗口内与前体质量相匹 配的肽都被认为是“候选者”。然后对来自这些候选者的碎片离子进行预测。基于MS/ MS数据,分数是与这些候选者相关联的,当MS/MS碎片离子谱包含所预测的候选者的 所预测的碎片时,产生一个更高的分数。现有技术数据库搜索过程作为一个实例示于图2的流程图中。如果故意地或者无意地同时选择了多于一个的前体离子种类用于裂解,碎片离 子谱将会是更复杂的并且来自数据库搜索引擎的结果将会是更不准确的。在图1和2中描述的现有技术过程具有以下缺点,即用于获得可能的肽的按分 数分类的列表的时间是缓慢的,即使是在使用了这些依赖数据的方法时,因为在可以使用标准搜索引擎技术对它们进行处理之前,必须单独地选出每个感兴趣的前体离子并且 个别地进行裂解,并且依次地对产生的离子质量进行分析。由于仪器时间是昂贵的,所 以这是费用昂贵的,并且由于在该过程中消耗掉了相对大比例的样本(它可能仅以非常 小的量存在),所以它是不浪费的。Masselon 和 Smith 在 Analytical Chemistry (分析化学)2000 年的第 72 卷第 8 号的1918-1924页描述了一种特定的提高通量的方法。在这个方法中,进行了一种多路复用形 式。来自多于一个的前体的多个碎片离子被有意地在一个单一的质谱中进行测量,该质 谱具有非常高的质量准确度。然后该碎片离子谱中确实包含了来自多于一个的前体离子 种类的多个碎片。像通常一样,将这个谱图发送到数据库搜索引擎,并且该方法依赖于 碎片谱的高质量准确度,这使得大多数碎片离子能够被归于一种特异性的母多肽,尽管 可能不是每个碎片离子种类都能够被指定给一个母体本文档来自技高网...

【技术保护点】
一种从前体离子种类的碎片来识别这些前体离子种类的方法,该方法包括:  (a)确定表示多个前体离子种类的质量的一个量;  (b)将该多个前体离子种类的离子裂解以形成从该多个前体离子衍生出的多个碎片离子;  (c)对从多个前体离子种类衍生出这些碎片离子一起/同时进行质量分析;  (d)将多个碎片离子种类的一个或多个样本集合指定给该多个前体离子种类中的特定一个,该样本集合或每个样本集合包括多个碎片离子种类,这些碎片离子种类在步骤(c)中所确定的组合质量与这些碎片离子种类所指定的这些前体样本离子种类中特定一个的组合质量相对应;  (e)对于这些前体离子种类中的一个或多个,将识别(i)在步骤(a)中所识别的该特定前体样本离子种类的质量,以及(ii)对于该特定前体离子种类在所指定的样本集合或每个指定的样本集合中该多个碎片离子种类的质量的样本数据传送给一个比较装置,用于对应地将表示该前体和所指定的碎片离子种类的质量的多个量与在参比碎片离子数据和参比前体离子数据的一个或多个参比集合中代表离子质量的多个量进行比较;并且  (f)从该比较装置接收表示所述比较的结果的信息,该信息试图识别出已经对其指定了该多个碎片样本离子种类的前体离子种类。...

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:MM萨维斯基R佐巴瑞夫
申请(专利权)人:塞莫费雪科学不来梅有限公司
类型:发明
国别省市:DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1