使用新的数据库检索模式鉴别和鉴定蛋白质制造技术

技术编号:2833732 阅读:220 留言:0更新日期:2012-04-11 18:40
一种选择针对一种样品多肽的一组候选多肽的方法,包括:根据由质谱法产生的样品多肽碎片质量的差异对候选多肽集合进行的第一次精选;以及根据样品多肽的绝对质量和碎片的绝对质量对候选多肽集合进行的第二次精选。

【技术实现步骤摘要】
【国外来华专利技术】使用新的数据库检索模式鉴别和鉴定蛋白质政府资助的声明本专利技术是在来自国家科学基金(资金# CHE-0134953)和来自国 家卫生研究院(资金^GM067193-01)的政府支持下完成的。政府在 本专利技术中有一定权利。附件材料附件包括3个CD复制拷贝,其提供了软件和数据库文件。CD 内容并入本文作参考。背景分子生物学的一个目的是鉴定由基因序列编码的蛋白质的结构 和生物化学活性。在很大程度上,蛋白质的结构鉴定依赖于当这些 蛋白质在天然细胞条件下表达时确定蛋白质的一级结构(氨基酸序 列)。 一旦蛋白质从mRNA被翻译,蛋白质的一级结构经常由于酶 的作用而被修饰。这些修饰包括在氨基酸残基的侧链添加一个新的基 团(moiety),如向丝氨酸添加一个磷酸酯,或者蛋白酶裂解,如除 去起始甲硫氨酸或信号序列。因此,蛋白质的结构鉴定包括氨基酸序 列的线性组构(如由可变剪接和多态性而影响)以及可在序列内发生 的任何修饰的存在。为此,蛋白质组学研究的主要目的是了解在蛋白质上发生的详细 的修饰。这类信息不仅对于了解蛋白质的生物学活性是关键性的,而 且对于开发用于控制与人类疾病相关过程中的细胞增殖和分化的药 物也是很重要。质谱分析(MS)是用于鉴别未知化合物、定量已知化合物和确定分子结构的一种分析技术。质谱仪是一种测量从个体分子转化的离子的 质量的仪器。这一仪器依据离子的特定质量与电荷比而间接测量分子 质量。 一个离子上的电荷由电子的基本电荷单位z以及质量电荷比m/z表示。典型地,质谱分析中的离子仅有一个单电荷(z=l),因此, m/z值与以Da表示的分子质量在数字上相等。对于单电离子,柳/2比 是特定离子的质量。通常,MS轰击具有高密度质子、电子或中性气体的样品的离子, 断裂连键,导致从完整分子的分子离子形成碎片离子(fragment iom)。 尽管由MS产生阳性和阴性离子二者,但是仅有一种极性离子被一特 定仪器设置检测。气相样品离子的形成使得可以根据质量分选各种离 子,并使之得以检测。样品可以是画体、液体或蒸气,它们经入口进 入仪器的真空腔。静电和/或磁滤波器被用于根据各自的m/z比而选 择离子,这些离子被集中于检测仪上。在检测仪中,离子通量被转变 为比例电流。仪器随后记录这些电信号的辐度,作为m々的函数,并 将这一信息转变为质谱。绝对质量检索使得能用完整质量与碎片离子质量的组合从一个 序列数据库中明确地鉴别蛋白质(见附图说明图1)。鉴别是通过从一有注释 数据库中选择处于用户规定的观察的平均或单一同位素完整质量的 容差(user specified tolerance of an observed average or monoisotopic intact mass)范围内的所有序列而实现的。优选地,候选蛋白质是从 以质量索引的蛋白质形式的数据库中检索到。然后用观察的碎片离子对每一候选序列进行计分。这一过程涉及 从每一候选序列计算所有的理论或c/型碎片离子质量(平均或 单一同位素)并计算处于用户规定的任何理论碎片离子容差(绝对或 每百万份中之份数)内的观察到的碎片离子数。观察到的碎片离子 数和相应于理论碎片离子的观察到的碎片离子数被用于计算假性鉴别的概率。所有计算分值与所考虑的候选序列数相乘得到基于概率的 分值。然后,具有最低分值(并因此具有为假性鉴别的最低概率)的 候选蛋白质被认为是可能性最大的候选蛋白质。MS已被用于确定蛋白质的一级氨基酸序列。观察到的蛋白质碎 片离子的质量差异可被用于推导一部分蛋白质序列的氨基酸组成。这 些序列标记可被用于鉴别蛋白质序列,条件是可以获得足够数目的相关蛋白质碎片离子的MS数据。使用MS的策略现在正在被开发以改进在蛋白质规模检测蛋白 质修饰的效率和可靠性。尽管在哺乳动物基因组中存在远比过去所认 为的要少的基因数量(Lander W a/., 2001),但是由于核苷酸多态性、 可变RNA剪接、RNA编辑和翻译后修饰所致的每一基因有不同的蛋 白质形式是可能的。除了通过修饰调节蛋白质功能外,环境信号也导 致蛋白质的化学修饰。修饰的检测为了解真核细胞的基础调节机制以 及诊断人类疾病提供了一个重要机会。最常见形式的基于MS的蛋白质结构测定涉及利用自下而上 (bottom up)方法首先用已知特异性的蛋白酶消化完整蛋白质, 以产生较短的多肽碎片(见图2)。这些碎片随后被纯化和用MS进 行鉴定。基于所观察到的各个多肽碎片的绝对质量,可以推断出氨基 酸组成,并且使用检索算法和已知蛋白质组成的数据库可以推导蛋白 质身份。使用这一方法,已经在单一蛋白质上常规进行修饰的检测, 从而产生接近100%序列覆盖范围的肽谱 (Biemann and Papayannopoulos, 1994)。当然这一方法在鉴定修饰时会留有缺口 ,因 为蛋白酶衍生碎片可能会经历额外的化学变化并因此未能提供有关 原始蛋白质的足够冗余的信息。用于这一方法的检索算法现在能支持 一些类型的修饰检测和定位,并且是常规可获得的(Clausera/., 1999; Perkins W a/ 1999; Wilkins ef a/ 1999; and Zhang /., 2000)。现在正在开发基于分析衍生自用胰蛋白酶消化完整蛋白质的肽 碎片的测量技术以直接靶定修饰。例如,已使用多种程序增强了磷酸 化和糖基化的检测,如分离含有修饰的多肽碎片(例如基于修饰的肽的选择性纯化)、应用MS检测特异性修饰(例如扫描修饰的肽的标 记离子)或同时使用这两种方法(Goshe /., 2001; Oda a/ 2001; Steen W , 2001; Zhou a/. , 2001; Ficarro W a/., 2002)。最终,所述自 下而上方法已被用于检测来自两种生物学样品的蛋白质修饰谱中的 差异(例如磷酸蛋白质组学)(Odae// 1999; Goshee// 2001; Oda a/. 2001; Zhou ef a/ 2001; Ficarro a/., 2002; Gerber <a/., 2002)。 尽管这些技术中的一些正在被放大以用于分析数百个蛋白质,但无一 可通用于所有类型的修饰。一种称为自上而下(top down)的替代方法已经被开发用于 鉴别和鉴定完整蛋白质中的修饰(见图2)。这一方法使用串联质谱 法(MS/MS或(MS))以首先使完整蛋白质碎片化,随后收集碎片并 使之进行后续轮次的碎片化和质量测量。因此,自上而下方法确定完 整蛋白质和蛋白质碎片离子的绝对质量。由于完整蛋白质进行MS, 所以分析中不会有结构信息被忽略,因此自上而下方法具有鉴别在完 整蛋白质内发生的所有修饰的潜力。自上而下方法已被用于获得来自 多达4种生物体的32个蛋白质的修饰信息(Kelleher /., 1998; Pineda W a/ 2000; Reid a/ 2002; Meng a/ 2001)。自上而下方法通用于所有修饰。目前己被自上而下方法鉴定的修 饰包括糖基化(Reida/., 2002; Geefa/., 2003)、 Cys垸基化(Kelleher Wa/., 1995)、 二硫键形成(GeeM/.,200本文档来自技高网...

【技术保护点】
一种选择针对一种样品多肽的一组候选多肽的方法,包括:根据由质谱法产生的样品多肽碎片质量的差异对候选多肽集合进行的第一次精选;以及根据样品多肽的绝对质量和所述碎片的绝对质量对候选多肽集合进行的第二次精选。

【技术特征摘要】
【国外来华专利技术】1. 一种选择针对一种样品多肽的一组候选多肽的方法,包括 根据由质谱法产生的样品多肽碎片质量的差异对候选多肽集合进行的第一次精选;以及根据样品多肽的绝对质量和所述碎片的绝对质量对候选多肽集合 进行的第二次精选。2. 权利要求1的方法,其中第一次精选包括根据碎片质量的差异 确定样品多肽的至少部分氨基酸序列。3. 权利要求2的方法,进一步包括确定完整形式的样品多肽的绝对质量和样品多肽碎片的绝对质4. 权利要求2的方法,进一步包括 被精选的集合包括一仓库数据库;和基于样品多肽的所述至少部分氨基酸序列从所述仓库数据库中选 择候选多肽。5. —种确定样品多肽的一级结构的方法,包括 用权利要求1的方法选择一组候选多肽;通过将样品多肽的绝对质量与候选多肽的理论绝对质量数据进行 比较而得到匹配的概率值;禾口通过对匹配概率值排序而基于与候选多肽之一的匹配的最大概率 值而鉴别样品多肽的一级结构。6. 权利要求4的方法,其中所述仓库数据库进一步包括仓库数据 库中的至少一种多肽的至少一种鸟枪注释。7. 权利要求6的方法,其中所述鸟枪注释包括翻译后修饰。8. 权利要求7的方法,其中所述翻译后修饰包括选自如下一组的 至少一个成员,所述的组由核糖基化、磷酸化、烷基化、羟基化、糖 基化、氧化、还原、十四垸基化、生物素化、遍在蛋白化、碘化、亚 硝基化、氨基化、硫添加、环化、核苷酸添加、脂肪酸添加和酰化组 成。9. 权利要求4的方法,其中所述仓库数据库储存在计算机的电子 存储器中。10. 权利要求9的方法,其中用户可通过检索算法经电子通讯访 问计算机而从所述仓库数据库检索信息。11. 权利要求10的方法,其中所述检索算法进一步包括互联网 软件应用。12. —种筛选化合物对一种对多肽底物进行翻译后修饰的酶的抑 制活性的方法,包括-将所述酶与所述化合物接触以形成预混合物;以及 向所述预混合物中加入多肽底物以形成反应混合物; 用权利要求5的方法分析所述多肽底物。13. 权利要求12的方法,进一步包括加入与酶一起催化反应的辅 因子,其中所述辅因子包括选自由ATP、 ADP、 AMP、 GTP、 GDP、 GMP、 CTP、 CDP、 CMP、 UTP、 UDP和UMP组成的一组的至少 一个成员。14. 权利要求12的方法,其中所述酶被固定在一固相支持物上。15. —种用于计算机的计算机程序产品,所述计算机程序产品包 括计算机可用介质,在所述介质中具有计算机可读程序代码,以用于 针对一种样品多肽选择一组候选多肽,所述计算机程序产品包括计算机可读程序代码,用于指导计算机针对一种样品多肽选择一 组候选多肽,包括根据由质谱法产生的样品多肽碎片质量的差异对候选多肽集合进 行的第一次精选;以及 根据样品多肽的绝对质量和所述碎片的绝对质量对候选多肽集合 进行的第二次精选。 ■16...

【专利技术属性】
技术研发人员:尼尔L凯莱赫
申请(专利权)人:伊利诺斯大学理事会
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利