一种利用高能碰撞诱导电离碎裂技术鉴定蛋白的方法技术

技术编号:9858412 阅读:141 留言:0更新日期:2014-04-02 19:03
本发明专利技术公开了一种利用高能碰撞碎裂技术(high collision induced dissociation)鉴定蛋白的方法。本发明专利技术提供了一种利用高能碰撞碎裂技术鉴定未知目的蛋白的方法,包括主要步骤如下:用搜索引擎对获得的二级HCD质谱图进行候选肽段搜索并生成理论谱;再匹配所述实验谱与所述理论谱,输出鉴定结果;所述生成理论谱为同时进行生成理论b离子单一同位素峰质荷比、生成理论y离子单一同位素峰质荷比和对y离子增加第一同位素峰离子的质荷比。本发明专利技术的方法简单有效,可在不更改数据库搜索引擎数据结构和匹配打分算法下显著提升肽段鉴定灵敏度。

【技术实现步骤摘要】

本专利技术涉及生物信息学领域,尤其涉及。
技术介绍
随着质谱技术的发展,高能碰撞碎裂技术(HCD, high-energy collisioninduced dissociation)被广泛用于蛋白质组表达谱和修饰谱的定性和定量鉴定中(Olsen, Macek et al.2007 ;Nagaraj, D' Souza et al.2010;Savitski, Mathieson etal.2010;de Graaf, Altelaar et al.2011;Frese, Altelaar et al.2011)? 新一代的高精度质谱仪LTQ-OrbiTrap Velos的HCD 二级图谱产出灵敏度与CID (collisioninduceddissociation)接近或相当,均高于电子转移碎裂(ETD, electron transferdissociation)图谱,但HO)图谱质量更佳,具有更高的鉴定成功率(Frese, Altelaar etal.2011),这是因为HCD质谱数据具有以下特点:(I) 二级质量分辨率可达15000,质量精度可达ppm级别(Olsen, Macek etal.2007),可有效减少子离子错误匹配,从而显著提高肽段打分和图谱鉴定率。例如,Frese等人使用Hela细胞样品,系统比较了不同上样量条件下CID、HCD和ETD等三种裂解模式CID、HCD和ETD的MASCOT鉴定结果,发现HCD质谱数据具有最高的图谱匹配打分(ionscore)以及最高的图谱鉴定成功率(>50%) (Frese, Altelaar et al.2011) ? Shen等人将高质量精度的二级离子信息用于肽段鉴定质控的特征参数,比常规的搜索引擎多过滤出20%-40% 的肽段鉴定结果(Shen, T0Iicet al.2011)。(2)肽段碎裂充分,二级谱的离子连续性好。针对HCD图谱进行从头测序(denovo)效果较好。Shen Y等人详细比较了相同方法下CID、HCD和电子转移碎裂(ETD)图谱得到的连续碎片离子长度,发现7个氨基酸以上的肽段鉴定结果中,HCD图谱具有最高的肽段鉴定数(Shen,Tolic et al.2`011)。中科院计算所发展了专门针对HCD的质谱数据从头测序软件PN0V0,利用了二级碎裂离子高质量精度、低质量区域离子丰富、存在内部碎片(internal)和亚氨(immonium)离子等特点对HCD图谱从头测序,与常规搜索引擎鉴定结果重叠率达到80%以上,并可寻找脱酰胺基修饰和氨基酸突变(Chi,Sun et al.2010)。(3)低质量区域碎片离子丰富,可提高iTRAQ报告离子碎裂峰强从而提高定量精度(McAlister, Phanstiel et al.2010)。(4)可产生internal离子和immonium离子,某些immonium离子是修饰鉴定的重要特征离子(Olsen, Macek et al.2007; Nagaraj, D' Souza et al.2010)。尽管HCD图谱质量更好,但现有的HCD数据搜索引擎和质量控制方法仍沿用CID数据的分析策略,未能充分利用HCD数据特点,相对于硬件的发展,HCD的数据分析算法和工具面临发展相对滞后的状态。国际上专门针对HCD数据的分析方法非常有限,仅有的集中在HCD数据的预处理、鉴定结果质控和从头测序上。如Savitski等人设计了 H-score,通过对HCD图谱进行去同位素峰(de-1sotope) (Nielsen, Savitski et al.2005)和解卷积(de-convolution)(Zhang, Ficarro et al.2009),以及对MASCOT鉴定结果重打分来提高了肽段鉴定灵敏度(Savitski, Mathieson et al.2010)。另一方面,使用蛋白质序列数据库搜索策略进行图谱鉴定时(其基本原理是产生肽段的理论碎裂图谱,并与实际图谱进行匹配,通过匹配相似性的好坏来鉴定序列),现有的数据库搜索引擎如MASCOT、SEQUEST和X!Tandem等仍产生较为简单的序列理论图谱,未充分利用HCD图谱特征,例如对碎片离子的相对峰强进行简单的模拟(Li,Arnold etal.2010),不考虑高精度二级碎片离子的同位素峰信息及其它离子类型等,造成了 HCD图谱鉴定灵敏度的损失。综上所述,现有HCD数据解析面临以下问题:(1)常规搜索引擎如MASCOT、SEQUEST和X!Tandem等并未针对HCD设计相应的理论图谱和匹配打分,对HCD的处理仍沿用与CID相同的理论谱和打分方法;(2)肽段鉴定质控方法未充分利用HCD数据特征。如Η-score并未将高质量精度、internal和immonium离子类型考虑在内,并且仅针对富含修饰的样品数据。MASCOTPercoIator 中也仅考虑了 b、y 离子匹配(Brosch, Yu et al.2009)。(3)现有针对HCD图谱的从头测序算法考虑修饰类型有限,目前尚未见针对HCD数据的修饰类型预筛方法。(4)在图谱库搜索方面,目前尚未出现针对HCD数据优化的图谱库构建方法和图谱库搜索引擎(Lam 2011)。随着HCD技术的不断进步,其在表达谱、修饰谱构建及蛋白质定量研究领域会发挥越来越重要的作用。了解和充分利用HCD数据特征,发展相应的鉴定、质控和定量算法,开发HCD质谱数据的深度解析平台是当务之急。
技术实现思路
本专利技术旨在利用HCD图谱二级碎裂离子具有丰富的同位素峰信息以及高质量精度特点,通过在理论谱中增加同位素峰信息来提高肽段鉴定的准确度、灵敏度和成功率。本专利技术的目的是建立一种利用高能碰撞碎裂产生丰富的高精度二级同位素峰的高效鉴定未知目的蛋白的方法,尤其是提供一种利用高能碰撞碎裂鉴定待测蛋白的方法。本专利技术提供的方法,包括如下步骤:1)将待测蛋白酶解得到肽段;2 )将所述肽段经液相色谱质谱串联检测,得到二级HCD质谱图,记作实验谱;所述液相色谱-质谱串联中的二级质谱产生模式采用高能碰撞碎裂;检测采用高分辨质量检测器,由此产生二级HCD质谱图;3)将所述二级HCD质谱图转换成数据库搜索引擎可读格式;4)用搜索引擎先对经过3)处理的二级HCD质谱图进行候选肽段搜索并生成理论谱;再匹配所述实验谱与所述理论谱,输出鉴定结果;所述生成理论谱为同时进行生成理论b离子单一同位素峰质荷比、生成理论y离子单一同位素峰质荷比和对y离子增加第一同位素峰离子的质荷比;将所述生成理论y离子的单一同位素峰质荷比记作m/zyi述对y离子增加其第一同位素峰离子的质荷比记作m/Zyi’,且m/Zyi' =m/zyi+l.003355/z, yi代表候选肽段从C端开始数第i个肽键位置断裂后形成的I离子;yi’表示代表候选肽段从C端开始数第i个肽键位置断裂后形成的I离子的第一同位素峰,其中i=l,2,3,...L-1 ;L为候选肽段的长度;5)将所述鉴定结果进行质量控制和错误发现率(false discovery rate, FDR)计算,得到待测蛋白中肽段的序列和数目,实现鉴定待测蛋白之目的。上述方法中,步骤I)中,所述酶为蛋本文档来自技高网
...

【技术保护点】
一种利用高能碰撞碎裂鉴定待测蛋白的方法,包括如下步骤:1)将待测蛋白酶解得到肽段;2)将所述肽段经液相色谱质谱串联检测,得到二级HCD质谱图,记作实验谱;所述液相色谱质谱串联中的中的二级质谱产生模式采用高能碰撞碎裂;3)将所述二级HCD质谱图转换成数据库搜索引擎可读格式;4)用搜索引擎先对经过3)处理的二级HCD质谱图进行候选肽段搜索并生成理论谱;再匹配所述实验谱与所述理论谱,输出鉴定结果;所述生成理论谱为同时进行生成理论b离子单一同位素峰质荷比、生成理论y离子单一同位素峰质荷比和对y离子增加第一同位素峰离子的质荷比;将所述生成理论y离子的单一同位素峰质荷比记作m/zyi,所述对y离子增加其第一同位素峰离子的质荷比记作m/zyi’,且m/zyi’=m/zyi+1.003355/z,yi代表候选肽段从C端开始数第i个肽键位置断裂后形成的y离子;yi'表示代表候选肽段从C端开始数第i个肽键位置断裂后形成的y离子的第一同位素峰,其中i=1,2,3,...L‑1;L为候选肽段的长度;5)将所述鉴定结果进行质量控制和错误发现率计算,得到待测蛋白中肽段的序列和数目,实现鉴定待测蛋白。

【技术特征摘要】
1.一种利用高能碰撞碎裂鉴定待测蛋白的方法,包括如下步骤: I)将待测蛋白酶解得到肽段; 2 )将所述肽段经液相色谱质谱串联检测,得到二级HCD质谱图,记作实验谱;所述液相色谱质谱串联中的中的二级质谱产生模式采用高能碰撞碎裂; 3)将所述二级HCD质谱图转换成数据库搜索引擎可读格式; 4)用搜索引擎先对经过3)处理的二级HCD质谱图进行候选肽段搜索并生成理论谱;再匹配所述实验谱与所述理论谱,输出鉴定结果; 所述生成理论谱为同时进行生成理论b离子单一同位素峰质荷比、生成理论I离子单一同位素峰质荷比和对y离子增加第一同位素峰离子的质荷比; 将所述生成理论I离子的单一同位素峰质荷比记作m/zyi,所述对y离子增加其第一同位素峰离子的质荷比记作m/zyi’,且m/zyi’ =m/zyi+l.003355/z, yi代表候选肽段从C端开始数第i个肽键位置断裂后形成的I离子;yi,表示代表候选肽段从C端开始数第i个肽键位置断裂后形成的I离子的第一同位素峰,其中i=l,2,3,...L-1 ;L为候选肽段的长度; 5)将所述鉴定结果进行质量控制和错误发现率计算,得到待测蛋白中肽段的序列和数目,实现鉴定待测蛋白。2.根据...

【专利技术属性】
技术研发人员:徐平李宁
申请(专利权)人:中国人民解放军军事医学科学院放射与辐射医学研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1