【技术实现步骤摘要】
本专利技术涉及生物信息学
,具体地说,本专利技术涉及一种对多肽交联肽段进行质谱鉴定的假发现率控制方法。
技术介绍
蛋白质鉴定是当代生物学研究中一项基础技术。近二十年来,随着质谱技术(Mass Spectrometry,MS)突飞猛进的发展,串联质谱技术(Tandem Mass Spectrometry,MS/MS)已成为蛋白质鉴定的主流技术,并促成了蛋白质组学的形成和壮大。经过几代人在算法和仪器上的不懈努力,高精度质谱技术下高通量蛋白质鉴定已经达到了一个相当高的水平,如Mann等人在2011年利用Orbitrap Velos质谱仪和MaxQuant软件已能在Hela细胞上采集的二级谱图中鉴定到58%的谱图,而利用本专利技术的专利技术人2013年开发的pFind软件可在相同数据集上鉴定80%以上的谱图。另一方面,蛋白质交联技术近年来也在不断发展。蛋白质交联技术是利用化学试剂来作为交联剂(linker)结合蛋白质肽段,在蛋白质之间形成稳定共价交联的技术。如果将蛋白质交联技术与质谱鉴定技术结合,就可以高通量地进行多种蛋白质内部结构和蛋白质间相互作用的分析。并且,通过交联剂的粘合作用,可以固定原本不稳定的、容易变化的相互作用化学键,从而帮助研究这类广泛存在的弱相互作用关系。为便于描述,蛋白质交联与质谱鉴定技术相结合的技术称为交联质谱技术。如前文所述,交联质谱技术存在诸多应用前景,然而,目前主流的蛋白质质谱鉴定技术都是针对单肽鉴定的基于数据库搜索的质谱鉴定方案,如果直接将这些质谱鉴定方案套用到多肽交联肽段的鉴定中,可能出现准确率过低、鉴定率过低等问题,其中一 ...
【技术保护点】
一种对多肽交联肽段进行质谱鉴定的假发现率控制方法,其特征在于,包括下列步骤:1)对于每张谱图,基于肽段匹配模型,在存储了单条肽段结构的数据库中进行搜索,得出匹配的n肽交联的鉴定结果;其中,所述存储了单条肽段结构的数据库既包括真实肽段结构也包括诱饵肽段结构;2)对于每个谱图的鉴定结果,根据该鉴定结果中分别匹配到真实肽段结构和诱饵假肽段结构的肽段数目,将该鉴定结果归类至鉴定结果集合Rk,其中Rk来表示n肽交联鉴定结果中,有k条肽段为诱饵肽段结构,(n‑k)条肽段为真实肽段结构的鉴定结果集合,0≤k≤n,n为不小于3的自然数;3)计算n肽交联的假发现率FDR(n);FDR(n)=Σk=1n(-1)k+1DkD0]]>其中,Dk表示属于鉴定结果集合Rk的鉴定结果数目。
【技术特征摘要】
1.一种对多肽交联肽段进行质谱鉴定的假发现率控制方法,其特征在于,包括下列步骤:1)对于每张谱图,基于肽段匹配模型,在存储了单条肽段结构的数据库中进行搜索,得出匹配的n肽交联的鉴定结果;其中,所述存储了单条肽段结构的数据库既包括真实肽段结构也包括诱饵肽段结构;2)对于每个谱图的鉴定结果,根据该鉴定结果中分别匹配到真实肽段结构和诱饵假肽段结构的肽段数目,将该鉴定结果归类至鉴定结果集合Rk,其中Rk来表示n肽交联鉴定结果中,有k条肽段为诱饵肽段结构,(n-k)条肽段为真实肽段结构的鉴定结果集合,0≤k≤n,n为不小于3的自然数;3)计算n肽交联的假发现率FDR(n); F D R ( n ) = Σ k = 1 n ( - 1 ) k + 1 D k D 0 ]]>其中,Dk表示属于鉴定结果集合Rk的鉴定结果数目。2.根据权利要求1所述的假发现率控制方法,其特征在于,所述步骤1)和步骤2)之间还包括步骤:1a)推断出每张谱图的鉴定结果是属于蛋白内交联结果还是蛋白间交联结果;对于鉴定结果属于蛋白内交联的谱图集合和鉴定结果属于蛋白间交联的谱图集合,分别执行所述步骤2);所述步骤2)中,对属于蛋白内交联的谱...
【专利技术属性】
技术研发人员:樊盛博,迟浩,孟佳明,卢珊,尹吉澧,孙瑞祥,董梦秋,贺思敏,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。