一种基于谱图合并策略的蛋白质组鉴定新方法技术

技术编号:39397004 阅读:7 留言:0更新日期:2023-11-19 15:51
本发明专利技术公开了一种基于谱图合并策略的蛋白质组鉴定新方法。本发明专利技术针对痕量样品技术学重复质谱数据中未被解析的二级谱图,通过判断是否产生自同一个母离子进行匹配,匹配成功的技术学重复中未解析二级谱图可被进一步合并为一张二级谱图,合并后的新谱图再进行搜库解析鉴定。本发明专利技术不仅可以大幅提高微量样品蛋白质谱数据的解析率,使更多的二级谱图被成功解析;还可以在提高谱图解析率的基础上,提高蛋白质组的肽段和蛋白鉴定量,尤其是微量样品如单/微量细胞样品。单/微量细胞样品。

【技术实现步骤摘要】
一种基于谱图合并策略的蛋白质组鉴定新方法


[0001]本专利技术涉及生物信息学领域,具体涉及一种基于谱图合并策略的蛋白质组鉴定新方法。

技术介绍

[0002]生物体的任一器官、组织,以及人工培养的细胞株都是由一系列不同的细胞组成的,这些细胞的不同表现在具体分子组成以及功能上的不同。探索及发现细胞异质性对于理解机体的正常生理状态和疾病的发生发展过程来说是至关重要的。作为细胞功能的分子承担者,蛋白质组是我们探究细胞异质性的最有力手段。然而现有的常量蛋白质组分析基于的是大量细胞的平均测量值,无法真正探究细胞异质性,只有单细胞蛋白质组技术才能被用于回答这个问题。然而,由于单个哺乳动物细胞中全蛋白质的含量通常低于0.4ng,而蛋白质不能像DNA、RNA那样被扩增,因此需要极高灵敏度的技术才能分析单细胞的完整蛋白质组。而现有的主流蛋白质组分析仪器——质谱(Mass spectrometer,MS)的灵敏度仍受限,因此想要完整地分析一个细胞的蛋白质组仍是巨大的挑战。
[0003]目前最广为用于提高单细胞蛋白质组分析灵敏度的途径主要有两方面,一是在生物样品前处理上尽可能减少损失,即通过一系列手段减少样品蛋白和肽段由于转移、除盐等操作引入的吸附损失,同时提高酶切效率,获得尽可能多的可用于鉴定的肽段;二是从分析仪器出发,提高LC

MS/MS的分析灵敏度,使仪器对肽段及其碎片离子的响应更强。第一种手段相对易行一些,因为研究者即使无法开发或获得自动化的单细胞前处理机器,也可通过多种手段尽可能减少细胞蛋白前处理过程中的损失,其中主要是吸附损失,但是通过这种方法提高的单细胞蛋白鉴定覆盖度仍较为有限。而第二种手段,稳定且低流速的液相已被证实对提高单细胞蛋白质组鉴定覆盖度有很大的帮助,然而其制备起来十分困难,另外高灵敏度质谱仪的效果也十分显著但费用昂贵难以普及,也限制了该领域的进一步研究。值得注意的是,单细胞质谱数据的解析率通常远远低于常量质谱数据,这主要是因为单细胞肽段含量太低,在进入质谱仪并碎裂后,不足以产生丰富且具有可观信噪比的碎片离子,导致二级谱图难以被解析。

技术实现思路

[0004]本专利技术所要解决的技术问题是如何提高单细胞蛋白质组分析灵敏度和/或如何提高单细胞蛋白质组鉴定覆盖度和/或如何鉴定单细胞蛋白质组质谱数据和/或如何鉴定微量细胞蛋白质组质谱数据和/或如何鉴定微量蛋白消化物肽段和/或如何进行细胞异质性分析或单细胞分型。
[0005]为了解决上述技术问题,本专利技术首先提供了单细胞或微量细胞蛋白质组分析的装置,所述装置可包括如下模块:
[0006]A1)谱图数据首次搜库鉴定模块:用于将待测单细胞或微量细胞样本的技术学重复谱图数据在搜库软件中进行首次搜库获得首次鉴定肽谱匹配;所述技术学重复次数大于
等于2;
[0007]A2)未鉴定谱图提取模块:用于提取所述技术学重复谱图数据中未被所述首次搜库鉴定到肽段的谱图,得到未鉴定谱图数据;
[0008]A3)未鉴定谱图匹配模块:用于将所述未鉴定谱图数据基于母离子质量、电荷及保留时间在不同的所述技术学重复质谱数据间进行匹配,得到匹配文件;所述匹配文件中包含匹配在一起的未鉴定谱图;
[0009]A4)未鉴定谱图合并模块:用于将所述匹配文件中所述匹配在一起的未鉴定谱图进行合并,得到新谱图数据;
[0010]A5)再次搜库解析模块:用于将所述新谱图数据使用搜库软件再次搜库鉴定多肽,得到新鉴定肽谱匹配;
[0011]A6)蛋白质组分析结果输出模块:用于基于所述首次鉴定肽谱匹配和所述新鉴定肽谱匹配,输出所述待测单细胞或微量细胞蛋白质组分析结果。
[0012]所述技术学重复简称技术重复,是指对同一个样本重复相同的实验。所述重复可为2次以上的重复。
[0013]上述装置中,所述谱图数据可包括色谱数据和质谱数据,A3)所述匹配在一起的未鉴定谱图的母离子的保留时间差值可小于等于1min且母离子质量差可小于等于10ppm。
[0014]所述首次搜库所用的搜库软件可为MaxQuant。所述再次搜库所用的搜库软件可为Proteome Discoverer。
[0015]上文所述质谱数据可为二级质谱数据,也可为一级质谱数据。
[0016]上述装置中,所述单细胞样本的技术学重复谱图数据可为使用Easy nLC

1000纳升级液相色谱系统串联Oribitrap Exploris 480质谱仪(Thermo Fisher Scientific,USA)搭配FAIMS Pro(Thermo Fisher Scientific,USA)获得。
[0017]上述装置中,所述细胞肽段样本的技术学重复谱图数据可为使用Easy nLC

1000纳升级液相色谱系统串联Q Exactive HF质谱仪(Thermo Fisher Scientific,USA)获得。
[0018]上文所述装置中,A3)中所述匹配可通过包括如下步骤的方法实现:所述不同技术学重复包括n次技术学重复;将所述未鉴定谱图中的所述n次技术学重复中的每一个技术学重复的谱图分别作为基础文件进行一次所述匹配,共得到n个匹配文件。
[0019]上文所述装置可为装置1或装置2,
[0020]所述装置1中,A4)所述未鉴定谱图合并模块可包括如下模块:
[0021]A4

1)格式转换模块:用于将所述匹配文件中的所述未鉴定谱图转换为MASCOT通用格式文件,得到mgf格式匹配文件;
[0022]A4

2)合并模块:用于将所述mgf格式匹配文件中的所述匹配在一起的未鉴定谱图进行合并,得到新谱图数据文件。
[0023]所述装置2中,A4)所述未鉴定谱图合并模块可包括如下模块:
[0024]preA4

1)搜库模块:用于将所述匹配文件中所述匹配在一起的未鉴定谱图使用所述再次搜库所用的搜库软件进行搜库得到匹配文件鉴定肽谱匹配,
[0025]A4

1)格式转换模块:用于将所述匹配文件中的所述未鉴定谱图转换为MASCOT通用格式文件,得到mgf格式匹配文件,
[0026]A4

2)合并模块:用于将所述mgf格式匹配文件中的所述匹配在一起的未鉴定谱图
进行合并,得到新谱图数据文件,
[0027]A6)所述蛋白质组分析结果输出模块还包括用于将所述蛋白质组分析结果中去除所述匹配文件鉴定肽谱匹配的模块。
[0028]上述装置中,A5)所述再次搜库解析模块可通过包括如下步骤的方法实现:
[0029]将所述新谱图数据中添加部分所述技术学重复谱图数据得到添加新谱图数据,将所述添加新谱图数据使用搜库软件再次搜库鉴定多肽,得到新鉴定肽谱匹配。
[0030]上述装置中,所述部分可为所述样本中技术学重复谱图数据中的大于等于一个技术学重复的质谱数据。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.单细胞或微量细胞蛋白质组分析的装置,其特征在于:所述装置包括如下模块:A1)谱图数据首次搜库鉴定模块:用于将待测单细胞或微量细胞样本的技术学重复谱图数据在搜库软件中进行首次搜库获得首次鉴定肽谱匹配;所述技术学重复次数大于等于2;A2)未鉴定谱图提取模块:用于提取所述技术学重复谱图数据中未被所述首次搜库鉴定到肽段的谱图,得到未鉴定谱图数据;A3)未鉴定谱图匹配模块:用于将所述未鉴定谱图数据基于母离子质量、电荷及保留时间在不同的所述技术学重复质谱数据间进行匹配,得到匹配文件;所述匹配文件中包含匹配在一起的未鉴定谱图;A4)未鉴定谱图合并模块:用于将所述匹配文件中所述匹配在一起的未鉴定谱图进行合并,得到新谱图数据;A5)再次搜库解析模块:用于将所述新谱图数据使用搜库软件再次搜库鉴定多肽,得到新鉴定肽谱匹配;A6)蛋白质组分析结果输出模块:用于基于所述首次鉴定肽谱匹配和所述新鉴定肽谱匹配,输出所述待测单细胞或微量细胞蛋白质组分析结果。2.根据权利要求1所述的装置,其特征在于:所述谱图数据包括色谱数据和质谱数据,A3)所述匹配在一起的未鉴定谱图的母离子的保留时间差值小于等于1min且母离子质量差小于等于10ppm。3.根据权利要求1或2所述的装置,其特征在于:所述装置为装置1或装置2,所述装置1中,A4)所述未鉴定谱图合并模块包括如下模块:A4

1)格式转换模块:用于将所述匹配文件中的所述未鉴定谱图转换为MASCOT通用格式文件,得到mgf格式匹配文件;A4

2)合并模块:用于将所述mgf格式匹配文件中的所述匹配在一起的未鉴定谱图进行合并,得到新谱图数据文件;所述装置2中,A4)所述未鉴定谱图合并模块包括如下模块:preA4

1)搜库模块:用于将所述匹配文件中所述匹配在一起的未鉴定谱图使用所述再次搜库所用的搜库软件进行搜库得到匹配文件鉴定肽谱匹配,A4

1)格式转换模块:用于将所述匹配文件中的所述未鉴定谱图转换为MASCOT通用格式文件,得到mgf格式匹配文件,A4

2)合并模块:用于将所述mgf格式匹配文件中的所述匹配在一起的未鉴定谱图进行合并,得到新谱图数据文件,A6)所述蛋白质组分析结果输出模块还包括用于将所述蛋白质组分析结果中去除所述匹配文件鉴定肽谱匹配的模块。4.根据权利要求1

3中任一权利要求所述的装置,其特征在于:A5)所述再次搜库解析模块通过包括如下步骤的方法实现:将所述新谱图数据中添加部分所述技术学重复谱图数据得到添加新谱图数据,将所述添加新谱图数据使用搜库软件再次搜库鉴定多肽,得到新鉴定肽谱匹配。5.单细胞或微量细胞蛋白质组分析的方法,其特征在于:所述方法包括如下步骤:B1)谱图数据首次搜库鉴定:将待测单细胞或微量细胞样本的技术学重复谱图数据在
搜库软件中进行首次搜库获得首次鉴定肽谱...

【专利技术属性】
技术研发人员:秦伟捷陈永乐杜卓锟张养军
申请(专利权)人:中国人民解放军军事科学院军事医学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1