System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于子离子类型可辨识且子离子全覆盖的直读型蛋白质和蛋白质组精准从头测序方法技术_技高网

一种基于子离子类型可辨识且子离子全覆盖的直读型蛋白质和蛋白质组精准从头测序方法技术

技术编号:41348797 阅读:3 留言:0更新日期:2024-05-20 10:03
本发明专利技术提出了一项基于成对镜像酶消化肽段氨基酸编码技术的子离子类型可辨子离子全覆盖原理的蛋白质和蛋白质组氨基酸序列直接读取型精准从头测序技术。公开了一种基于赖氨酸(K)和精氨酸(R)质量亏损氨基酸编码(NeuCode)双标记确定子离子类型,并结合成对镜像酶切实现子离子全覆盖的氨基酸序列直接读取型蛋白质精准从头测序新方法。该方法利用K/R NeuCode氨基酸标记蛋白,并采用成对镜像酶酶切获得镜像肽段,镜像肽段经串联质谱分析获得的镜像谱图,其中子离子全覆盖且子离子类型可辨识,从而可以根据相邻两个同类子离子质量差直接读出二级谱图中氨基酸序列信息,实现蛋白质氨基酸序列的直接读取和精准测序。

【技术实现步骤摘要】

本专利技术涉及蛋白质从头测序技术原理及方法,具体地说是一种通过胰酶/赖氨酸精氨酸n端蛋白酶等成对镜像酶酶切产生带有重稳定性同位素标记赖氨酸(k)/精氨酸(r)neucode双标记蛋白,从而产生带有准等重氨基酸标记的成对镜像肽段,可用于实现子离子类型可辨序列全覆盖的直读型蛋白质精准从头测序的方法。


技术介绍

1、蛋白质作为生命活动与功能的执行者,直接参与调控各种生物学过程。蛋白质的结构决定了其功能多样性,而准确解析蛋白质的氨基酸序列信息,即蛋白质测序,是探究蛋白质更高级结构和功能的前提。早期的蛋白质测序方法是以化学降解为主,如edman降解法(edman p.a method for the determination of amino acid sequence inpeptides.arch biochem.1949jul;22(3):475.pmid:18134557),利用化学试剂将单一蛋白质的n端氨基酸依次水解,然后通过高效液相色谱分离氨基酸进行鉴定。该方法可以对蛋白质和多肽的n末端近20个氨基酸残基序列进行分析,但难以实现大分子量蛋白质的全序列测定。随着高通量、高灵敏的生物质谱技术发展,质谱法已经成为了蛋白质测序的首选方法。基于质谱的蛋白质测序包括两种策略,一种是自上而下的蛋白质测序,通过电喷雾电离(esi)或基质辅助激光解吸电离(maldi)等技术,直接对完整蛋白质进行分析。这种分析方法可以从整体上把握蛋白质分子量、结构等信息,但对于分子量稍大的蛋白质,其碎裂后产生的碎片离子常因质量接近而难以区分,从而降低了解析的精确度,不利于掌握蛋白质的氨基酸序列信息。因此,解析氨基酸序列信息时,更常用的是自下而上的分析策略,也叫鸟枪法蛋白质测序,即蛋白质或蛋白质组被消化形成多肽混合物,肽混合物经色谱分离、离子化后,通过串联质谱检测,生成多肽碎片图谱,用于肽段序列鉴定,最后从鉴定的肽段去推导出可能的蛋白质。其中对生成的大量多肽碎片图谱数据进行分析时,又有不同的选择,对于已有蛋白质序列或数据库可参考的蛋白质或物种,可以采用数据库搜索的方式进行鉴定。常用的搜库软件包括mascot、maxquant、pfind等。

2、但对于尚未建立蛋白质数据库的物种或者由于基因突变导致氨基酸序列发生变化的蛋白质,无法通过搜库鉴定,此时需要对蛋白质进行从头(denovo)测序。蛋白质从头测序的显著特征是非数据库依赖,因此,从头测序在未知蛋白质,如抗体、肿瘤新抗原等的鉴定,发现新蛋白、新基因事件,校正数据库中被错误注释蛋白等方面起重要作用。蛋白质从头测序新技术的开发,具有重要的科学意义和实用价值。

3、基于质谱的蛋白质从头测序原理是利用肽段碎裂产生的碎片离子的质荷比和强度等信息计算二级谱图中谱峰之间的质量差,推断氨基酸信息以及氨基酸上的翻译后修饰,从而获得肽段序列信息,最后再对已测得的片段进行拼接、组装,得到完整蛋白序列。目前,虽然已有大量算法和软件被开发用于蛋白质从头测序,包括peaks系列、pnovo系列、pepnovo、novor等,有效提升了从头测序的效率,但其测序的准确性上仍然有待提升。thilomuth等人对目前常用的三种测序软件novor、peaks、pepnovor的准确性进行了评估,其中仅有40%左右的从头测序结果与数据库搜索结果一致,这表明从头测序算法的精度上仍然有大量提升空间。进一步对其谱图数据分析发现,导致从头测序精度低的原因主要是存在大量的噪声峰干扰以及串联质谱中肽段碎片离子覆盖率低。尤其是后者,当片段离子覆盖率从100%下降到50%时,由于碎片离子的缺失会导致连续氨基酸的顺序发生变化,最终正确测序的肽段的比例直接从80%下降到了20%(muth,t.,&renard,b.y.(2018).evaluatingde novo sequencing in proteomics:already an accurate alternative to database-driven peptide identification?.briefings in bioinformatics,19(5),954–970.;yang,h.,chi,h.,zeng,w.f.,zhou,w.j.,&he,s.m.(2019).pnovo 3:precise de novopeptide sequencing using a learning-to-rank framework.bioinformatics(oxford,england),35(14),i183–i190)。在实际的谱图中存在噪声和干扰离子,会导致无法准确地识别谱图中肽段的特征碎片离子,再加上肽段母离子碎裂不完全,致使部分碎片离子缺失,导致谱图解析的准确性降低,那么在肽段从头测序准确率低的情况下,后续序列拼接的正确性也难以保证。因此,二级谱图中子离子覆盖深度与子离子类型判断成了从头测序技术的关键所在,但同时也是当前从头测序技术发展所面临的主要挑战。为此,研究者们也从多个方面提出了针对性的解决策略。

4、为判断二级谱图中碎片离子类型,研究者利用重稳定同位素标记技术将肽段的n端、c端同时进行化学修饰与标记,利用两个被分别标记并具有微小质量差的相同序列肽段的碎片离子在二级谱图上产生的双峰信号帮助辨识碎片离子的类型,帮助肽段的鉴定(a.,sedo,o.,j.,&zdráhal,z.(2014).asimplified method for peptidede novo sequencing using(18)o labeling.european journal of mass spectrometry(chichester,england),20(3),255–260.;zhang s,shan y,zhang s,sui z,zhang l,liang z,zhang y.niptl-novo:non-isobaric peptide termini labeling assistedpeptide de novo sequencing.j proteomics.2017feb10;154:40-48)。但是这些策略仍存在不足。如同一肽段经标记处理后,可能因理化性质改变,导致色谱的保留时间发生变化而无法被同时洗脱。即使可以同时洗脱,为了使母离子能同时碎裂,也需要增大二级碎裂窗口,这会增加共碎裂的离子数目,反而使得谱图复杂性增加。然而,richards al等提出的质量亏损赖氨酸编码(k neucode)标记策略可以规避这些不足。其运用两种准等重同位素赖氨酸:l-lysine-13c615n2(k602)和l-lysine-2h8(k080)分别标记同一蛋白,经lysc酶切后产生c端带k602或k080的质量亏损差值仅有0.036da的准等重肽段。在液相色谱-串联质谱分析时,准等重肽段可以同时洗脱并在不改变分离窗口的条件下被同时选择并进行hcd碎裂,在高分辨率二级质谱中,产生的y离子峰为具有36mda质量差的neucode双峰。根据neucode双峰信号确定碎片离本文档来自技高网...

【技术保护点】

1.一种基于子离子类型可辨识且子离子全覆盖的直接读取型的蛋白质精准从头测序方法,包括下述步骤:

2.根据权利要求1所述的方法,其中所述步骤1)包括:用重稳定同位素对所述质量亏损氨基酸对进行标记,产生标记的质量亏损赖氨酸对L-lysine-13C615N2(K602)和L-lysine-2H8(K080)、质量亏损精氨酸对L-arginine-15N4(R004)和L-arginine-2H4(R040)。

3.根据权利要求2所述的方法,其中步骤2)所述的蛋白酶及其镜像蛋白酶为Trypsin/LysargiNase或LysC/LysN蛋白酶对。

4.根据权利要求1所述的方法,其中所述步骤3)包括使用二级高分辨率质谱仪分析镜像肽段,获得镜像肽段二级谱图;和

5.根据权利要求4所述的方法,其中步骤3)的二级质谱的分辨率设置为6,0000(m/z=200)及以上。

6.根据权利要求1-2任一项所述的方法,其中步骤1)的标记方法包括:

7.根据权利要求1-3任一项所述的方法,其中所述步骤2)中的消化条件包括:

<p>8.根据权利要求6所述的方法,其中质量亏损赖氨酸对添加浓度为30μg/mL,质量亏损精氨酸对添加浓度为20μg/mL;提取蛋白质的提取液为PBS非变性裂解液或者含8M尿素的变性裂解液。

9.根据权利要求7所述的方法,其中使用5mM三(2-羰基乙基)磷盐酸盐(TCEP)和15mM碘乙酰胺(IAM)避光25℃还原和烷基化处理15min,以使蛋白质充分变性;将处理后的蛋白溶液均分两份,使用50mM碳酸氢铵将溶液中尿素浓度稀释至1M以下,一份以底物/酶比为50:1(质量比)加入Trypsin/LysC/ArgC,用1M碳酸氢铵溶液调节pH在7.5~8.5之间,在37℃消化10-16h;另一份以底物/酶比为50:1(质量比)加入LysargiNase/LysN/AgrN,用1M HEPES缓冲液调节pH在7.5~8.5之间,在37℃消化10-16h;或者分别以GluC或AspN以其适合的条件进行消化;然后在各酶解体系中添加1%FA以终止消化反应,使用C18StageTips对酶切后的样品进行除盐,获得可用于质谱检测的肽段样品。

10.根据权利要求1-9任一项所述的方法,其中步骤3)所述的色谱分离与质谱分析包括:将得到的肽段样品分别使用含0.1%甲酸和1%乙腈的液相色谱串联质谱上样缓冲液溶解,使用反相高效液相色谱进行分离,串联质谱进行检测,计算标记效率,为识别二级谱图中NeuCode双峰信号,将二级质谱分辨率设置为60000(m/z=200)及以上;

11.一种直接读取型的蛋白质精准从头测序方法,包括下述步骤:

12.根据权利要求11所述的方法,包括下述步骤:

...

【技术特征摘要】

1.一种基于子离子类型可辨识且子离子全覆盖的直接读取型的蛋白质精准从头测序方法,包括下述步骤:

2.根据权利要求1所述的方法,其中所述步骤1)包括:用重稳定同位素对所述质量亏损氨基酸对进行标记,产生标记的质量亏损赖氨酸对l-lysine-13c615n2(k602)和l-lysine-2h8(k080)、质量亏损精氨酸对l-arginine-15n4(r004)和l-arginine-2h4(r040)。

3.根据权利要求2所述的方法,其中步骤2)所述的蛋白酶及其镜像蛋白酶为trypsin/lysarginase或lysc/lysn蛋白酶对。

4.根据权利要求1所述的方法,其中所述步骤3)包括使用二级高分辨率质谱仪分析镜像肽段,获得镜像肽段二级谱图;和

5.根据权利要求4所述的方法,其中步骤3)的二级质谱的分辨率设置为6,0000(m/z=200)及以上。

6.根据权利要求1-2任一项所述的方法,其中步骤1)的标记方法包括:

7.根据权利要求1-3任一项所述的方法,其中所述步骤2)中的消化条件包括:

8.根据权利要求6所述的方法,其中质量亏损赖氨酸对添加浓度为30μg/ml,质量亏损精氨酸对添加浓度为20μg/ml;提取蛋白质的提取液为pbs非变性裂解液或者含8m尿素的变性裂解液。

9.根据权利...

【专利技术属性】
技术研发人员:徐平康荔李衍常戴嘉兴张瑶姜松昊常蕾
申请(专利权)人:中国人民解放军军事科学院军事医学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1