【技术实现步骤摘要】
一种基于质谱数据的N
‑
糖链结构鉴定Denovo方法及系统
[0001]本专利技术属于糖组学
,尤其涉及一种基于质谱数据的N
‑
糖链结构鉴定Denovo方法及系统。
技术介绍
[0002]目前:蛋白质的糖基化是生物体内普遍存在的蛋白质翻译后修饰,其N
‑
糖链结构在很大程度上决定着糖蛋白的生物功能。随着质谱技术的飞速提升,运用质谱数据对糖链结构进行鉴定,已是认识糖蛋白生物功能的重要方式。
[0003]N
‑
糖链是具有五糖核心固定结构的一种树状结构,目前N
‑
糖链结构鉴定的方法大体分为两类:1)数据库搜索方法;2)从头测序(Denovo)法;3)标签法。其中标签法是数据库搜索方法与从头测序法的结合。下面对数据库搜索方法和从头测序方法分别进行介绍。
[0004]1.数据库搜索方法:参照了GlycoSearchMS、GlycoPep DB、GlyDB等数据库,将某个未知结构的待测糖肽质谱图与带有注释的糖链结构的真实谱图进行相似性匹配,从而获得一个表示相似性的分值,将最佳匹配的糖链结构作为鉴定结果。基于该类方法的算法有GRIP、ArMone 2.0、GlycoPep Detector、Byonic、Protein
‑
Prospector、pGlyco 2.0等。
[0005]2.通常从头测序方法由两个过程组成,即枚举可能的糖链结构和评估这些候选结构,将具有最高分数的糖链结构作为鉴定结果。理想 ...
【技术保护点】
【技术特征摘要】
1.一种基于质谱数据的N
‑
糖链结构鉴定Denovo方法,其特征在于,所述基于质谱数据的N
‑
糖链结构鉴定Denovo方法,通过提取质谱数据中糖链碎片离子的结构和组成信息,引入广义单糖字典提升鉴定出的结构对质谱数据噪声的鲁棒性;引入基础峰和交叉峰,并基于交叉峰的支持来生长基础峰从而生长出糖链结构;用剪枝策略缩小鉴定结果候选结构的搜索空间,最终鉴定出质谱对应的N
‑
糖链结构。2.如权利要求1所述基于质谱数据的N
‑
糖链结构鉴定Denovo方法,其特征在于,所述基于质谱数据的N
‑
糖链结构鉴定Denovo方法包括以下步骤:步骤一,读取经过质谱仪处理后的质谱数据,提取鉴定所涉及的相关数据;通过对质谱的预处理,将质谱的质荷比m/z转换为质量m;采用五糖核心相关谱峰判断方法,判断是否存在五糖核心,若存在,则转向步骤二;步骤二,基于单糖和广义单糖,将质谱中具有单糖特性的谱峰质量校正为理论质量;步骤三,初始化糖链结构为树的根结点,糖链从初始结构不断生长,按照一定规则生长单糖,边生长边计算生长单糖后的结构的基础峰和交叉峰,并基于计算得到的基础峰和交叉峰生成所述结构的理论质谱;步骤四,通过剪枝策略对生长出的结构中同构的结构进行过滤,得到N
‑
糖链结构鉴定结果;对鉴定结果参考理论质谱进行打分评估,打分排名第一的结构即为鉴定出的糖链结构。3.如权利要求2所述基于质谱数据的N
‑
糖链结构鉴定Denovo方法,其特征在于,步骤一中,所述相关数据包括:糖链质量GlycanMass、肽链质量PeptideMass、低能量下获取的谱峰lowEnergyPeaks。4.如权利要求2所述基于质谱数据的N
‑
糖链结构鉴定Denovo方法,其特征在于,步骤二中,所述基于单糖和广义单糖,对具有五糖核心的质谱进行谱峰质量校正包括:(1)计算相邻谱峰的质量差Δm,某个单糖或广义单糖的质量在该范围内[Δm
‑
Δ,Δm+Δ],则该质量差匹配上了该单糖或广义单糖质量,其中Δ是值为0.2的矫正误差;(2)将质量差更新为相应单糖或广义单糖的质量,重新计算加上相应单糖质量或广义单糖质量后的新的质量即为校正后的质量,所述单糖特性谱峰质量校正后的质量即其理论质量。5.如权利要求2所述基于质谱数据的N
‑
糖链结构鉴定Denovo方法,其特征在于,步骤三中,所述糖链结构生长单糖的规则包括:以每次试图生长最轻单糖为原则。6.如权利要求2所述基于质谱数据的N
‑
糖链结构鉴定Denovo方法,其特征在于,所述基础峰和交叉峰包括:基础峰即谱图S中仅与单条单糖路径有关的峰:谱图S对应的糖链G的每条单糖路径上的单糖质量的和分别记为m=b
i
...
【专利技术属性】
技术研发人员:张军英,杨芝,吴金辉,刘继源,孙士生,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。