基于模糊判别和逻辑推理的蛋白酶解液的分析方法技术

技术编号：15689147 阅读：126 留言：0更新日期：2017-06-24 00:29

本发明专利技术公开了一种基于模糊判别和逻辑推理的蛋白酶解液的分析方法。本发明专利技术涉及一种基于模糊判别和逻辑推理的肽段-二级质谱(MS/MS)图匹配分析方法。该算法以Logistics函数来模拟人对谱图质量的模糊判断，以矩阵内积计算方案实现人对肽段序列的逻辑推导。经过Null-test测试，该算法与现有算法/软件(Mascot、Morpheus、Pfind、MaxQuant)比较，发现本发明专利技术的算法能通过Null-test，智能性比对照方法要高。该算法并不使用常规的离子空间来描述质谱数据匹配情况，使用的是肽段信息空间进行与质谱谱图的匹配运算。

Analysis method of protein hydrolysate based on fuzzy discrimination and logical reasoning

The present invention discloses a method for analyzing protein hydrolysate based on fuzzy discrimination and logic inference. The present invention relates to a method of peptide section two mass spectrum (MS/MS) graph matching analysis based on fuzzy discrimination and logic inference. In this algorithm, the Logistics function is used to simulate the fuzzy judgment of the quality of the spectrogram, and the inner product sequence of the matrix is used to realize the logic inference of the sequence of peptide segments. After the Null-test test, the algorithm is compared with the existing algorithms / software (Mascot, Morpheus, Pfind, MaxQuant), and it is found that the proposed algorithm can pass Null-test, and the intelligence is higher than the control method. The algorithm does not use the conventional ion space to describe the matching of mass spectral data. It uses the information space of peptide segments to match the mass spectra.

全部详细技术资料下载

【技术实现步骤摘要】
基于模糊判别和逻辑推理的蛋白酶解液的分析方法
本专利技术为蛋白质组学中判断候选肽段与二级质谱(MS/MS)图匹配程度的打分分析方法，用以对具体蛋白质序列库中所有候选肽段与实验从蛋白酶解液中采集的MS/MS谱图进行匹配打分，最终判别酶解液中存在哪些肽段。
技术介绍
目前，Shotgun方案是蛋白质组学研究从复杂体系中大量鉴定存在的蛋白质的重要方法。Shotgun策略通过将研究体系中的蛋白经蛋白酶水解之后，获得肽段，再从目标蛋白库进行匹配打分。打分算法的性能，决定了鉴定结果可靠程度。已有的打分算法或者基于概率模型，或者基于肽段的离子空间，或者有更为复杂的评价策略，经过人工甄别，会发现已有算法的鉴定结果假阳性依然偏高，会在根源上影响蛋白质组学的研究结果。本专利技术从模拟人工解析谱图的角度出发，开发出模拟人类模糊判断与逻辑推理的新打分算法，以达到人工解谱的稳健性与可靠性。
技术实现思路
为避免使用人工方法对几万个打分结果进行一一甄别优劣，测试比较方案使用Null-test方案。Null-test通过随机策略构造含有上万个随机序列蛋白的目标蛋白库，通过基于反库的Target-Decoy方案进行搜库匹配。在设定FDR(FalseDiscoveryRate)为20％的情况下，如果算法鉴定到的肽段为0或者1个，则算法能通过Null-test测试，性能稳健，具有一定的智能性；如果算法鉴定到的肽段大于1个，则说明算法在区分两个同为随机库的同性质序列库(随机库的反库依然为随机库)，算法过拟合，假阳性结果比较高。技术方案：基于模糊判别和逻辑推理的蛋白酶解液的分析方法，依据Shotgu...

【技术保护点】
基于模糊判别和逻辑推理的蛋白酶解液的分析方法，是基于模糊判别和逻辑推理的分析蛋白酶解液中肽段‑二级质谱(MS/MS)图匹配关系的方法，其特征在于：依据Shotgun Proteomics的要求，将蛋白酶解液进行二级质谱(MS/MS)分析，获大于或者等于一张的MS/MS二级质谱图；对已有的目标蛋白数据库(Target数据库)中所有的蛋白序列进行反序得到Decoy数据库，将两个数据库中的蛋白序列按照上述蛋白酶解液的获得过程进行模拟酶切，获得候选的肽段序列库；对于具体的一张MS/MS质谱图，按照设定的质量误差0‑50ppm，根据母离子的质量数从肽段序列库中筛选出候选的若干个肽段，如果筛选得到的肽段数目为0，则该MS/MS质谱图无效；如果筛选得到的肽段数目大于等于1为有效质谱图，则按照下述的打分方法计算肽段于二级质谱图的得分，得分最高的肽段为这张质谱图的最佳匹配肽段；对其它MS/MS质谱图进行上述打分操作，把所有的最佳“肽段‑质谱图”匹配结果按照得分从大到小排列，预设FDR(False Discover Rate)值为0‑5％，则能够计算出得分的截断值，则大于该得值的Target数据库的肽段就存在于蛋白酶解液中。...

【技术特征摘要】
1.基于模糊判别和逻辑推理的蛋白酶解液的分析方法，是基于模糊判别和逻辑推理的分析蛋白酶解液中肽段-二级质谱(MS/MS)图匹配关系的方法，其特征在于：依据ShotgunProteomics的要求，将蛋白酶解液进行二级质谱(MS/MS)分析，获大于或者等于一张的MS/MS二级质谱图；对已有的目标蛋白数据库(Target数据库)中所有的蛋白序列进行反序得到Decoy数据库，将两个数据库中的蛋白序列按照上述蛋白酶解液的获得过程进行模拟酶切，获得候选的肽段序列库；对于具体的一张MS/MS质谱图，按照设定的质量误差0-50ppm，根据母离子的质量数从肽段序列库中筛选出候选的若干个肽段，如果筛选得到的肽段数目为0，则该MS/MS质谱图无效；如果筛选得到的肽段数目大于等于1为有效质谱图，则按照下述的打分方法计算肽段于二级质谱图的得分，得分最高的肽段为这张质谱图的最佳匹配肽段；对其它MS/MS质谱图进行上述打分操作，把所有的最佳“肽段-质谱图”匹配结果按照得分从大到小排列，预设FDR(FalseDiscoverRate)值为0-5％，则能够计算出得分的截断值，则大于该得值的Target数据库的肽段就存在于蛋白酶解液中。2.按照权利要求1所述的分析方法，其特征在于：所述的打分方法是针对通过一级质谱母离子确定其于蛋白序列数据库中对应质量下的候选肽段序列S，对S与二级质谱的匹配程度进行打分；包括计算模糊评价指标w，生成信息表达矩阵C，对信息表达矩阵C进行矩阵内积计算获得信息表达矩阵X，将校验信息总和与互补信息的量p的加和后再与模糊判别指标w相乘得到最终得分score。3.按照权利要求2所述的分析方法，其特征在于：所述的计算模糊评价指标w的方案为：MS/MS二级谱图的肽段离子碎片有效信号比率指标u，处理无同位素标记谱图时：u＝(与候选肽段匹配的肽段离子碎片峰强度信号总和)/(当前谱图峰强度信号总和)；或，处理有同位素标记谱图时：u＝(与候选肽段匹配的有效标记肽段离子碎片峰强度信号总和)/(当前谱图有效标记峰强度信号总和)，通过Logistics公式1转换为模拟人对谱图质量的模糊评...

【专利技术属性】
技术研发人员：张丽华，张树荣，单亦初，张玉奎，
申请(专利权)人：中国科学院大连化学物理研究所，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人