一种蛋白质组学中肽段的肽段定量效率预测方法技术

技术编号：18861292 阅读：201 留言：0更新日期：2018-09-05 14:37

本发明专利技术公开了一种蛋白质组学中肽段的肽段定量效率预测方法，其步骤包括：1)筛选出高可信蛋白，将高可信蛋白的鉴定肽段作为高可信肽段；2)计算所述高可信肽段的物理化学性质和肽段定量效率；其中，所述肽段定量效率为肽段的质谱信号强度对肽段的真实量的反应程度；3)基于高可信肽段的物理化学性质和肽段定量效率，构建预测肽段定量效率模型的训练集；然后利用该训练集训练得到肽段定量效率预测模型；4)利用所述肽段定量效率预测模型预测鉴定蛋白的各鉴定肽段的肽段定量效率。本发明专利技术的方法使用高可信肽段构建训练集，在线训练肽段定量效率，排除了实验操作，实验仪器等引起的误差。

A prediction method for peptide segment quantitative efficiency in proteomics

The present invention discloses a method for predicting the quantitative efficiency of peptide segments in proteomics. The steps include: 1) screening out highly trusted proteins and taking the identified peptides of highly trusted proteins as highly trusted peptides; 2) calculating the physicochemical properties and the quantitative efficiency of the highly trusted peptides; and the quantitative efficiency of the peptides is 3) Constructing a training set for predicting the quantitative efficiency model of peptides based on the physicochemical properties and the quantitative efficiency of peptides; then using the training set to train the quantitative efficiency prediction model of peptides; 4) Using the quantitative efficiency prediction model of peptides; The predicted peptide identification efficiency of each identified peptide segment was quantified. The method of the invention uses a high reliable peptide segment to construct a training set, trains the quantitative efficiency of the peptide segment on-line, and eliminates errors caused by experimental operation, experimental instruments, etc.

全部详细技术资料下载

【技术实现步骤摘要】
一种蛋白质组学中肽段的肽段定量效率预测方法
本专利技术涉及基于质谱的蛋白质组学中的肽段及蛋白质定量方法研究，尤其涉及一种肽段定量效率预测方法。
技术介绍
继鉴定蛋白质组学之后，定量蛋白质组学已经成为了生命科学领域的下一个研究热点。其研究内容主要包括基于质谱数据对蛋白质进行有标记的定量和无标记的定量。虽然无标记的定量在准确率上不如有标记的定量，但是鉴于无标记定量的操作简单，成本低廉等优点，无标记定量在大规模蛋白质定量中仍是首选方法。蛋白质定量的理想实验方法是为每个蛋白质都加入内标，然而，这种做法对于分析复杂样品来说，意味着高昂的费用。目前，最常用的方法是基于部分内标做线性拟合计算的方法。在这些方法中，首先根据添加的标准蛋白的已知实际浓度与其质谱信号强度的关系得到线性关系式，然后再用得到的线性关系式来预测样本中的其他蛋白质的浓度。这类方法的核心是根据肽段的质谱强度或者谱图数目来计算蛋白质的质谱强度。但是，目前开发的算法的效果远远不能让人们满意，因为这些算法直接使用的是肽段的原始谱图信号强度，而这些强度并不能准确的描述肽段的实际丰度。影响一个肽段在质谱中的观测信号的因素有很多。观测到的肽段信号强度不仅依赖于它们在样本中的实际浓度，而且与它们的物理化学性质和质谱检测效率有很大的关系。相同浓度的肽段也许会有完全不同的质谱信号强度。例如，即使来自于同一个蛋白的肽段的质谱信号强度也有可能会相差几个数量级。如果一个蛋白质有足够多的肽段被鉴定到了，那么这些肽段的质谱信号强度就有可能被校正过来，从而得到准确的蛋白质绝对定量结果。否则，肽段层面的质谱信号强度偏差就会被传递到蛋白...

【技术保护点】
1.一种蛋白质组学中肽段的肽段定量效率预测方法，其步骤包括：1)筛选出高可信蛋白，将高可信蛋白的鉴定肽段作为高可信肽段；2)计算所述高可信肽段的物理化学性质和肽段定量效率；其中，所述肽段定量效率为肽段的质谱信号强度对肽段的真实量的反应程度；3)基于高可信肽段的物理化学性质和肽段定量效率，构建预测肽段定量效率模型的训练集；然后利用该训练集训练得到肽段定量效率预测模型；4)利用所述肽段定量效率预测模型预测鉴定蛋白的各鉴定肽段的肽段定量效率。

【技术特征摘要】
1.一种蛋白质组学中肽段的肽段定量效率预测方法，其步骤包括：1)筛选出高可信蛋白，将高可信蛋白的鉴定肽段作为高可信肽段；2)计算所述高可信肽段的物理化学性质和肽段定量效率；其中，所述肽段定量效率为肽段的质谱信号强度对肽段的真实量的反应程度；3)基于高可信肽段的物理化学性质和肽段定量效率，构建预测肽段定量效率模型的训练集；然后利用该训练集训练得到肽段定量效率预测模型；4)利用所述肽段定量效率预测模型预测鉴定蛋白的各鉴定肽段的肽段定量效率。2.如权利要求1所述的方法，其特征在于，所述高可信蛋白为至少包含N个唯一肽段的蛋白；所述唯一肽段是指在已鉴定到的蛋白中唯一在一个蛋白组出现的肽段；所述蛋白组是指经过蛋白装配之后得到的同组蛋白集合。3.如权利要求1所述的方法，其特征在于，计算所述肽段定量效率的方法为：对于每一所述高可信蛋白i，首先计算该高可信蛋白i的信号强度最高的肽段的定量效率；Qi,j表示高可信蛋白i的肽段j的肽段定量效率，Qi,max＝maxjQi,j表示高可信蛋白i的信号强度最高的肽段的定量效率；其中，通过公式计算Qi,max的估计值作为Qi,max；ni表示高可信蛋白i的期望肽段数目；然后利用公式计算所述高可信蛋白i的其他鉴定肽段的肽段定量效率；其中，Ii,j为高可信蛋白i的肽段j的质谱信号强度，Ii,max为高可信蛋白i的所有肽段的质谱信号强度中的最大值。4.如权利要求1所述的方法，其特征在于，构建所述训练集的方法...

【专利技术属性】
技术研发人员：付岩，常乘，高志强，朱云平，
申请(专利权)人：中国科学院数学与系统科学研究院，中国人民解放军军事科学院军事医学研究院，北京蛋白质组研究中心，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人