建立健康人尿蛋白质组定量参考范围的方法及健康人尿蛋白质组数据库技术

技术编号:18554029 阅读:25 留言:0更新日期:2018-07-28 11:01
本发明专利技术公开了建立健康人尿蛋白质组定量参考范围的方法和健康人尿蛋白质组数据库,是将统计数量健康人的尿样制成尿蛋白样品,经质谱检测、搜库及定量确定其中的蛋白种类及各蛋白的定量形成一个尿蛋白质组数据,将不同尿蛋白质组数据归集不同的尿蛋白质组亚数据集和总数据集,利用数据集的数据计算得到健康人尿蛋白质组定量参考范围。利用本发明专利技术建立的健康人尿蛋白组数据库中人尿蛋白的定量参考范围能够更好地排除在尿蛋白生物标志物发现过程中来自生理性波动和个体间差异蛋白的干扰。

【技术实现步骤摘要】
建立健康人尿蛋白质组定量参考范围的方法及健康人尿蛋白质组数据库
本专利技术属于医药生物领域中生物标志物数据的建立,特别涉及利用能覆盖个体内及个体间生理性波动和差异的健康人尿蛋白质组数据集建立健康人尿蛋白质组定量参考范围的方法以及所建立起的健康人尿蛋白质组数据库。
技术介绍
尿液是临床检验中除血液外最常用的体液样本,尿常规中对胆红素、葡萄糖、酮体、蛋白、血细胞等指标的检测被用于各种疾病的诊断或疗效监测。鉴于尿液检测在健康医学方面的重要价值,世界各国科学家一直在利用蛋白质组学技术试图从尿液中找到新的用于疾病诊断、预后判定、疗效检测的蛋白标志物。目前从尿液中寻找新生物标志物的研发流程通常分为发现和验证两个阶段:在发现阶段利用蛋白质组学方法可以分别对几例到几十例(通常<50例)的目标疾病组和对照组样品进行检测,两组间显著差异的蛋白成为候选生物标志物进入验证阶段的研究;在验证阶段,利用大规模独立的样本对候选生物标志物进行检验。由于缺乏高通量的深度定量尿蛋白质组检测方法,在发现阶段通过小样本量找到的候选标志物实际上通常是不同个体间差异的蛋白,而不是真正反映疾病和对照状态差异的蛋白,这是目前还没有通过蛋白质组学方法发现新的尿蛋白标志物成功走上临床实际应用的主要原因。因此,建立能覆盖个体内及个体间差异和生理性波动的人尿蛋白质组定量参考范围对于发现新的尿蛋白标志物很有必要。
技术实现思路
为了解决现有技术中存在的问题,本专利技术旨在提供一种建立健康人尿蛋白质组定量参考范围的方法,并进一步提出健康人尿蛋白质组数据库,该数据库包括能覆盖个体内及个体间差异和生理性波动的健康人尿蛋白质组数据集及根据该数据集确定的健康人尿蛋白质的数量及计算得到的健康人尿蛋白质组定量参考范围。本专利技术所提供的建立健康人尿蛋白质组定量参考范围的方法,包括以下步骤:1)采样:采集统计数量健康人的尿样;2)制备尿蛋白样品:将采集的每一个尿样制成一个尿蛋白样品;3)检测:对每一个尿蛋白样品进行质谱检测,得到每一个尿蛋白样品的质谱数据;4)搜库及定量:对每一个尿蛋白样品的质谱数据进行数据库搜索、肽段定量及蛋白拼接组装,确定每一个尿蛋白样品中的蛋白种类及各蛋白的定量形成一个尿蛋白质组数据;5)就不同人及不同采样时间跨度确定不同的亚数据集,包括:将单个人不同采样时间跨度的全部尿蛋白样品的尿蛋白质组数据归集得到该人的个体内尿蛋白质组亚数据集;将多人少次或单次采样的的全部尿蛋白样品的尿蛋白质组数据归集得到个体间尿蛋白质组亚数据集;6)计算每一亚数据集内全部尿蛋白定量数据的变异系数的分布范围用以评估个体内生理性波动;7)利用随机重采样的方法,对采样时间跨度最长的2个人的亚数据集进行分析,确定覆盖健康人尿蛋白质组个体内生理性波动或差异所需的采样个数;8)将全部数量人数的亚数据集合并得到健康人尿蛋白质组数据的总数据集;每个亚数据集或总数据集中至少10%的尿样中有定量信息的蛋白才参与评估各亚数据集或总数据集的尿蛋白质组个体间生理性波动和差异的评估;9)利用总数据集的数据计算健康人尿蛋白质组定量参考范围。以上所述方法中,步骤9)中数据符合正态分布时,以参数法建立定量参考范围,根据数据的统计学参数(均值和标准差)按公式计算覆盖目标百分比人群的参考范围上下限(如均数加减2倍标准差覆盖95%的个体)。步骤9)中数据不确定是否符合正态分布时,以非参数法建立定量参考范围,按照百分位数法求出参考范围上下限就实际覆盖了目标百分比的个体(如第2.5和97.5百分位数就覆盖了95%的个体)。以上所述方法中,就不同人及不同采样时间跨度确定不同的亚数据集,人数较少采样次数较多的尿样形成的亚数据集用来评估少数人多次采样的尿蛋白质组个体内生理性波动和差异;人数较多采样次数较少的尿样形成的亚数据集用来评估对多数人进行少次或单次采样的尿蛋白质组个体间生理性波动和差异;男性和女性尿蛋白质组亚数据集可用来评估不同性别的尿蛋白质组个体间生理性波动和差异。所述评估的方法是计算每个符合要求蛋白在相应亚数据集或总数据集中的变异系数,然后以箱型图展示各亚数据集或总数据集中符合要求蛋白的变异系数的分布范围,用以评估相应的尿蛋白质组个体间生理性波动和差异。以上所述的方法中,步骤2)采用基于超速离心和还原的方法得到尿蛋白样品,即将尿样离心后的沉淀用重悬缓冲液(50mMTris,250mM蔗糖,pH8.5)重悬,再加入二硫苏糖醇,加热去除样品中绝大部分的尿调素蛋白,用清洗缓冲液(10mM三乙醇胺,100mM氯化钠,pH7.4)清洗后离心,得到的沉淀集为该尿样的尿蛋白样品。步骤3)将所述尿蛋白样品用聚丙烯酰胺凝胶电泳(SDS-PAGE)分离、胶切成6条带进行胶内酶解,然后合并为2组分的肽样品作为一个尿蛋白质组,利用LC-MS/MS对2组分肽样品进行检测,得到针对每一尿样的尿蛋白样品质谱数据;步骤4)搜库的目的是对质谱产出的数据进行分析,确定质谱产出的数据中包含的蛋白,并得到所有肽段的一级定量结果,从而获得每一尿蛋白样品对应的蛋白质组数据。对三个不同采样时间跨度(24小时内、连续3天以及大于2个月)的健康人个体内尿蛋白质组生理性波动和差异进行评估,评估方法是确定相应亚数据集中各蛋白质定量数据的变异系数(蛋白定量数据的标准差/蛋白定量数据的均值)的分布范围;每个24小时或连续3天采样的亚数据集中包括3-5个尿蛋白质组数据,对那些在3-5个尿样中均有定量数据的蛋白,计算其变异系数,最终获得每一亚数据集中全部符合要求蛋白的变异系数分布范围,并用箱型图(box-plot)展示;每个采样时间跨度大于2个月的亚数据集包括6-62个尿蛋白质组数据,对那些至少在3个(<30个尿蛋白质组的亚数据集)或10%尿样(>30个尿蛋白质组的亚数据集)中有定量数据的蛋白计算其变异系数,最终获得每一亚数据集中全部符合要求蛋白的变异系数分布范围,并用箱型图(box-plot)展示。对总数据集及其中的男女性别亚数据集来评估健康人尿蛋白质组个体间生理性波动和差异,对每个数据集或亚数据集中超过10%尿样有定量数据的蛋白,计算其定量数据的变异系数,并用箱型图(box-plot)展示各数据集和亚数据集中全部符合要求的蛋白的变异系数分布。本专利技术另一目的在于提供健康人尿蛋白质组数据库,该健康人尿蛋白质组数据库包括所确定的亚数据集、总数据集、及依据该健康人尿蛋白质组数据集确定的健康人尿蛋白质种类和计算得到的健康人尿蛋白质组定量参考范围。本专利技术的效果:通过大规模(指满足统计数量)地采集健康人尿蛋白质组数据建立了健康人尿蛋白质组数据库,该数据库包括了能覆盖健康人个体内及个体间差异和生理性波动的尿蛋白质组数据集及根据该数据集计算得到的健康人尿蛋白质组定量参考范围。利用本专利技术建立的健康人尿蛋白组数据库中人尿蛋白的定量参考范围能够更好地排除在尿蛋白生物标志物发现过程中来自生理性波动和个体间差异蛋白的干扰。附图说明图1为健康人尿蛋白质组个体内24小时及连续3天的生理性波动范围。24小时数据来自2名自愿者(U001和U002),连续3天的数据来自16名自愿者(U001-U005、U007-U017)。纵轴为变异系数,横轴为不同个体的不同亚数据集。图本文档来自技高网...

【技术保护点】
1.建立健康人尿蛋白质组定量参考范围的方法,包括以下步骤:1)采样:采集统计数量健康人的尿样;2)制备尿蛋白样品:将采集的每一个尿样制成一个尿蛋白样品;3)检测:对每一个尿蛋白样品进行质谱检测,得到每一个尿蛋白样品的质谱数据;4)搜库及定量:对每一个尿蛋白样品的质谱数据进行数据库搜索、肽段定量及蛋白拼接组装,确定每一个尿蛋白样品中的蛋白种类及各蛋白的定量形成一个尿蛋白质组数据;5)就不同人及不同采样时间跨度确定不同的亚数据集,包括:将单个人不同采样时间跨度的全部尿蛋白样品的尿蛋白质组数据归集得到该人的个体内尿蛋白质组亚数据集;将多人少次或单次采样的的全部尿蛋白样品的尿蛋白质组数据归集得到个体间尿蛋白质组亚数据集;6)计算每一亚数据集内全部尿蛋白定量数据的变异系数的分布范围用以评估个体内生理性波动;7)利用随机重采样的方法,对采样时间跨度最长的2个人的亚数据集进行分析,确定覆盖健康人尿蛋白质组个体内生理性波动或差异所需的采样个数;8)将全部数量人数的亚数据集合并得到健康人尿蛋白质组数据的总数据集;每个亚数据集或总数据集中至少10%的尿样中有定量信息的蛋白才参与评估各亚数据集或总数据集的尿蛋白质组个体间生理性波动和差异的评估;9)利用总数据集的数据计算健康人尿蛋白质组定量参考范围。...

【技术特征摘要】
1.建立健康人尿蛋白质组定量参考范围的方法,包括以下步骤:1)采样:采集统计数量健康人的尿样;2)制备尿蛋白样品:将采集的每一个尿样制成一个尿蛋白样品;3)检测:对每一个尿蛋白样品进行质谱检测,得到每一个尿蛋白样品的质谱数据;4)搜库及定量:对每一个尿蛋白样品的质谱数据进行数据库搜索、肽段定量及蛋白拼接组装,确定每一个尿蛋白样品中的蛋白种类及各蛋白的定量形成一个尿蛋白质组数据;5)就不同人及不同采样时间跨度确定不同的亚数据集,包括:将单个人不同采样时间跨度的全部尿蛋白样品的尿蛋白质组数据归集得到该人的个体内尿蛋白质组亚数据集;将多人少次或单次采样的的全部尿蛋白样品的尿蛋白质组数据归集得到个体间尿蛋白质组亚数据集;6)计算每一亚数据集内全部尿蛋白定量数据的变异系数的分布范围用以评估个体内生理性波动;7)利用随机重采样的方法,对采样时间跨度最长的2个人的亚数据集进行分析,确定覆盖健康人尿蛋白质组个体内生理性波动或差异所需的采样个数;8)将全部数量人数的亚数据集合并得到健康人尿蛋白质组数据的总数据集;每个亚数据集或总数据集中至少10%的尿样中有定量信息的蛋白才参与评估各亚数据集或总数据集的尿蛋白质组个体间生理性波动和差异的评估;9)利用总数据集的数据计算健康人尿蛋白质组定量参考范围。2.根据权利要求1所述的方法,其特征在于:步骤9)中数据符合正态分布时,以参数法建立定量参考范围,根据数据的统计学参数(均值和标准差)按公式计算覆盖目标百分比人群的参考范围上下限(如均数加减2倍标准差覆盖95%的个体)。3.根据权利要求1所述的方法,其特征在于:步骤9)中数据不确定是否符合正态分布时,以非参数法建立定量参考范围,按照百分位数法求出参考范围上下限就实际覆盖了目标百分比的个体(如第2.5和97.5百分位数就覆盖了95%的个体)。4.根据权利要求1或2或3所述的方法,其特征在于:就不同人及不同采样时间跨度确定不同的亚数据集,人数较少采样次数较多的尿样形成的亚数据集用来评估少数人多次采样的尿蛋白质组个体内生理性波动和差异;人数较多采样次数较少的尿样形成的亚数据集用来评估对多数人进行少次或单次采样的尿蛋白质组个体间生理性波动和差异;男性和女性尿蛋白质组亚数据集可用来评估不同性别的尿蛋白质组个体间生理性波动和差异。5.根据权利要求4所述的方法,其特征在于:所述评估的方法是计算每个符合要求蛋白在相应亚数据集或总数据集中的变异系数,然后以箱型图展示各亚数据集或总数据集中符合要求...

【专利技术属性】
技术研发人员:秦钧甄蓓冷文川倪晓天路天元王广舜孙长青钟博文
申请(专利权)人:北京蛋白质组研究中心
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1