System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于蛋白谱的自发性早产风险预测模型及其构建方法技术_技高网

一种基于蛋白谱的自发性早产风险预测模型及其构建方法技术

技术编号:40579061 阅读:11 留言:0更新日期:2024-03-06 17:21
本发明专利技术属于生物医学技术领域,具体涉及一种基于蛋白谱的自发性早产风险预测模型及其构建方法。所述基于蛋白谱的自发性早产风险预测模型基于6种蛋白质进行构建,所述6种蛋白质为APOH、SUCLG2、GNPTG、SERPINA1、HPSE和C4B。本发明专利技术计算出三个数据集的准确度值、灵敏度值、特异性值及精度值发现其具有良好的准确度、较高的灵敏度、特异性及精度。APOH、SUCLG2、GNPTG、SERPINA1、HPSE和C4B六种蛋白具有很宽的水平范围,突出了它们对模型预测的重大贡献。

【技术实现步骤摘要】

本专利技术属于生物医学,具体涉及一种基于蛋白谱的自发性早产风险预测模型及其构建方法


技术介绍

1、早产(ptb)是全世界的一个重大公共卫生问题。它是导致小于5岁婴儿死亡的直接原因,与存活婴儿的严重并发症具有极大的相关性。每年全世界约有15万新生儿早产,占全球活产儿总数的11%,早产率从几个欧洲国家的约5%到非洲的18%不等。在过去的20年里,早产率一直在稳步上升。在全球65个国家中,超90%国家的早产率在过去1年内都有所上升。2010年全球早产率约为6.14%,相当于约8万活产儿,其中约81.1%发生在亚洲和撒哈拉以南非洲。超过75%的围生儿死亡率以及50%的围产期和远期疾病与早产相关联。早产是全球儿科人群死亡的主要原因。随着过去几十年新生儿护理技术的重大进步,早产儿(妊娠37周<)的存活率有所提高,特别是极早产儿(妊娠28周<)的存活率有所提高。尽管技术进步提高了这些脆弱人群的生存率,但早产仍与严重的并发症相关,包括ivh、nec、bpd和感觉障碍。

2、目前,发达国家中约有占所有分娩的12.5%的早产案例,并且与死亡率和发病率的显着增加有关。who将早产定义为妊娠37周前或自女性末次月经第一天起少于259日的所有分娩。早产可根据胎龄进一步细分:极早产(<28周)、早产(28-<32周)和中度早产(妊娠32-<37周)。且导致长期并发症,不良结局的机率和严重程度随着胎龄的降低和护理质量的降低而增加。早产有两种类型——自发性和医源性。在受自发性早产影响的病例中,宫缩在第37周之前开始,没有任何临床干预,主要是由于宫颈功能不全或宫内感染等。另一方面,医源性早产发生在严重的妊娠并发症中,例如先兆子痫(pe)或胎儿生长受限(fgr)。因此,及时发现自发性早产(sptb)是预防高风险妊娠的一项艰难挑战。研究表明约50%的sptb主要发生在缺乏临床危险因素的女性中。目前的sptb诊断方法包括:产科访谈、产妇特征和宫颈经阴道超声检查,但其并没有解决新生儿早产的问题。这就是为什么sptb是一个困难且复杂的现实问题的原因。这一现实问题源于妊娠数据的性质,此类数据具有动态变化,嘈杂,并且通常包含重要变量组的缺失数据的特点。因研究中需兼顾各种各样的潜在因素以及持续缺乏可靠的变量数据的特性,sptb的预测更具挑战性。

3、此外,因机器学习的发展对生物学产生的新见解,即在理解从现代高通量实验中收集或生成的大量数据的结果或趋势方面提供了诸多可能性。机器学习常用的的工具包括随机森林、支持向量机、人工神经网络和遗传算法。在处理代谢组学步骤中,监督机器学习方法有助于峰值选取、归一化和缺失数据插补。对于知识驱动的分析,机器学习有助于生物标志物检测、分类和回归、生化途径识别等。因而,更好地了解潜在变量并使用机器学习方法来开发更好地预测sptb的新方法至关重要。


技术实现思路

1、本专利技术的目的是提供一种基于蛋白谱的自发性早产风险预测模型及其构建方法,通过apoh、suclg2、gnptg、serpina1、hpse和c4b六种蛋白进行构建,能可靠地反映胎儿缺陷或产前异常的风险。

2、为实现上述目的,本专利技术提供了如下方案:

3、本专利技术提供一种基于蛋白谱的自发性早产风险预测模型,所述基于蛋白谱的自发性早产风险预测模型基于6种蛋白质进行构建,所述6种蛋白质为apoh、suclg2、gnptg、serpina1、hpse和c4b。

4、本专利技术还提供一种基于蛋白谱的自发性早产风险预测模型的构建方法,包括以下步骤:

5、(1)样本的收集:选择自发性早产病例作为早产组,选择分娩胎龄不小于37周的参与者作为对照组,分别收集早产组和对照组的血浆;

6、(2)质谱前样本的处理:将步骤(1)中收集的血浆进行蛋白质提取和肽段酶解以及肽段脱盐,进行血浆样本前处理;

7、(3)质谱检测:将步骤(2)中进行血浆样本前处理后的血浆样本进行色谱检测和高分辨质谱检测;

8、(4)质谱的数据处理:将经步骤(3)检测后的数据进行蛋白质鉴定、数据归一化、缺失值填充、数据转换;

9、(5)蛋白质风险预测模型的构建:将经步骤(4)处理后的数据经生信分析后通过机器学习建立基于apoh、suclg2、gnptg、serpina1、hpse和c4b六种蛋白的蛋白质风险预测模型。

10、进一步的,在步骤(2)中,所述蛋白质提取和肽段酶解的具体步骤为:冰上解冻所述步骤(1)中收集的血浆样本,将同一时间点采集的负荷同种食物的血浆样本进行等量混合,然后取10μl混合后的血浆样本加入high selecttm top14 abundant proteindepletion resin中,置于摇床涡旋孵育30min,孵育结束后,离心收集滤液;滤液转移至10kd过滤管后,加入200μl 8m尿素,12,000g,离心10min;加入dtt溶液至终浓度10mm,37℃反应30min;加入iam溶液至终浓度20mm,室温,避光反应30min;加入200μl 50mm nh4hco3,12,000g,离心10min;每个样品中加入200μl 50mm nh4hco3,1μg lysc,37℃,震荡,孵育2h;再加入1μg trypsin,37℃震荡,孵育过夜;往反应体系中加入10μl 10%tfa,终止反应。

11、进一步的,在步骤(2)中,所述肽段脱盐的具体步骤为:加入100μl甲醇到solaμhrp板中,600g,离心1min;加入100μl 80%acn 0.1%tfa,1000g,离心1min;加入200μl 0.1%tha,1000g,离心1min;将样品加入到solaμhrp板中,1000g,离心2min;重复上样一次;加入200μl 0.1%tha,1000g,离心2min;加入100μl 80%acn 0.1%tfa,1000g,离心3min,收集洗脱液;洗脱液在离心浓缩仪中40℃旋干,用0.1%fa溶解到0.5μg/μl,质谱上样1μg用于定量分析。

12、进一步的,在步骤(3)中,所述色谱检测的条件为:将所述步骤(2)中获得的脱盐肽段进行分离,肽段分离通过ultimatetm 3000rslc系统完成;获得肽段溶解到缓冲液中,所述缓冲液中含0.1%甲酸,取约2μg肽段上样到2μm,75μm i.d.×20mm的acclaimpepmap rslc c18捕集柱上,然后通过2μm,75μm i.d.×25cm的acclaim pepmap rslcc18分析柱分离;流动相a为含0.1%甲酸的水溶液,流动相b为含0.1%甲酸的80%乙腈;梯度洗脱,0-4min,1%-8%b,4-85min,8%-30%b,85-90min 30%-90%b,90-91min 90%-1%b,91-95min 1%b,流速为400nl/min,柱温为55℃;所述高分辨质谱检测的条件为:肽段检测在质谱仪q exactive hf-x质谱仪上本文档来自技高网...

【技术保护点】

1.一种基于蛋白谱的自发性早产风险预测模型,其特征在于,所述基于蛋白谱的自发性早产风险预测模型基于6种蛋白质进行构建,所述6种蛋白质为APOH、SUCLG2、GNPTG、SERPINA1、HPSE和C4B。

2.一种基于蛋白谱的自发性早产风险预测模型的构建方法,其特征在于,包括以下步骤:

3.根据权利要求2所述的构建方法,其特征在于,在步骤(2)中,所述蛋白质提取和肽段酶解的具体步骤为:冰上解冻所述步骤(1)中收集的血浆样本,将同一时间点采集的负荷同种食物的血浆样本进行等量混合,然后取10μl混合后的血浆样本加入High selectTMTop14 abundantprotein depletion resin中,置于摇床涡旋孵育30min,孵育结束后,离心收集滤液;滤液转移至10kD过滤管后,加入200μl 8M尿素,12,000g,离心10min;加入DTT溶液至终浓度10mM,37℃反应30min;加入IAM溶液至终浓度20mM,室温,避光反应30min;加入200μl 50mM NH4HCO3,12,000g,离心10min;每个样品中加入200μl 50mM NH4HCO3,1μgLysC,37℃,震荡,孵育2h;再加入1μg Trypsin,37℃震荡,孵育过夜;往反应体系中加入10μl 10%TFA,终止反应。

4.根据权利要求2所述的构建方法,其特征在于,在步骤(2)中,所述肽段脱盐的具体步骤为:加入100μl甲醇到SoLAμHRP板中,600g,离心1min;加入100μl80%ACN 0.1%TFA,1000g,离心1min;加入200μl 0.1%THA,1000g,离心1min;将样品加入到SoLAμHRP板中,1000g,离心2min;重复上样一次;加入200μl 0.1%THA,1000g,离心2min;加入100μl 80%ACN 0.1%TFA,1000g,离心3min,收集洗脱液;洗脱液在离心浓缩仪中40℃旋干,用0.1%FA溶解到0.5μg/μl,质谱上样1μg用于定量分析。

5.根据权利要求2所述的构建方法,其特征在于,在步骤(3)中,所述色谱检测的条件为:将所述步骤(2)中获得的脱盐肽段进行分离,肽段分离通过UltimateTM 3000RSLC系统完成;获得肽段溶解到缓冲液中,所述缓冲液中含0.1%甲酸,取约2μg肽段上样到2μm,75μm i.d.×20mm的Acclaim PepMap RSLC C18捕集柱上,然后通过2μm,75μmi.d.×25cm的Acclaim PepMap RSLC C18分析柱分离;流动相A为含0.1%甲酸的水溶液,流动相B为含0.1%甲酸的80%乙腈;梯度洗脱,0-4min,1%-8%B,4-85min,8%-30%B,85-90min 30%-90%B,90-91min 90%-1%B,91-95min 1%B,流速为400nl/min,柱温为55℃;所述高分辨质谱检测的条件为:肽段检测在质谱仪Q Exactive HF-X质谱仪上完成,数据独立型采集方式采集数据,每次质谱扫描包括一次全扫和50个DIA扫描窗口,循环时间为约4.8s,全扫分辨率为60,000@m/z 200,AGC为3E6,最大离子进样时间为20ms,扫描范围为m/z350-1200,标准化碰撞能量为32%,二级质谱扫描范围为m/z 200-2000,DIA扫描分辨率为30,000@m/z 200,AGC为1E6,最大离子进样时间为45ms,隔离窗口为12Th,每个样品分析3次,覆盖m/z 400-1000内的所有碎片离子。

6.根据权利要求2所述的构建方法,其特征在于,在步骤(4)中,所述蛋白质鉴定采用深度覆盖的血浆蛋白质组谱图库和尿液蛋白质组谱图库,DIA-NN v1.8.0获取肽段和蛋白含量数据,软件设置使用软件默认参数;

7.根据权利要求2所述的构建方法,其特征在于,在步骤(5)中,所述生信分析为蛋白质组学质控分析、差异蛋白质组学分析及ROC分析假阳性率与真阳性率的相关性。

8.根据权利要求2所述的构建方法,其特征在于,在步骤(5)中,所述机器学习的具体步骤为:

9.根据权利要求8所述的构建方法,其特征在于,在步骤S3中,所述顺序特征选择方法需要复位的参数有两个:n_features_to_select,范围为1到10,间隔为1;还分别进行正向选择和反向选择的方向。

10.如权利要求1所述的基于蛋白谱的自发性早产风险预测模型在预测自发性早产风险中的应用。

...

【技术特征摘要】

1.一种基于蛋白谱的自发性早产风险预测模型,其特征在于,所述基于蛋白谱的自发性早产风险预测模型基于6种蛋白质进行构建,所述6种蛋白质为apoh、suclg2、gnptg、serpina1、hpse和c4b。

2.一种基于蛋白谱的自发性早产风险预测模型的构建方法,其特征在于,包括以下步骤:

3.根据权利要求2所述的构建方法,其特征在于,在步骤(2)中,所述蛋白质提取和肽段酶解的具体步骤为:冰上解冻所述步骤(1)中收集的血浆样本,将同一时间点采集的负荷同种食物的血浆样本进行等量混合,然后取10μl混合后的血浆样本加入high selecttmtop14 abundantprotein depletion resin中,置于摇床涡旋孵育30min,孵育结束后,离心收集滤液;滤液转移至10kd过滤管后,加入200μl 8m尿素,12,000g,离心10min;加入dtt溶液至终浓度10mm,37℃反应30min;加入iam溶液至终浓度20mm,室温,避光反应30min;加入200μl 50mm nh4hco3,12,000g,离心10min;每个样品中加入200μl 50mm nh4hco3,1μglysc,37℃,震荡,孵育2h;再加入1μg trypsin,37℃震荡,孵育过夜;往反应体系中加入10μl 10%tfa,终止反应。

4.根据权利要求2所述的构建方法,其特征在于,在步骤(2)中,所述肽段脱盐的具体步骤为:加入100μl甲醇到solaμhrp板中,600g,离心1min;加入100μl80%acn 0.1%tfa,1000g,离心1min;加入200μl 0.1%tha,1000g,离心1min;将样品加入到solaμhrp板中,1000g,离心2min;重复上样一次;加入200μl 0.1%tha,1000g,离心2min;加入100μl 80%acn 0.1%tfa,1000g,离心3min,收集洗脱液;洗脱液在离心浓缩仪中40℃旋干,用0.1%fa溶解到0.5μg/μl,质谱上样1μg用于定量分析。

5.根据权利要求2所述的构建方法,其特征在于,在步骤(3)中,所述色谱检测的条件为:将所述步骤(2)中获得的脱盐肽段进行分离,肽段分离通过ultimat...

【专利技术属性】
技术研发人员:朱怡冰王心睿曹华缪崇潘勉周岳张伟
申请(专利权)人:福建省妇幼保健院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1