一种基于血清代谢指纹的肺腺癌多组学诊断模型及其构建方法技术

技术编号:35944797 阅读:13 留言:0更新日期:2022-12-14 10:34
本发明专利技术公开了一种基于血清代谢指纹的肺腺癌多组学诊断模型及其构建方法,该构建方法包括:使用MALDI

【技术实现步骤摘要】
一种基于血清代谢指纹的肺腺癌多组学诊断模型及其构建方法


[0001]本专利技术属于分析
,具体涉及一种基于血清代谢指纹的肺腺癌多组学诊断模型及其构建方法。

技术介绍

[0002]肺腺癌的预后与分期密切相关,早期诊断是提高生存率的前提。高危人群低剂量螺旋CT筛查将肺癌5年死亡率降低了24%。但随着CT的普及,伴随出现肺部结节过度诊断和治疗问题日益突出,假阳性率达96%,不仅给患者带来严重心理负担,也造成国家医疗卫生资源的巨大浪费。因此,肺腺癌早期诊断以及肺部结节良恶性鉴别诊断是临床诊治痛点和研究热点,也是健康中国建设和经济发展的重大需求。
[0003]目前,临床对肺癌的诊断有多种方法:组织病理学是肿瘤诊断的金标准,但早期肺癌(原位和ⅠA期肺癌)直径多小于1cm,病灶常因呼吸而移动,定位困难,重复穿刺会带来严重的创伤和并发症,因此组织病理学检测不适合于肺癌早期诊断;低剂量螺旋CT假阳性率高,存在辐射暴露和过度诊断的风险,仅适用于高危人群肺癌筛查,无法进行早期诊断;临床常规应用的血清学肿瘤标志物如:CEA、SCC、Cfra21

1和NSE等对肿瘤的辅助诊断、鉴别诊断具有一定价值,但其单独用于肺癌早期诊断的敏感性和特异性都很低,联合检测在临床I期肺癌检出率不超过20%,远不能满足临床需求;痰脱落细胞学虽然便捷经济、无创,病人接受度高,但敏感性很低,只能对肺癌诊断起提示作用。
[0004]近来,代谢组学被认为是基因组学和蛋白组学的延伸,是“组学”研究的最终方向。它跳过生命体内的复杂和无效调控过程,通过对代谢物的分析给出最终的、整体的结果,这是其在健康评估、疾病诊断、疗效评价等方面巨大应用前景的优势所在。但肺癌的发生发展涉及复杂的生物学机制,单模态数据对致病因素的分析仍有许多不足。将血清代谢指纹(SMF)与临床可访问数据(例如,传统的肿瘤标志物或CT特征)相结合的系统模型将优于单个生物标志物或一组选定的生物标志物。然而,由于多种模式的维度不一致和生物系统的内在异质性,传统途径未能将SMF和其他数据耦合用于临床。
[0005]因此,本领域亟需构建一种基于血清代谢指纹的综合多模态平台,该平台对于精准诊断使用具有重要意义。

技术实现思路

[0006]为解决现有技术中肺腺癌早期筛查灵敏度和准确性差、检测通量低以及多模态检测模型构建困难等问题,本专利技术公开了一种基于血清代谢指纹的肺腺癌多组学诊断模型及其构建方法,该模型能实现双模态数据检测,提高了早期肺腺癌筛查的灵敏度和准确度,还解决了传统检测方法检测通量低的问题。另外,该模型构建方法简单,方便快捷,检测成本低,易于临床的推广和应用。
[0007]为解决上述问题,本专利技术首先提供了一种基于血清代谢指纹的肺腺癌多组学诊断
模型的构建方法,包括以下步骤:
[0008]S1,使用MALDI

MS技术对患病血清样本和对照血清样本进行代谢检测,获得两种样本的原始代谢指纹图谱;
[0009]S2,将所述的原始指纹代谢图谱进行图谱预处理,得到样本的血清代谢指纹;
[0010]S3,采用机器学习方法对所述的血清代谢指纹进行训练,构建单模态诊断模型;
[0011]S4,获取所述患病血清样本和对照血清样本的CEA蛋白含量;
[0012]S5,联合步骤S3中单模态诊断模型的得分和步骤S4得到的CEA含量作为输入,采用机器学习方法构建双模态诊断模型,即所述的肺腺癌多组学诊断模型。
[0013]优选地,所述的机器学习方法包括支持向量机、神经网络或高斯朴素贝叶斯算法中的任意一种或多种。
[0014]优选地,步骤S2中,所述的图谱预处理包括:降噪、曲线平滑、基线校正、谱峰提取。
[0015]一些实施例中,步骤S3具体包括:
[0016]S3.1,将步骤S2得到的患病血清样本和对照血清样本的所述血清代谢指纹划分成对应的训练集和测试集;
[0017]S3.2,依次使用主成分分析和pearson相关性分析在训练集上对血清代谢指纹进行特征选择,得到代谢特征;并进一步使用支持向量机在训练集上进行模型构建,获得单模态初诊断模型;
[0018]S3.3,在所述测试集上测试单模态初诊断模型,获取单模态诊断模型。
[0019]一些实施例中,步骤S5具体包括:
[0020]S5.1,联合步骤S3中单模态诊断模型的得分和步骤S4得到的CEA含量作为输入,使用高斯朴素贝叶斯算法在所述训练集上进行双模态初诊断模型的构建;
[0021]S5.2,在所述测试集上测试双模态初诊断模型,获取双模态诊断模型。
[0022]优选地,所述步骤S1具体包括:
[0023]S1.1,采集肺腺癌患者和非肺腺癌对照者的血清样本,并准备纳米基质材料;
[0024]S1.2,将血清样本和纳米基质材料分别用去离子水稀释配制得到待测血清样本和纳米基质悬浮液;
[0025]S1.3,在LDI

MS质谱靶板上进行待测血清样本点样,室温干燥后进行基质悬浮液点样,室温干燥;
[0026]S1.4,在LDI

TOF

MS中检测待测血清样本,获得血清样本的原始代谢指纹图谱。
[0027]优选地,步骤S1.2中,血清样本被稀释10倍,纳米基质悬浮液的浓度为1mg/mL。
[0028]一些实施例中,所述的纳米基质材料包括铁纳米颗粒、银纳米颗粒、金纳米颗粒等金属纳米材料以及金属与无机材料结合的复合纳米材料,以保证其高比热、低热导的热传导特性、等离子体激元效应、良好的紫外光吸收以及表面粗糙的孔洞结构。所述的纳米基质材料可市购,也可实验室自制。
[0029]本专利技术另一方面还提供了一种根据前面任一项所述的构建方法构建而得的基于血清代谢指纹的肺腺癌多组学诊断模型的构建方法。
[0030]本专利技术另一方面还提供了一种前面所述的基于血清代谢指纹的肺腺癌多组学诊断模型的使用方法,包括以下步骤:
[0031](1)取待检血清样本,采用MALDI

MS技术进行分析,得到该待检血清样本的原始代
谢指纹图谱;同时检测待检血清样本中的CEA含量;
[0032](2)对所述原始代谢指纹图谱进行图谱预处理,得到该样本的血清代谢指纹;
[0033](3)将该样本的CEA含量和血清代谢指纹输入所述的肺腺癌多组学诊断模型中,该模型根据恶性概率,给出0

1的得分。
[0034]进一步地,当模型得分大于cutoff值,则表示受试者具有肺腺癌的患病危险,需要进行进一步CT检查或手术活检;当模型得分不高于cutoff值,则表示该受试者不具有肺腺癌的患病危险,无需进一步检查。
[0035]相对于现有技术,本专利技术的有益效果是:
[0036]1、本专利技术提供的诊断模型通过获取样本的血清代谢指纹和CEA含量信息,实现代谢组学和蛋白质肿瘤标志物CEA的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于血清代谢指纹的肺腺癌多组学诊断模型的构建方法,其特征在于,包括以下步骤:S1,使用MALDI

MS技术对患病血清样本和对照血清样本进行代谢检测,获得两种样本的原始代谢指纹图谱;S2,将所述的原始指纹代谢图谱进行图谱预处理,得到样本的血清代谢指纹;S3,采用机器学习方法对所述的血清代谢指纹进行训练,构建单模态诊断模型;S4,获取所述患病血清样本和对照血清样本的CEA蛋白含量;S5,联合步骤S3中单模态诊断模型的得分和步骤S4得到的CEA含量作为输入,采用机器学习方法构建双模态诊断模型,即得到所述的肺腺癌多组学诊断模型。2.如权利要求1所述的基于血清代谢指纹的肺腺癌多组学诊断模型的构建方法,其特征在于,所述的机器学习方法包括支持向量机、神经网络或高斯朴素贝叶斯算法中的任意一种或多种。3.如权利要求1所述的基于血清代谢指纹的肺腺癌多组学诊断模型的构建方法,其特征在于,步骤S2中,所述的图谱预处理包括:降噪、曲线平滑、基线校正、谱峰提取。4.如权利要求1所述的基于血清代谢指纹的肺腺癌多组学诊断模型的构建方法,其特征在于,步骤S3具体包括:S3.1,将步骤S2得到的患病血清样本和对照血清样本的所述血清代谢指纹划分成对应的训练集和测试集;S3.2,依次使用主成分分析和pearson相关性分析在训练集上对血清代谢指纹进行特征选择;并进一步使用支持向量机在训练集上进行模型构建,获得单模态初诊断模型;S3.3,在所述测试集上测试单模态初诊断模型,获取单模态诊断模型。5.如权利要求4所述的基于血清代谢指纹的肺腺癌多组学诊断模型的构建方法,其特征在于,步骤S5具体包括:S5.1,联合步骤S3中单模态诊断模型的得分和步骤S4得到的CEA含量作为输入,使用高斯朴素贝叶斯算法在所述训练集上进行双模态初诊断模型的构建;S5.2,在所述测试集上测...

【专利技术属性】
技术研发人员:乔理华娄加陶王琳王薛庆潘旭峰叶晓丹郭巧梅吴飞
申请(专利权)人:上海市第一人民医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1