一种肝胆疾病诊断模型的建立方法及诊断系统技术方案

技术编号:29397041 阅读:22 留言:0更新日期:2021-07-23 22:33
本发明专利技术公开了一种肝胆疾病诊断模型的建立方法,包括数据预处理阶段、ROC分析阶段、两两组合建模阶段、多物质组合推导阶段、最佳模型获取阶段。本发明专利技术可以有效地诊断出肝胆疾病,降低肝癌和胆管癌漏检率,非常有利于肝癌和胆管癌的早诊早治,对于改善肝癌和胆管癌预后,降低肝癌和胆管癌的死亡率有很大帮助,具有良好的临床使用和推广价值。在实际应用中,可以按照本发明专利技术建模方法选取更多的样本和更多的代谢物组合进行建模,增加模型的准确度。

【技术实现步骤摘要】
一种肝胆疾病诊断模型的建立方法及诊断系统
本专利技术属于医药诊断
,涉及一种肝胆疾病诊断模型的建立方法及诊断系统。
技术介绍
肝脏是人体最重要的代谢器官,它不仅是人体内源性代谢物(氨基酸、糖类、脂类等)最重要的代谢场所,而且还是人生命周期中所暴露的上百万种外源性毒物最主要的解毒器官。许多因素(例如:高脂、高糖、酒精、化学毒物、肝炎病毒等)会导致健康的肝脏受损,进而发展成为肝炎、肝硬化和肝癌。随着肝病的进展,肝脏会出现不同的代谢表型,根据代谢表型的不同将肝脏的健康状态划分成了四个层级,0期(Phase0):健康肝(healthyliver);1期(Phase1):非酒精性脂肪肝(non-alcoholicfattyliverdisease,NAFLD)/非酒精性脂肪肝炎(nonalcoholicsteatohepatitis,NASH)/酒精性肝病(alcoholicliverdisease,ALD)/病毒性肝炎(viralhepatitis);2期(Phase2):肝硬化(cirrhosis);3期(Phase3):肝细胞型肝癌(hepatocellularcarcinoma,HCC)/胆管细胞型肝癌(cholangiocarcinoma,CCA)。大量的研究表明,肝病进程中,肝脏的代谢会出现明显的变化,这种代谢表型变化主要包含两个方面,即:能量代谢重塑(脂肪酸的β-氧化、线粒体呼吸和胞质糖酵解)和核心代谢表型产生(血清溶血卵磷脂下降、血清和尿液胆汁酸含量上升)。诊断标志物的筛选是一个富有挑战性的工作。代谢物(分子量小于1000的内源性小分子)作为生命活动最下游层级(基因→RNA→蛋白→代谢物),是最接近生物表型的物质,由于信号传导的“级联放大”效应,基因层面的微小变化会导致代谢物表达水平的较大波动,因此代谢物作为诊断标志物具有灵敏度高的天然优势。但是,代谢物作为诊断标志物也有自身的缺陷,那就是特异性较差,因为代谢物的组织特异性不如蛋白的组织特异性高,因此不同的疾病可能会导致相同的代谢物变化。但是,溶血卵磷脂和胆汁酸的合成基本上都在肝细胞中进行,因此,肝脏的病变会直接影响这两类代谢物的表达水平,筛选这两类代谢物中的几个物质作为肝病进程的诊断标志物应该具备很好的灵敏度和特异性。代谢物作为诊断标志物在临床上已有一些应用,如:葡萄糖作为糖尿病的诊断标志物;苯丙酮酸作为苯丙酮尿症的诊断标志物;肌酐和尿素作为肾功能的诊断标志物;肌氨酸作为前列腺癌的诊断标志物等。但与蛋白类的诊断标志物(如肿瘤标志物:癌胚抗原(carcino-embryonicantigen,CEA)、甲胎蛋白(α-fetoprotein,AFP)、CA19-9、CA125、PSA等,肝功能标志物:ALT、AST等,肾功能标志物:尿β2-微球蛋白、尿白蛋白、尿免疫球蛋白G等)相比,总体来说要少得多,有待进一步开发。目前,用于肝病临床诊断的蛋白类标志物主要有两类:(1)肝功能标志物:ALT、AST;(2)肝癌标志物:AFP。肝功能指标(ALT、AST)反映的是肝脏作为主要代谢解毒器官的功能状态,并非反应肝脏的病变水平;而肝癌标志物AFP主要用于肝癌的诊断和疗效评价指,虽应用广泛,但仍存在许多缺陷,如:(1)对于早期肝癌诊断的灵敏度较差,许多早期肝癌患者血清AFP含量很低(<20μg/L),假阴性率约为30%;(2)特异性不够,妊娠、胚胎癌如睾丸癌、卵巢癌和极少数胃、胰、胆管、结肠直肠癌也可升,此外其它肝病如肝炎、肝硬化等也会导致AFP升高,因此;血清AFP作为肝细胞癌的诊断标志物,其准确率为60-70%。基于肝病核心代谢表型变化,筛选不同于ALT、AST、AFP等临床常用指标的新标志物作为补充是十分必要和有意义的。现代分离检测技术的飞速发展,尤其是色谱-质谱联用技术的不断升级以及大数据算法的不断完善,为代谢物的高通量分析提供了可能。非靶向代谢组学(Untargetedmetabolomics)技术就是利用气相色谱-质谱联用技术(GC-MS)和/或液相色谱-质谱联用技术(LC-MS)对生物样本(细胞、组织、体液等)的代谢组(分子量小于1000的内源性代谢小分子)进行全覆盖分析,然后结合化学计量学的方法筛选不同样本组间的差异表达代谢物,图1所示的结果就是等根据大量已经报道的肝病非靶向代谢组学研究结果总结出来的示意图。然而,想要将重要的差异代谢物开发成诊断标志物,还有许多工作要做,主要包括:(1)非靶向代谢组学检测给出的代谢物是相对定量的结果(一般以质谱峰面积表示),对于同批次检测的样本具有可比性,但对于不同批次间的样本就不具有可比性,因此要想将重要的差异代谢物开发成诊断标志物,必须利用该代谢物的标准品开发其定量检测的方法,这样可以给出代谢物在样本中的绝对浓度信息,使得不同批次的样本具有可比性;(2)需要利用临床大样本进行验证,哪些差异代谢物作为诊断指标时灵敏度和特异性高(保留),哪些差异代谢物的灵敏度和特异性低(舍弃),此外还要兼顾诊断标志物是否具有好的稳定性、可检测性等。
技术实现思路
本专利技术的目的是利用预先建立好的LC-MS/MS方法,定量检测临床大样本(血清和尿液)中目标代谢物的含量,筛选诊断标志物,并计算出诊断标志物的阈值(Cutoff)值,然后利用筛选出来的诊断标志物评价肝脏的健康水平,跟踪肝病进展,结合AFP进行肝癌早期预警。本专利技术提供了一种用于肝胆疾病诊断的代谢标志物,所述代谢标志物包括血清代谢标志物、尿液代谢标志物。所述血清代谢标志物包括EPA,AA,DHA,TCDA,DCA,GCA,TCA,GCDA,GCDCA,GDCA,CDCA,LPC16-0,LPC18-0,LPC18-1,LPC20-0等中的单个或任意组合;优选地,所述血清代谢标志物为血清标志物组合(GCDA+CDCA+LPC18-0+AA)。所述尿液代谢标志物包括LPC16-0,LPC18-0,LPC18-1,AA,GCDA,GCA,GCDCA,TCDA,TCA等中的单个或任意组合;优选地,所述尿液代谢标志物为尿液标志物组合(LPC16-0+TCDA+GCA)。本专利技术还提供了一种用于肝胆疾病诊断的代谢标志物的筛选方法和诊断模型,具体包括以下步骤:(1)数据预处理阶段:将基于LC-MS/MS技术定量检测血清和尿液中重要靶标代谢标志物的含量值和疾病分型输入到R3.6.1分析软件中进行空置填充,疾病分型与表达量匹配操作,为后续筛选流程提供标准的分析格式;(2)ROC分析阶段:根据疾病分型对每个代谢物进行受试者工作特征曲线(ROC)分析并获取每个代谢物在不同疾病分型情况下的AUC值,为后续推导多个代谢物组合提供依据;(3)两两组合建模阶段:提取两两代谢物的数据集,并将数据集进行logistic回归运算后分为训练集与测试集,通过训练集形成评估模型,使用评估模型对测试集进行验证,获得模型准确率;(4)多物质组合推导阶段:根据单代谢物验证及两两组合建模阶段结果,通过推导出符合要求的代谢物组合进行代建模,减少对所有代谢物组合本文档来自技高网
...

【技术保护点】
1.一种肝胆疾病诊断模型的建立方法,其特征在于,包括以下步骤:/n步骤1,数据预处理阶段:对基于LC-MS/MS技术定量检测血清和/或尿液中代谢标志物的含量值和疾病分型进行空置填充,疾病分型与表达量匹配操作,为后续筛选流程提供标准的分析格式;/n步骤2,ROC分析阶段:根据疾病分型对每个代谢物进行受试者工作特征曲线分析,获取每个代谢物在不同疾病分型情况下的AUC值,为后续推导多个代谢物组合提供依据;所述AUC值的计算公式如下:/n

【技术特征摘要】
20200519 CN 20201042348991.一种肝胆疾病诊断模型的建立方法,其特征在于,包括以下步骤:
步骤1,数据预处理阶段:对基于LC-MS/MS技术定量检测血清和/或尿液中代谢标志物的含量值和疾病分型进行空置填充,疾病分型与表达量匹配操作,为后续筛选流程提供标准的分析格式;
步骤2,ROC分析阶段:根据疾病分型对每个代谢物进行受试者工作特征曲线分析,获取每个代谢物在不同疾病分型情况下的AUC值,为后续推导多个代谢物组合提供依据;所述AUC值的计算公式如下:



其中,M为正类样本的数目;N为负类样本的数目;rank为表达值从大到小排列后的序列值;Σi∈positiveCLassranki为正类样本的rank加和;
步骤3,两两组合建模阶段:提取两两代谢物的数据集,并将数据集进行运算后分为训练集与测试集,所述两两代谢物为仅血清或仅尿液中的两代谢物;通过训练集形成评估模型,使用评估模型对测试集进行验证,获得模型准确率;
所述数据集通过以下公式运算后分为训练集与测试集:



其中,常规项:α表示自变量Xj为0时个体发病与不发病概率之比的自然对数;回归系数:βj(j=1,2,···,m)表示自变量Xj改变一个单位时Logit(P)的改变量;
步骤4,多物质组合推导阶段:根据单代谢物验证及两两组合建模阶段结果,通过推导出符合要求的代谢物组合进行代建模,减少对所有代谢物组合运算量;对于获得的代谢物组合和疾病分型分为训练集及测试集,通过训练集形成评估模型,使用评估模型对测试集进行验证获得模型准确率;
步骤5,最佳模型获取阶段:对于上述步骤,不同的疾病分型将有不同的优选代谢物组合,对于所有结果进行汇总统计和韦恩图分析,通过对代谢物数量、AUC值和区分疾病分型能力选出最佳模型。


2.如权利要求1所述的模型建立方法,其特征在于,步骤1中,所述血清靶标代谢标志物包括:EPA,AA,DHA,TCDA,DCA,GCA,TCA,GCDA,GCDCA,GDCA,CDCA,LPC16-0,LPC18-0,LPC18-1,LPC2...

【专利技术属性】
技术研发人员:宁慧张志永彭章晓胡哲陆嘉伟胡绪俊付艳蕾舒烈波
申请(专利权)人:上海鹿明生物科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1