【技术实现步骤摘要】
一种基于MALDI
‑
ToF MS的数据的疾病诊断模型
[0001]本申请涉及生物医药领域,具体的涉及一种基于MALDI
‑
ToF MS的数据的疾病诊断模型。
技术介绍
[0002]基质辅助激光解吸电离飞行时间质谱(matrix
‑
assisted laser desorption/ionization time
‑
of
‑ꢀ
flight mass spectrometry,简称MALDI
‑
TOF MS)技术,是20世纪80年代末问世并迅速发展起来的一种质谱分析技术。其质量分析器是一个离子漂移管(iondirfttube),由离子源产生的离子首先被收集,在收集器中所有离子速度变为0,使用一个脉冲电场加速后进入无场漂移管,并以恒定速度飞向离子接收器,离子质量越大,到达接收器所用时间越长;离子质量越小,到达接收器所用时间越短。根据这一原理,可以把不同质量的离子按质荷比大小进行分离,准确检测多肽、蛋白质、核酸、多糖等生物大 ...
【技术保护点】
【技术特征摘要】
1.一种基于MALDI
‑
ToF MS数据的慢性肾脏病(CKD)诊断模型的构建方法,所述方法包括:i)使用最小绝对收缩和选择算子Lasso、偏最小二乘判别分析PLS
‑
DA和交叉验证递归消除RFECV三种机器学习方法对CKD人群和健康人群的尿液样本的MALDI
‑
ToF MS数据进行特征峰筛选,将符合三种机器学习方法中任意一种的峰被选为候选特征峰;其中,在Lasso选择中,随机选取测试数据集的80%样本,重复200次,选取重复出现频率>10%的峰值作为CKD的差异特征峰;在PLS
‑
DA选择中,选取VIP得分排名前30的峰作为CKD的差异特征峰;在RFECV选择中,选取importance得分排名前30的峰作为CKD的差异特征峰;ii)把i)中同时满足每组frequency>30%且AUC>60%的候选特征峰筛选为特征峰;iii)利用识别出的差异特征峰,采用机器学习方法建立CKD疾病诊断模型。2.根据权利要求1所述的方法,其中所述i)中将符合以下标准中任一种的峰选为候选特征峰:其中,在Lasso选择中,随机选取测试数据集的80%样本,重复200次,选取重复出现频率>20%的峰值作为CKD的差异特征峰;在PLS
‑
DA选择中,选取VIP得分排名前20的峰作为CKD的差异特征峰;在RFECV选择中,选取importance得分排名前20的峰作为CKD的差异特征峰。3.根据权利要求1所述的方法,其中所述i)中将符合以下标准中任一种的峰选为候选特征峰:其中,在Lasso选择中,随机选取测试数据集的80%样本,重复200次,选取重复出现频率>30%的峰值作为CKD的差异特征峰;在PLS
‑
DA选择中,选取VIP得分排名前10的峰作为CKD的差异特征峰;在RFECV选择中,选取importance得分排名前10的峰作为CKD的差异特征峰。4.根据权利要求1
‑
3中任一项所述的方法,所述采用机器学习方法建立CKD疾病诊断模型包括采用机器学习方法应用5次重复10折交叉验证的建模方式建立疾病诊断模型。5.根据权利要求4所述的方法,所述机器学习方法包括:支持向量机(SVM)、随机森林(RF)、朴素贝叶斯(NB)、梯度提升(GBM)、K
‑
最近邻(KNN)、条件推断决策树(ctree)和/或自适应增强(Adaboost)。6.根据权利要求1
‑
5中任一项所述的方法,所述方法包括:i)对CKD人群和健康人群的尿液样本进行MALDI
‑
ToF MS检测读取,获得两组尿液多肽的指纹图谱;ii)对CKD人群和健康人群的尿液多肽的指纹图谱进行质控处理和标准化处理;iii)使用最小绝对收缩和选择算子Lasso、偏最小二乘判别分析PLS
‑
DA和交叉验证递归消除RFECV三种机器学习方法对CKD人群和健康人群的尿液多肽的指纹图谱进行特征峰筛选,将符合三种机器学习方法其中一种的峰被选为候选特征峰;其中,在Lasso选择中,随机选取测试数据集的80%样本,重复200次,选取重复出现频率>10%的峰值作为CKD的差异特征峰;在PLS
‑
DA选择中,选取VIP得分排名前30的峰作为CKD的差异特征峰;在RFECV选择中,选取importance得分排名前30的峰作为CKD的差异特征峰;ii)把i)...
【专利技术属性】
技术研发人员:周宏伟,李泽文,曾念宜,郑道文,
申请(专利权)人:南方医科大学珠江医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。