System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法技术_技高网

基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法技术

技术编号:40037103 阅读:6 留言:0更新日期:2024-01-16 19:08
本发明专利技术涉及基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法,属于疾病预测技术领域。目前阿尔茨海默症的诊断方法主要基于淀粉样蛋白标志物或核磁共振图像,检测通常发生在个体有明显症状和体征时。阿尔茨海默病起病隐匿,早期症状不易被察觉。针对现有阿尔茨海默症诊断方法的不足和缺陷,本方法利用血浆蛋白分析患者的代谢变化,并通过集成学习算法CatBoost对患者进行病情预测。本方法可以对疾病早期和不同发展阶段准确预测,进而辅助医生对疾人及时准确地进行干预和治疗。与淀粉样蛋白标志物和MRI图像检测相比,本方法具有低成本、无创伤、易获得的特点,同时提高了对阿尔茨海默症诊断的准确性和客观性,临床应用中容易推广。

【技术实现步骤摘要】

本专利技术涉及基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法,属于疾病预测。


技术介绍

1、阿尔茨海默症(ad)是痴呆症的主要病因之一。ad是一种神经退行性疾病,临床表现为记忆障碍、个性和行为改变。随着当前人口老龄化的快速发展,患有这种疾病的人数也在迅速增加。此外,ad正在成为一种日益增加的社会负担,预计在未来30至40年内将构成巨大的社会和经济威胁。目前的科学和临床研究尚未明确ad的发病机制和原因,也没有完全有效的治疗方法。ad很难控制,也无法逆转,各国研究人员正在研究各种临床干预措施来减缓ad的进展。研究表明,神经退行性生物标志物异常发生在痴呆临床确诊前几十年,这为ad的早期诊断和治疗提供了一个宝贵的时间窗口。根据相关统计,在产生明显症状之前的五年内进行干预,将使阿尔茨海默症患者人数减少近一半。因此,ad的早期诊断对患者的治疗至关重要。

2、现有的阿尔茨海默症诊断方法包括基于淀粉样生物标志物的方法以及基于磁共振成像的方法。基于淀粉样蛋白生物标志物的检测往往难以提供及时的病理信息,因为淀粉样蛋白β的显著沉淀需要大量的时间,这使得在淀粉蛋白显著沉淀之前很难检测到ad风险个体。此外,淀粉样蛋白、tua蛋白和脑脊液(cfs)的测量是有创的。尽管基于mri图像的深度学习方法在ad诊断方面取得了一些突破,但mri图像的获取往往繁琐且昂贵,同时也具有一定的滞后性。

3、尽管淀粉样蛋白标志物和mri技术已成功地用于阿尔茨海默症的诊断,但仍迫切需要新的生物标志物,以助于更好地了解疾病,识别早期和不同阶段的个体,并开发新的干预措施和治疗方案。最近的研究表明,ad是一种代谢性疾病,有ad风险的个体在淀粉样蛋白沉淀之前可能会发生代谢变化,通过血浆代谢物可以检测。

4、基于此,本专利技术设计了基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法,以解决上述提到的问题。


技术实现思路

1、本方法的目的是针对现有阿尔茨海默症检测方法的不足与局限,结合蛋白质组学,创造性地提出基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法。

2、本专利技术的创新点在于:利用血浆蛋白数据,对血浆蛋白特征进行预筛选与选择。基于筛选过后的纵向血浆蛋白质面板,结合catboost算法进行训练,从而得到一个基于血浆蛋白的阿尔茨海默症阶段性检测模型。该方法相对于传统算法,具有低成本,无创伤,易获得的特点。同时蛋白面板能够反映出阿尔茨海默症各阶段的代谢特点,提高了阿尔茨海默症诊断的准确性,为医学工作者提供代谢驱动型的临床见解,有助于采取更加准确的治疗和干预措施。

3、本专利技术采用以下技术方案实现。

4、基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法,包括如下步骤:

5、步骤1:血浆蛋白数据集划分和预处理。

6、具体地,步骤1包括以下步骤:

7、步骤1.1:对血浆蛋白数据集进行划分。

8、根据筛选准则,从临床采集的血浆蛋白数据中进行筛选,血浆蛋白数据集包含359个数据样本,146种血浆蛋白特征。其中包含健康对照(hc),轻度认知障碍(mci),以及阿尔茨海默症(ad)三个类别。实现过程中分别设计hc与ad、hc与mci、mci与ad三种二元分类器验证面板和模型的有效性。数据划分准则如下:(1)数据集1包含健康对照(hc)与阿尔茨海默症(ad)两类数据;(2)数据集2包含健康对照(hc)与轻度认知障碍(mci)两类数据;(3)数据集3包含轻度认知障碍(mci)与阿尔茨海默症(ad)两类数据;

9、步骤1.2:对血浆蛋白数据进行z-score标准化。

10、对蛋白质数据进行z-score标准化,防止某些蛋白质特征过大或者过小对整体的判断产生偏差。给定蛋白质初始值x,标准化值z由式(1)给出:

11、

12、其中,μ和σ分别表示对应蛋白特征的均值和标准差。

13、步骤2:利用步骤1标准化后的血浆蛋白数据,基于cfs进行特征预筛选。

14、具体地,步骤2包括以下步骤:

15、步骤2.1:对血浆蛋白数据进行降维。血浆蛋白数据包含146种蛋白质,为了避免高维数据占用过多的计算资源,同时使冗余和耦合的数据影响实验结果,需要降低数据的维数。对于血浆蛋白数据集,采用基于相关性的特征选择(correlation-based featureselection,cfs)算法进行处理,以提升本方法的鲁棒性。

16、步骤2.2:基于相关性的特征选择(cfs)对特征子集进行预筛选。

17、该特征预筛选的方法主要是基于血浆蛋白质特征之间的相关性。该方法基于的假设是,好的特征集合包含与目标变量非常相关的特征,但这些特征之间彼此不相关。具体而言,算法的核心是一种启发式算法,用于评估特征子集的价值或优势,选择与类高度相关但彼此不相关的特征。cfs通过式(2)将启发式算法形式化:

18、

19、其中,merits是包含k个特征的特征子集s的启发式评分,rfc是特征-类的平均相关性,rff是特征-特征的平均相关性。cfs首先从训练数据中计算特征-类和特征-特征相关性的矩阵,然后使用最佳优先搜索对特征子集空间进行搜索。

20、对于n维数据,存在2n个可能的特征子集,基于cfs算法从原始研究数据的146种蛋白质中预选出28种merit值为0.36的蛋白质。预选的蛋白质子集为:a1m,a2m,afp,apoa4,apoe,apoh,blc,bmp6,bnp,btc,cc3,clu,cortisol crp,eot1,eot3,hgf,igfbp,igm,il3,mmp10,pappa,plgf,ppp,rage,sgot,tnc,vit。

21、步骤3:利用血浆蛋白数据集,基于rfecv包装法对预筛选的血浆蛋白特征子集进行再筛选,并结合catboost模型进行评估。

22、根据血浆蛋白数据集的大小、规模以及特征形式,采用catboost模型对血浆蛋白数据集1进行训练,并通过rfecv进行特征再筛选。

23、catboost模型是梯度提升的一种实现,它使用二进制决策树作为基本预测因子。在梯度提升树(gbdt)的基础上,采用sort-boosting算法来取代传统算法中的梯度估计方法,从而减少了梯度估计的偏差,提高了模型的泛化能力。catboost算法试图从给定的数据中获得最大的信息,因此,它可以很好地处理血浆蛋白数据集。catboost基于gbdt,集成多个迭代决策树,基于所有树的结论作为最终结果进行累积。

24、具体地,catboost算法过程包括以下步骤:

25、步骤3.1:初始化弱学习器:

26、

27、其中,yi是经过模型预测值,c为叶子节点,l为均方误差。

28、步骤3.2:计算每个学习器的残差并迭代更新学习器。

29、具体地,每个学习器的更新过程本文档来自技高网...

【技术保护点】

1.基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法,其特征在于,步骤1.2做处理时,采用z-score将血浆蛋白数据进行标准化,使经过处理的血浆蛋白数据满足均值为0,标准差为1的标准正态分布。

3.如权利要求1所述的基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法,其特征在于,步骤2.2做处理时,基于数据集1进行特征子集预筛选,对于N维数据,存在2N个可能的特征子集;基于CFS算法从原始研究数据的146种蛋白质中预选出28种Merit值为0.36的蛋白质;预选的蛋白质子集为:A1M,A2M,AFP,ApoA4,ApoE,ApoH,BLC,BMP6,BNP,BTC,CC3,CLU,Cortisol CRP,Eot1,Eot3,HGF,IGFBP,IGM,IL3,MMP10,PAPPA,PLGF,PPP,RAGE,SGOT,TNC,Vit。

4.如权利要求1所述的基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法,其特征在于,步骤3.3做处理时,通过网格法确定CatBoost模型的最佳参数,设置最大迭代次数为1000次,学习率为0.1,树节点最大深度为0.7,过度拟合检测和最佳模型选择的指标为“AUC”。

5.如权利要求1所述的基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法,其特征在于,步骤4做处理时,所构建的纵向血浆蛋白面板为:A2M,ApoE,ApoH,BNP,CC3,Eot3,IGFBP,IL3,PAPPA,PPP,RAGE,SGOT,CoL。

...

【技术特征摘要】

1.基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法,其特征在于,步骤1.2做处理时,采用z-score将血浆蛋白数据进行标准化,使经过处理的血浆蛋白数据满足均值为0,标准差为1的标准正态分布。

3.如权利要求1所述的基于血浆蛋白标志物与机器学习的阿尔茨海默症诊断方法,其特征在于,步骤2.2做处理时,基于数据集1进行特征子集预筛选,对于n维数据,存在2n个可能的特征子集;基于cfs算法从原始研究数据的146种蛋白质中预选出28种merit值为0.36的蛋白质;预选的蛋白质子集为:a1m,a2m,afp,apoa4,apoe,apoh,blc,bmp6,bnp,btc,cc3,cl...

【专利技术属性】
技术研发人员:覃恒宇石秀民朱艺博朱苡萱
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1