诊断HCM的装置、预测HCM患者预后的装置制造方法及图纸

技术编号:33834051 阅读:139 留言:0更新日期:2022-06-16 11:22
本申请公开了一种诊断肥厚型心肌病(HCM)的装置和预测HCM患者预后的装置。所述诊断HCM的装置包括:数据获取单元,配置为获取包括多个正常人的血液样本的样本数据和多个HCM患者的血液样本的样本数据作为第一训练数据集;诊断模型构造单元包括:特征筛选单元,配置为利用套索回归算法对所述第一训练数据集执行降维处理以获得第二训练数据集;和模型构造单元,配置为利用随机森林算法,使用所述第二训练数据集训练多个决策树来构造随机森林模型作为HCM诊断模型;以及诊断单元,配置为使用构造的HCM诊断模型获得指示用户是否患有HCM的诊断结果。诊断结果。诊断结果。

【技术实现步骤摘要】
诊断HCM的装置、预测HCM患者预后的装置


[0001]本公开涉及诊断肥厚型心肌病(HCM)的装置以及预测肥厚型心肌病患者预后的装置。

技术介绍

[0002]肥厚型心肌病(HCM)是一种以心肌肥大为特征的心血管疾病,临床特征表现为左心室壁厚度的增加。HCM作为最常见的遗传性心血管疾病之一,在普通人群中的患病率高达1:200

500,影响着全球2千万人的健康。中国HCM患病率为80/10万,粗略估计中国有超过100万的HCM患者。HCM已成为心脏性猝死、心力衰竭和心房颤动的重要原因,对现代社会的医疗保健系统和经济造成了巨大负担。
[0003]目前HCM的诊断方式主要是通过对疑似病例进行心脏超声动图或者核磁共振方法检测左心室壁肥厚,从而确诊HCM。然而,该方法在诊断过程中存在一定的滞后性,对检测设备要求较高,同时还存在一定的误诊及漏诊病例。
[0004]当前临床上并没有能够很好预测HCM患者预后的指标,潜在的与HCM患者预后相关的临床指标也没有表现出精确的预测能力。鉴于当前HCM诊断方法的局限性以及HCM患者预后情况指征指标的缺乏,本领域期望能够准确诊断HCM以及精确预测HCM患者预后的新指标以及新方法。
[0005]因此,在HCM诊断方法存在局限性以及HCM患者预后指征指标缺乏的情况下,本技术方案提出了一种根据代谢物水平并结合机器学习算法构建诊断/预测模型的方法,实现HCM的早期、简易及精确诊断,同时实现HCM患者手术后死亡风险预测,告知患者提前做好预防及治疗措施。

技术实现思路

[0006]本公开提供了诊断肥厚型心肌病的装置以及预测肥厚型心肌病患者预后的装置。
[0007]在一个示例方面,公开了一种诊断肥厚型心肌病(HCM)的装置,包括:数据获取单元、诊断模型构造单元和诊断单元。数据获取单元配置为获取包括多个正常人的血液样本的样本数据和多个HCM患者的血液样本的样本数据作为第一训练数据集,所述第一训练数据集包括第一数量个样本数据,并且所述样本数据的每个包括第二数量种类的代谢物的丰度数据。诊断模型构造单元包括特征筛选单元和模型构造单元。特征筛选单元配置为利用套索回归算法对所述第一训练数据集执行降维处理以获得第二训练数据集,所述第二训练数据包括第一数量个降维样本数据,并且所述降维样本数据的每个包括从所述第二数量种类的代谢物中筛选出的第三数量种类的一组特征代谢物的丰度数据。模型构造单元配置为利用随机森林算法,使用所述第二训练数据集训练多个决策树来构造随机森林模型作为HCM诊断模型。诊断单元配置为使用构造的HCM诊断模型获得指示用户是否患有HCM的诊断结果。
[0008]根据实施例,所述特征筛选单元进一步配置为通过设置套索回归算法中的正则化
系数,确定样本数据中的第二数量种类的代谢物各自对应的特征系数,以及
[0009]确定特征系数不为零的代谢物作为所述第三数量种类的一组特征代谢物,以获得包括第三数量种类的一组特征代谢物的丰度数据的降维样本数据作为第二训练数据集。
[0010]根据实施例,所述正则化系数设置为0.001,并且所述第三数量种类的一组特征代谢物为五种特征代谢物,包括次黄嘌呤、色氨酸、8:0

肉碱、苯丙氨酸以及肌酸。
[0011]根据实施例,所述模型构造单元进一步配置为在所述第二训练数据集中,通过每次随机选择一个样本数据的方式,有放回地选择第一数量个样本数据用于训练一棵决策树,
[0012]通过自助法重采样方式重复多次训练获得第四数量棵的决策树,以及利用所述第四数量棵的决策树形成随机森林模型作为HCM诊断模型,其中所述HCM诊断模型评估所有决策树的决策结果,并基于多数原则输出最终的诊断结果。
[0013]根据实施例,所述模型构造单元进一步配置为针对每一棵决策树,有放回地选择第一数量个样本数据作为决策树的根节点处的样本,
[0014]在决策树的每个节点需要分裂时,随机从所述五种代谢物中选取出m个代谢物,m是小于等于5的整数,并且选择使得节点基尼系数最小的代谢物作为决策树的节点的分裂条件,
[0015]根据选择的一组特征代谢物对每一个节点执行分裂操作,使得每个子节点包括样本数据的一部分,重复执行分裂操作直到决策树的每个子节点只存在一种类别。
[0016]根据实施例,所述数据获取单元进一步配置为获取多个用户的血液样本的样本数据作为测试数据集,以及
[0017]所述诊断模型构造单元进一步包括模型测试单元,配置为使用所述测试数据集测试构造的HCM诊断模型,以评估所述HCM诊断模型在独立数据集上的准确性。
[0018]根据实施例,所述数据获取单元包括试剂盒,配置为获取一个或多个诊断用户的血液样本中的五种特征代谢物的丰度数据,
[0019]所述诊断单元进一步配置为将用户的五种特征代谢物的丰度数据输入所述HCM诊断模型,并且输出指示用户是否患有HCM的诊断结果。
[0020]根据另一示例方面,公开了一种预测肥厚型心肌病(HCM)患者预后的装置,包括:
[0021]数据获取单元,配置为获取包括多个手术后存活的HCM患者的心脏组织样本的样本数据和多个手术后死亡的HCM患者的心脏组织样本的样本数据作为第一训练数据集,所述第一训练数据集包括第一数量个样本数据,并且所述样本数据的每个包括第二数量种类的代谢物的丰度数据;
[0022]预测模型构造单元,包括:
[0023]第一模型构造单元,配置为利用随机生存森林算法,使用所述第一训练数据集中第二数量种类的代谢物的丰度数据训练第一随机生存森林模型;
[0024]特征筛选单元,配置为利用所述第一随机生存森林模型的变量重要性得分,对所述第一训练数据集执行降维处理以获得第二训练数据集,所述第二训练数据包括第一数量个降维样本数据,并且所述降维样本数据的每个包括从所述第二数量种类的代谢物中筛选出的第三数量种类的一组特征代谢物的丰度数据;
[0025]第二模型构造单元,配置为利用随机生存森林算法,使用所述第二训练数据集训
练多个生存树来构造随机生存森林模型作为HCM预后预测模型;以及
[0026]预测单元,配置为使用构造的HCM预后预测模型获得指示HCM患者的预后预测的预测结果。
[0027]根据实施例,所述特征筛选单元进一步配置为确定所述第一训练数据集中所有第二数量种类的代谢物的重要性得分,根据重要性得分从高到低顺序选择预定数量个重要代谢物,并且在同一类别的脂质代谢物中只选择重要性得分最高的一个代谢物,从而从所述第二数量种类的代谢物中筛选出第三数量种类的一组特征代谢物。
[0028]根据实施例,所述第三数量种类的一组特征代谢物为十二种特征代谢物,包括二甲基甘氨酸、N

乙酰基

L

谷氨酰胺、一磷酸黄嘌呤核苷、一磷酸核苷、γ

氨基丁酸、18:0

肉碱、尿苷二磷酸半乳糖、磷脂酰本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种诊断肥厚型心肌病(HCM)的装置,包括:数据获取单元,配置为获取包括多个正常人的血液样本的样本数据和多个HCM患者的血液样本的样本数据作为第一训练数据集,所述第一训练数据集包括第一数量个样本数据,并且所述样本数据的每个包括第二数量种类的代谢物的丰度数据;诊断模型构造单元,包括:特征筛选单元,配置为利用套索回归算法对所述第一训练数据集执行降维处理以获得第二训练数据集,所述第二训练数据包括第一数量个降维样本数据,并且所述降维样本数据的每个包括从所述第二数量种类的代谢物中筛选出的第三数量种类的一组特征代谢物的丰度数据;模型构造单元,配置为利用随机森林算法,使用所述第二训练数据集训练多个决策树来构造随机森林模型作为HCM诊断模型;以及诊断单元,配置为使用构造的HCM诊断模型获得指示用户是否患有HCM的诊断结果。2.如权利要求1所述的装置,其中所述特征筛选单元进一步配置为通过设置套索回归算法中的正则化系数,确定样本数据中的第二数量种类的代谢物各自对应的特征系数,以及确定特征系数不为零的代谢物作为所述第三数量种类的一组特征代谢物,以获得包括第三数量种类的一组特征代谢物的丰度数据的降维样本数据作为第二训练数据集。3.如权利要求2所述的装置,其中所述正则化系数设置为0.001,并且所述第三数量种类的一组特征代谢物为五种特征代谢物,包括次黄嘌呤、色氨酸、8:0

肉碱、苯丙氨酸以及肌酸。4.如权利要求3所述的装置,其中所述模型构造单元进一步配置为在所述第二训练数据集中,通过每次随机选择一个样本数据的方式,有放回地选择第一数量个样本数据用于训练一棵决策树,通过自助法重采样方式重复多次训练获得第四数量棵的决策树,以及利用所述第四数量棵的决策树形成随机森林模型作为HCM诊断模型,其中所述HCM诊断模型评估所有决策树的决策结果,并基于多数原则输出最终的诊断结果。5.如权利要求4所述的装置,其中所述模型构造单元进一步配置为针对每一棵决策树,有放回地选择第一数量个样本数据作为决策树的根节点处的样本,在决策树的每个节点需要分裂时,随机从所述五种代谢物中选取出m个代谢物,m是小于等于5的整数,并且选择使得节点基尼系数最小的代谢物作为决策树的节点的分裂条件,根据选择的一组特征代谢物对每一个节点执行分裂操作,使得每个子节点包括样本数据的一部分,重复执行分裂操作直到决策树的每个子节点只存在一种类别。6.如权利要求1

5的任一所述的装置,其中,所述数据获取单元进一步配置为获取多个用户的血液样本的样本数据作为测试数据集,以及所述诊断模型构造单元进一步包括模型测试单元,配置为使用所述测试数据集测试构造的HCM诊断模型,以评估所述HCM诊断模型在独立数据集上的准确性。7.如权利要求3

5的任一所述的装置,其中所述数据获取单元包括试剂盒,配置为获取一个或多个诊断用户的血液样本中的五种特征代谢物的丰度数据,所述诊断单元进一步配置为将用户的五种特征代谢物的丰度数据输入所述HCM诊断模
型,并且输出指示用户是否患有HCM的诊断结果。8.一种预测肥厚型心肌病(HCM)患者预后的装置,包括:数据获取单元,配置为获取包括多个手术后存活的HCM患者的心脏组织样本的样本数据和多个手术后死亡的HCM患者的心脏组织样本的样本数据作为第...

【专利技术属性】
技术研发人员:胡泽平汪文敏宋雷王继征
申请(专利权)人:中国医学科学院阜外医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1