【技术实现步骤摘要】
遗传性代谢病的预测方法、装置和设备
[0001]本申请涉及医学信息
,特别是涉及一种遗传性代谢病的预测方法、装置和设备。
技术介绍
[0002]遗传性代谢病(Inherited Metabolic Disorders,IMD)又称先天性代谢缺陷,是由于编码物质代谢所必需的酶或者辅酶基因变异引起相应功能蛋白活性降低或丧失,从而导致机体代谢紊乱,造成中间、旁路代谢产物蓄积,或终末代谢产物缺乏,最终引发复杂的临床症状,常累及神经系统等多器官的一组疾病。
[0003]遗传性代谢病具有先天性、伴随终生的特点,并且遗传代谢病往往会对患儿的神经系统造成不可逆损伤,甚至危及生命。因此,针对遗传代谢病,必须及时筛查和诊断,否则难以在有限的时间内让患儿通过有效的治疗方法缓解相应的症状。
[0004]近年来,通过串联质谱技术检测小分子代谢物,被广泛应用于对新生儿遗传代谢病的筛查,极大地提高了临床医生发现遗传代谢病患儿的能力,有利于遗传代谢病患儿的早期检出。然而,目前对新生儿小分子代谢物检测数据的阳性判断假阳性率高,导致预测遗 ...
【技术保护点】
【技术特征摘要】
1.一种遗传性代谢病的预测方法,其特征在于,所述方法包括:获取待检测对象的血清小分子代谢物的待测数据;计算所述待测数据中每种特征的贡献度值;按照所述每种特征的贡献度值从大到小的顺序,筛选出预设数量的贡献度值对应的特征为目标特征;根据所述目标特征对应的待测数据,预测所述待测对象的病症信息。2.根据权利要求1所述的方法,其特征在于,所述计算所述待测数据中每种特征的贡献度值,包括:采用随机森林算法计算所述待测数据中每种特征所在随机森林中每个决策树的节点的第一Gini指数;计算所述待测数据中每种特征所在决策树的节点进行分裂得到的两个新节点的第二Gini指数;根据所述第一Gini指数、所述第二Gini指数和所述待测数据中每种特征所在每个决策树的全部节点,计算所述待测数据中每种特征在每个决策树的重要性评分;根据重要性评分和所述随机森林中决策树的数量,计算所述待测数据中每种特征的贡献度值。3.根据权利要求2所述的方法,其特征在于,所述第一Gini指数采用以下公式计算得到:其中,Gini
m
表示待测数据中特征j所在决策树的节点m的第一Gini指数,k表示特征分类的数量,p
mk
表示节点m在k个特征分类中出现的概率;所述待测数据中特征j在第i个决策树的重要性评分采用以下公式计算得到:其中,表示待测数据中特征j在第i个决策树的重要性评分,表示待测数据中特征j所在决策树的节点m的重要性评分,M表示待测数据中每种特征在随机森林中所有决策树的节点的集合;其中,所述待测数据中特征j所在决策树的节点m的重要性评分采用以下公式计算:其中,表示待测数据中特征j所在决策树的节点m的重要性评分,l和r表示待测数据中特征j所在决策树的节点m进行分裂之后的两个新节点,Gini
l
表示节点l的Gini指数,Gini
r
表示节点r的Gini指数。4.根据权利要求1所述的方法,其特征在于,所述病症信息包括已患病和未患病;所述根据所述目标特征对应的待测数据,预测所述待测对象的病症信息,包括:将所述目标特征对应的待测数据输入预先训练的识别模型,所述识别模型包括多个树
分类器;每个所述树分类器根据所述目标特征对应的待测数据生成第一识别结果或第二识别结果,所述第一识别结果表征所述待测对象已患病,所述第二识别结果表征所述待测对象未患病;根据所述第一识别结果对应树分类器的数量和所述第二识别结果对应树分类器的数量,预测所述待测对象的病症信息。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一识别结果对应树分类器的数量和所述第二识别结果对应树分类器的数量,预测所述待测对象的病症信息,包括:当所述第一识别结果对应树分类器的数量多于所述第二识别结果对应树分类器的数量时,预测所述待测对象的病症信息为已患病;当...
【专利技术属性】
技术研发人员:马旭,曹宗富,殷哲,
申请(专利权)人:国家卫生健康委科学技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。