一种基于Boosting算法的川崎病风险评估模型的构建方法及构建系统技术方案

技术编号:20223233 阅读:76 留言:0更新日期:2019-01-28 21:20
本发明专利技术公开了一种基于Boosting算法的川崎病风险评估模型的构建方法及构建系统。所述构建方法包括:从样本数据集中提取可用于建模评估的有效样本;从有效样本的特征集合中筛选出符合现场医疗辅助诊断应用的10项特征;将有效样本的不完整数据集随机分割为训练集和验证集;使用Boosting的方法拟合训练集进行模型构建,采用十折交叉验证法,记录最优模型参数;根据ROC曲线使用验证集计算模型分类阈值t,从而构建得到川崎病风险评估模型。本发明专利技术还构建相应的川崎病风险评估系统应用于对待评估数据进行评估,得到KDx评分。本发明专利技术有助于降低川崎病的误诊率和漏诊率,使患者在发病早期可以获得有效的预防、干预和治疗。

【技术实现步骤摘要】
一种基于Boosting算法的川崎病风险评估模型的构建方法及构建系统
本专利技术涉及一种模型的构建方法,具体来说涉及一种基于Boosting算法的预测川崎病风险的评估模型的构建方法、构建系统,以及评估系统,属于风险评估模型构建
技术背景川崎病又称小儿皮肤黏膜淋巴结综合征,是一种以全身血管炎为主要病变的急性发热出疹性疾病,高发年龄为5岁以下婴幼儿,男多于女,由于可发生严重心血管并发症而引起人们重视。川崎病以持续发热为最常见症状,临床表现与常见疾病如肺炎等相似,容易造成漏诊或误诊,可能遗留冠状动脉损害,甚至威胁生命,是儿童后天性心脏病最常见病因,也是成年后缺血性心脏病的危险因素。川崎病的治疗时机能明显影响预后,及时诊治,是避免冠状动脉病变的关键。目前的诊断依据必须发热≥5天,且需要等待临床症状出现,辅以实验室诊断和超心电图检查,容易使患儿错过最佳治疗时间。目前尚没有特异性的诊断方法,容易造成患儿漏诊,误诊的发生,临床治疗延误,进而造成更大的危害。因此,研发灵敏度高,特异性强的诊断方式成为川崎病诊疗的中急需满足的需求。基于医疗数据建模的川崎病患病预测模型可以辅助评估,有助于降低本文档来自技高网...

【技术保护点】
1.一种基于Boosting算法的川崎病风险评估模型的构建方法,其特征在于包括:从样本数据集中提取可用于建模评估模型的有效样本;从所述有效样本的特征集中筛选出符合现场医疗辅助诊断应用的10项特征;将所述有效样本的不完整数据集随机分割为训练集和验证集;使用Boosting的方法拟合训练集进行模型构建,采用十折交叉验证法,记录最优模型参数;同时,根据ROC曲线使用验证集计算模型分类阈值t,从而构建得到川崎病风险评估模型,其中,所述Boosting算法的类型包括XGBoosting、AdaBoosting或GBM。

【技术特征摘要】
1.一种基于Boosting算法的川崎病风险评估模型的构建方法,其特征在于包括:从样本数据集中提取可用于建模评估模型的有效样本;从所述有效样本的特征集中筛选出符合现场医疗辅助诊断应用的10项特征;将所述有效样本的不完整数据集随机分割为训练集和验证集;使用Boosting的方法拟合训练集进行模型构建,采用十折交叉验证法,记录最优模型参数;同时,根据ROC曲线使用验证集计算模型分类阈值t,从而构建得到川崎病风险评估模型,其中,所述Boosting算法的类型包括XGBoosting、AdaBoosting或GBM。2.根据权利要求1所述的基于Boosting算法的川崎病风险评估模型的构建方法,其特征在于:所述10项特征分别为性别、年龄、C-反应蛋白浓度、纤维蛋白原浓度、白蛋白浓度、球蛋白浓度、补体C3浓度、免疫球蛋白G浓度、前白蛋白浓度和白球比例。3.根据权利要求1所述的基于Boosting算法的川崎病风险评估模型的构建方法,其特征在于:训练集与验证集的分割比例为1:1~10:1。4.根据权利要求1所述的基于Boosting算法的川崎病风险评估模型的构建方法,其特征在于包括:根据ROC曲线使用验证集计算模型分类阈值t,KDx评分高于分类阈值t预测为川崎病高风险,低于分类阈值t预测为川崎病低风险。5.根据权利要求1-4中任一项所述的基于Boosting算法的川崎病风险评估模型的构建方法,其特征在于还包括:以完整的数据集作为测试集,对构建得到的川崎病风险评估模型进行预测。6.根据权利要求1所述的基于Boosting...

【专利技术属性】
技术研发人员:丁国徽贾佳李光徐重飞周珍
申请(专利权)人:苏州贝斯派生物科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1