遗传代谢病的辅助诊断预测方法、装置、设备及介质制造方法及图纸

技术编号：38686361 阅读：15 留言：0更新日期：2023-09-02 22:59

本申请提供了一种遗传代谢病的辅助诊断预测方法、装置、设备及介质，首先通过第一层模型进行阳性预测，当预测为阳性时，采用第二层模型对阳性的类型进行预测；当利用第一层模型预测为阴性或指标异常时，不再对阴性或指标异常样本做进一步处理。通过构建两层模型大大提高了预测的准确度，且第一层模型和第二层模型在训练的过程中采用SHAP特征选择模型辅助进行特征的选择，使得特征的选择更优，从而提高了模型预测的准确度和稳定性，另外，SHAP特征选择模型可用于分析得到每个特征对应的贡献度，基于预测结果和每个特征对应的贡献度对结果进行可视化解释，从而实现了可视化展示参数(特征)对于疾病的作用机制，提高了模型的可信度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
遗传代谢病的辅助诊断预测方法、装置、设备及介质

[0001]本申请涉及医疗数据处理
，特别涉及为一种遗传代谢病的辅助诊断预测方法、装置、设备及介质。

技术介绍

[0002]遗传代谢病是指遗传物质突变导致与蛋白质，脂肪等物质代谢相关的酶或者转运蛋白缺陷。它是危害儿童生命、影响儿童体格以及智利发育的先天性遗传疾病。根据临床表现及时发现并治疗是避免患病儿童身心产生不可逆损伤的重要临床需求之一。
[0003]目前临床上使用串联质谱检测技术来检测多种遗传代谢病，针对质谱检测结果的解读，传统人工判别方式是对单一指标做分析，工作量大且cutoff值(用于衡量的阈值)不明确，假阳性高同时有一定的假阴性率。同时，对遗传代谢罕见病的诊断，缺少权威标准的诊断指南，诊断水平受医疗从业人员专业背景和经验的制约。在这样的背景下，大范围推广串联质谱技术面临挑战。
[0004]随着医疗信息化时代的演进，大数据背景下的人工智能算法给质谱新生儿遗传代谢病辅助诊断带来了新机遇。临床医学开始使用统计学方法进行遗传代谢病诊断分析，然而对多病种的判别正确率方面不能达到令人满意的程度。C L I R系统是美国MAYO诊所开发的一款基于云服务的智能化质谱数据诊断分析平台，该平台技术不透明，且要求共享健康隐私数据，使得技术壁垒和敏感信息管控方面产生隐忧，且目前的模型无法展示参数的作用机制，导致模型可信度低。
[0005]综上所述，国际医疗数据敏感性的限制且国内质谱遗传代谢病大数据分析平台尚不完善。智能识别解读遗传代谢疾病，成为了解决新生...

【技术保护点】

【技术特征摘要】
1.一种遗传代谢病的辅助诊断预测方法，其特征在于，包括：获取待预测的样本数据，所述待预测的样本数据包括：尿有机酸质谱数据；将所述待预测的样本数据作为第一层模型的输入，所述第一层模型用于预测样本是否为阳性，若为阳性，则将所述待预测的样本数据作为第二层模型的输入，所述第二层模型中包括多个判别器，每个判别器对应一种阳性类型，所述第二层模型用于综合所述多个判别器的输出结果给出预测结果，所述第一层模型和所述第二层模型的训练过程中采用SHAP特征选择模型辅助进行特征的选择，所述SHAP特征选择模型用于分析得到每个特征对应的贡献度；获取所述第二层模型输出的预测结果；基于所述预测结果和所述每个特征对应的贡献度进行可视化结果展示，所述可视化结果展示包括：综合特征展示、模型可信性展示和可视化推理展示。2.根据权利要求1所述的方法，其特征在于，所述第一层模型的训练过程如下：获取原始样本集，所述原始样本集为收集到的原始尿有机酸质谱数据；对所述原始样本集中的样本进行预处理，得到第一训练数据集；基于所述第一训练数据集对所述第一层模型进行训练，且采用所述SHAP特征选择模型辅助进行特征的优化选择，得到训练好的第一层模型。3.根据权利要求2所述的方法，其特征在于，所述对所述原始样本集中的样本进行预处理，得到第一训练数据集，包括：对所述原始样本集中的样本依次进行缺失值填充处理、年龄筛选处理、特征分布校验处理、归一化处理得到预处理数据集；基于所述预处理数据集中的目标样本数量对非目标样本进行欠采样处理，以使得目标样本和非目标样本的数量处于均衡，得到分布均衡的训练数据集。4.根据权利要求3所述的方法，其特征在于，所述第二层模型的训练过程如下：获取所述预处理数据集中的目标样本作为所述第二层模型的第二训练数据集；基于所述第二训练数据集中的主导样本数量对非主导样本进行过采样处理，以得到均衡的第二训练数据集；基于所述均衡的第二训练数据集对所述第二层模型进行训练，且采用所述SHAP特征选择模型辅助进行特征的优化选择，得到训练好的第二层模型。5.根据权利要求4所述的方法，其特征在于，所述基于所述均衡的第二训练数据集对所述第二层模型进行训练，且采用所述SHAP特征选择模型辅助进行特征的优化选择，得到训练好的第二层模型，包括：所述第二层模型的内部基于Huber权重函数采用级联权重计算第二层模型中各个子判别器的权重；基于所述各个子判别器的权重进行加权求和确定所述第二层模型的输出结果。6.根据权利要求5所述的方法，其特征在于，所述第二层模型的内部基于Huber权重函数采用级联权重计算第二层模型中各个子判别器的权重，包括：采用基于Huber权重函数来动态控制第二层模型中各个子判别器的权重，Huber权重函数表示如下：
其中θ
i
为第i个子判别器的权重惩罚因子，b为可调参数，|μ
i
|为样本x
i
的标准化残差：r
i
为第i个样本预测值和测量值之间的残差，为鲁棒尺度，MAR＝med(|r
‑
mend(r
i
)|)代表绝对剩余中位数，med(
·
)为中位数函数；级联权重计算公式为：loss＝||Y
i
‑
θ
i
w
i
x
i
||2‑<...

【专利技术属性】
技术研发人员：朱敏，赵蓓蓓，高思远，佘旭辉，李菁，陈秀如，倪周，刘畅，李映华，梁小丹，梁耀铭，
申请(专利权)人：广州金域医学检验集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人