一种尿结石风险评估模型的构建方法及构建体系技术

技术编号:37044190 阅读:14 留言:0更新日期:2023-03-29 19:23
本发明专利技术提供了一种尿结石风险评估模型的构建方法及构建体系,包括以下步骤:S1,数据集划分;S2,数据预处理;S3,特征指标筛选;S4,模型构建;S5,模型验证。本发明专利技术提供的一种尿结石风险评估模型的构建方法及构建体系,通过该模型基于尿结石晨尿医疗数据能够对疑似尿结石患者进行准确有效地辅助筛查,具有较高的灵敏度和特异度,能够科学有效地降低误诊率和漏诊率,样本采集相较于传统方法更便捷,能够为筛查和提供更加快速便捷、准确有效的依据,本发明专利技术创造性探索了尿结石疾病在有机酸代谢检测方向的内在关系,通过将传统风险因素和有机酸结合能够更准确地在患者早期进行辅助临床的筛查。筛查。筛查。

【技术实现步骤摘要】
一种尿结石风险评估模型的构建方法及构建体系


[0001]本专利技术涉及疾病风险评估模型构建
,具体为一种尿结石风险评估模型的构建方法及构建体系。

技术介绍

[0002]尿结石包括肾结石、输尿管结石、膀胱结石和尿道结石,是多种病理因素相互作用引起的泌尿系统内的结石病,尿结石在中国是高发疾病,患病率可达5%,南方发病率更高,复发率在50%以上,虽非致命性疾病,但尿结石伴随的疼痛级别较高,给患者带来严重的痛苦,认识自身的成石风险,是有效预防的第一步。
[0003]传统的尿结石发生风险预测,是通过尿液中一些经典的成石因子和抑石因子,包括钙,草酸,尿酸,磷酸钙,镁,柠檬酸等的测定,经由离子饱和度公式计算,得出尿液过饱和倾向,借此判定受检者是否处于成石风险中,该检测的基础理论认为,当尿液中的矿质成分长期处于过饱和状态,易析出形成晶核,聚集生长形成结石,过饱和度的计算原则基于无机化学中的理论:溶液中各离子组分浓度,对溶液饱和度有贡献作用,多种离子的综合饱和度,可迭代运算得出,这类计算公式和软件在上世纪60年代即提已出,经过发展,目前较为常用的软件有Equil2,JESS,lithorisk等。
[0004]以上尿结石预测软件,在实际应用中尚存在一定缺陷:1、仅考虑过饱和因素在成石中的作用,未考虑其他因素;2、已问世50年,理论学说缺乏进步空间,风险值的计算原理基于离子化学势能,不兼容新发现的结石风险biomarker;3、在中国人群中的评估效能未得到很好的验证,数据不足,也未纳入中国指南,是否能适应中国人独特的体质,饮食,习惯,遗传背景尚未可知;4、是否适用于晨尿无数据支持;5、效能系统性评估不足。
[0005]综上,现有的尿结石预测软件存在不同程度的缺陷,不具备支持晨尿,不易纳入新发现的分子标记,不符合中国人特征,无法快速更新迭代,持续提高灵敏度与特异性的新特性。

技术实现思路

[0006]本专利技术目的是提供一种尿结石风险评估模型的构建方法及构建体系,以解决现有技术中,尿结石预测软件存在不同程度的缺陷,不具备支持晨尿,不易纳入新发现的分子标记,不符合中国人特征,无法快速更新迭代,持续提高灵敏度与特异性的新特性的问题。
[0007]为实现上述目的,本专利技术提供如下技术方案:一种尿结石风险评估模型的构建方法,包括以下步骤:
[0008]S1,数据集划分:
[0009]从原始样本数据集中选择可用于模型评估的有效样本按一定比例随机划分为训练集和验证集,从新样本集中选择可用于模型验证的有效样本作为测试集;
[0010]S2,数据预处理:
[0011]对待估指标进行标准化和过滤处理,获得有效样本;
[0012]S3,特征指标筛选:
[0013]从模型评估的有效样本按一定条件筛选出符合医疗辅助应用的特征指标;
[0014]S4,模型构建:
[0015]建立偏最小二乘判别分析的方法拟合训练集并在验证集中进行预测;
[0016]S5,模型验证:
[0017]根据ROC曲线使用测试集计算模型分类阈值p,从而构建出尿结石风险评估模型。
[0018]优选的,所述S2中有效样本的获取步骤如下:
[0019]S2.1,根据尿结石标准将样本数据分为尿结石患者组和健康对照组,对不能明确结果的样本进行删除;
[0020]S2.2,对传统风险因素数据和有机酸风险因素数据进行肌酐校正处理;
[0021]S2.3,对样本数据中0值超过60%的指标进行删除处理;
[0022]S2.4,对缺失数据进行删除处理;
[0023]S2.5,对数值型指标进行Z

Score标准化处理,从而获得可用于构建风险评估的有效样本。
[0024]优选的,所述特征指标是由训练集有效样本所构建的模型得到相关参数值,再根据一定筛选条件对相关参数进行筛选得到,具体步骤如下:
[0025]S3.1,利用训练集和验证集的有效样本数据,分别进行传统风险因素和有机酸风险因素特征指标筛选,建立两个初始偏最小二乘判别分析模型,即对样本的分类变量矩阵Y
n
×2和待估指标矩阵X
n
×
m
进行分解,其中,n为样本个数,m为待估指标个数;
[0026]S3.2,计算两个初始偏最小二乘判别分析模型中各指标的变量投影重要性分析值(VIP);
[0027]S3.3,依据步骤S3.2所得结果,分别取传统风险因素和有机酸风险因素中变量投影重要性分析值大于1的指标,并将筛选出的特征指标进行倒序排列;
[0028]S3.4,将步骤S3.3中选取的指标合并作为特征指标。
[0029]优选的,所述训练集和验证集划分比例为7:3。
[0030]优选的,所述模型构建的具体步骤如下:
[0031]S4.1,按照7:3的比例,将原始数据集划分为训练集train和验证集validation,新样本数据集作为测试集test;
[0032]S4.2,使用偏最小二乘判别分析的方法拟合train数据集进行模型构建,获得模型参数,所构建模型如下所示:
[0033][0034]其中,T为特征指标矩阵,β为特征指标的权重矩阵,n为特征指标个数;
[0035]S4.3,根据所构建模型对验证集进行预测得到初始ROC曲线。
[0036]优选的,所述S5构建出尿结石风险评估模型;具体步骤如下:
[0037]S5.1,在测试集中,根据所构建的偏最小二乘判别分析模型进行预测,得到分类预测得分;
[0038]S5.2,选择在[0,1]范围内的不同预测得分数值作为分类阈值;
[0039]S5.3,分别计算各分类阈值的预测灵敏度、特异度、真阴性率和假阴性率,并绘制
ROC曲线图;
[0040]S5.4,根据ROC曲线图在满足AUC大于90%的情况下选取灵敏度和特异度大于80%的分类阈值。
[0041]优选的,根据ROC曲线使用测试集计算模型分类阈值p,模型拟合值高于阈值p预测为尿结石阳性者,低于阈值p预测为尿结石阴性者。
[0042]本专利技术第二方面提供一种运行本专利技术第一方面所述方法的构建体系,包括数据收集模块、数据预处理模块、模型构建模块、模型检验模块和阈值确定模块;
[0043]所述数据收集模块,用于数据收集,获取样本数据集;
[0044]所述数据预处理模块,用于从原始样本数据集中提取可用于模型评估的有效样本,以及从新样本数据集中提取可用于模型检验的有效数据;
[0045]所述模型构建模块,用于将所述模型评估有效样本划分为训练集和验证集,使用偏最小二乘判别分析的方法拟合训练集并在验证集中预测;
[0046]所述模型检验模块,可用于将模型验证有效样本作为测试集,进一步检验模型;
[0047]所述阈值确定模块,可用于依据测试集的ROC曲线计算模型分类阈值。
[0048]本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种尿结石风险评估模型的构建方法,其特征在于,包括以下步骤:S1,数据集划分:从原始样本数据集中选择可用于模型评估的有效样本按一定比例随机划分为训练集和验证集,从新样本集中选择可用于模型验证的有效样本作为测试集;S2,数据预处理:对待估指标进行标准化和过滤处理,获得有效样本;S3,特征指标筛选:从模型评估的有效样本按一定条件筛选出符合医疗辅助应用的特征指标;S4,模型构建:建立偏最小二乘判别分析的方法拟合训练集并在验证集中进行预测;S5,模型验证:根据ROC曲线使用测试集计算模型分类阈值p,从而构建出尿结石风险评估模型。2.根据权利要求1所述的一种尿结石风险评估模型的构建方法,其特征在于,所述S2中有效样本的获取步骤如下:S2.1,根据尿结石标准将样本数据分为尿结石患者组和健康对照组,对不能明确结果的样本进行删除;S2.2,对传统风险因素数据和有机酸风险因素数据进行肌酐校正处理;S2.3,对样本数据中0值超过60%的指标进行删除处理;S2.4,对缺失数据进行删除处理;S2.5,对数值型指标进行Z

Score标准化处理,从而获得可用于构建风险评估的有效样本。3.根据权利要求1所述的一种尿结石风险评估模型的构建方法,其特征在于,所述特征指标是由训练集有效样本所构建的模型得到相关参数值,再根据一定筛选条件对相关参数进行筛选得到,具体步骤如下:S3.1,利用训练集和验证集的有效样本数据,分别进行传统风险因素和有机酸风险因素特征指标筛选,建立两个初始偏最小二乘判别分析模型,即对样本的分类变量矩阵Y
n
×2和待估指标矩阵X
n
×
m
进行分解,其中,n为样本个数,m为待估指标个数;S3.2,计算两个初始偏最小二乘判别分析模型中各指标的变量投影重要性分析值(VIP);S3.3,依据步骤S3.2所得结果,分别取传统风险因素和有机酸风险因素中变量投影重要性分析值大于1的指标,并将筛选出的特征指标进行倒序排列;S3.4,将步骤S3.3中选取的指标合并作为特征指标。4.根据权利要求1...

【专利技术属性】
技术研发人员:罗宏敏吴莉萍姜盼盼郑晨晴鲁艳杨琴杨旭杨江涛
申请(专利权)人:深圳爱湾医学检验实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1