一种基于COPD风险判断的被筛查患者AUC提升方法技术

技术编号:33647943 阅读:14 留言:0更新日期:2022-06-02 20:25
本发明专利技术公开了一种基于COPD风险判断的被筛查患者AUC提升方法,包括如下步骤:S1、数据收集,每个受试者先进行基本信息收集和问卷填写,然后通过肺功能测试判断其COPD是否阳性,形成数据库;S2、对数据进行特征化,转化为类别型变量;S3、数据建模,采用五折交叉验证对单模进行评估,并采用回归等模型及其不同设定,对数据进行建模;S4、剔除交叉验证的平均AUC在后的模型,通过上述步骤数据收集、数据特征化、数据建模以及剔除交叉验证的平均AUC在后的模型,排名靠前的单模,用stacking方法进行集成,预测新的测试数据,并将数据特征化分为三大类,根据类别进行转化,利用归一标准化统一被筛查患者的采集数据,极大的提升筛查的准确性。性。性。

【技术实现步骤摘要】
一种基于COPD风险判断的被筛查患者AUC提升方法


[0001]本专利技术涉及待测者AUC提升相关的
,具体涉及一种基于COPD风险判断的被筛查患者AUC提升方法。

技术介绍

[0002]COPD是一种由于气流不畅所致的阻塞性肺部疾病。COPD的两个主要潜在原因是肺气肿和气道疾病(例如,支气管炎)。COPD可以基于初步问卷进行诊断,并且如果根据问卷结果显得必要,则然后在吸入药物和没有吸入药物这两种情况下都进行呼吸测量(肺活量测定)。问卷信息覆盖广泛的信息,包括家族史、症状和习惯(例如,吸烟)史、疾病史和相应的严重程度(例如,哮喘、癌症等)、活动水平以及一般健康度量。肺活量测定测试的主要输出是1秒钟用力呼气值(FEV1)和用力肺活量(FVC)。将这些值基于人口分布进行标准化。
[0003]COPD筛查问卷(PS问卷)在临床使用中,一般是根据待测者选择的选项对应的分数,进行加和,对总分按照一个阈值来判断被筛查患者是否有COPD风险。虽然这样的方法在技术实现方面非常简单,易于操作,但是这样也使得筛查效果无法得到提升,同时这样的传统方法限制了筛查的准确性。

技术实现思路

[0004]本专利技术的目的在于提供一种基于COPD风险判断的被筛查患者AUC提升方法,通过机器学习的方法,能够极大的提升筛查的准确性,可将AUC提升15个百分点,以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:
[0006]一种基于COPD风险判断的被筛查患者AUC提升方法,包括如下步骤:
[0007]S1、数据收集,每个受试者先进行基本信息收集和问卷填写,然后通过肺功能测试判断其COPD是否阳性,形成数据库;
[0008]S2、对数据进行特征化,包括以下三种:
[0009]①
如果问题的答案是类别型的,直接转化为类别型特征变量,将文本化的答案进行归一标准化;
[0010]②
如果问题的答案是数值型的,对待测者的答案进行单位归一化后转化为数值;
[0011]③
如果问题的答案是开放性的,根据答案进行总结,转化为上述类别型的答案,进而转化为类别型变量;
[0012]S3、数据建模,采用五折交叉验证对单模进行评估,并回归等模型及其不同设定,对数据进行建模;
[0013]S4、剔除交叉验证的平均AUC在后的模型,排名靠前的单模,用stacking方法进行集成,预测新的测试数据(即新筛查的待测者)。
[0014]其中,所述步骤S1中的数据收集可以包括医学扫描仪被配置成扫描待测者的肺部,产生表示待测者肺部的图像数据;图像处理器被配置成利用机器学习模型、基于图像数
据中表示的气道的分割和基于图像数据中表示的肺部的特征,从流动模型生成肺部中的COPD指示;该特征可以是疾病的纹理或基于成像的指示,显示器被配置成显示COPD指示。
[0015]其中,所述步骤S2中的对数据进行特征化的用于预测COPD急性加重的系统所使用的变量进一步包括社交数据和基于社交数据服务器提供的变量。
[0016]其中,所述社交数据是在与待测者的所述病历数据或所述临床方面数据相关联的变量被创建的特定时间点之前以及包括该特定时间点的预定时间段内收集的数据,并且由所述社交数据服务器提供的变量包括能够在搜索引擎和社交媒体的数据中发现的COPD相关术语的搜索频率、与COPD的症状相关的术语的搜索频率或者与伴随COPD的并发症相关的术语的搜索频率中的至少一种。
[0017]其中,所述步骤S3中的数据建模还包括:从第一成像数据分割肺部的气道,和/或实行针对气道的计算流动动力学;针对气流的值可以是应力、压力、速度或体积值。在其它实施例中,该建模是利用三维模型对气道的第一部分的建模,以及是利用降阶模型对气道的第二部分的建模;第二部分具有与第一部分的气道相比具有更小直径的气道。
[0018]其中,数据建模是利用三维模型对气道的第一部分的建模,以及是利用降阶模型对气道的第二部分的建模;第二部分具有与第一部分的气道相比具有更小直径的气道。
[0019]其中,所述步骤S1中的数据收集还可以通过视频、图片、语音和文字形式给测试者示范正确的测量引导,提示测试者在测量中的关键要领和更正测量过程中的错误,逐步引导测试者独立完成数据的收集。
[0020]其中,所述步骤S2中进行特征化的数据包含了与COPD相关的症状和危险因素的填写,包括:现在及过去的吸烟量调查、是否患有哮喘病史和呼吸音数据采集等;同时,根据中国国民的体质标准和生活习惯,对问卷内容进行相应的更改;最后根据问卷调查结果进行评分,并将评分结果作为评估测试者肺机能的重要参考依据。
[0021]其中,所述呼吸音数据仅包括一种呼吸信息。其它种类的呼吸信息可以是主观的或客观的,并且可以包括关于呼吸系统的文本、图像、视频和数字信息,包括年龄、体重、地理位置、病史、生活方式和各种其它人口统计和简档信息,以及待测者对关于的呼吸系统的问题的回答。
[0022]综上所述,由于采用了上述技术,本专利技术的有益效果是:
[0023]本专利技术中,通过如下步骤数据收集、数据特征化、数据建模以及剔除交叉验证的平均AUC在后的模型,排名靠前的单模,用stacking方法进行集成,预测新的测试数据,并将数据特征化分为三大类,根据类别进行转化,利用归一标准化统一被筛查患者的采集数据,极大程度的提升筛查的准确性。
附图说明
[0024]图1为本专利技术一种基于COPD风险判断的被筛查患者AUC提升方法的流程图。
具体实施方式
[0025]为使本专利技术实施方式的目的、技术方案和优点更加清楚,下面将结合本专利技术实施方式中的附图,对本专利技术实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本专利技术一部分实施方式,而不是全部的实施方式。基于本专利技术中的实施方式,本领
域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本专利技术保护的范围。因此,以下对在附图中提供的本专利技术的实施方式的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施方式。基于本专利技术中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本专利技术保护的范围。
[0026]实施例1
[0027]本专利技术提供了如图1所示的一种基于COPD风险判断的被筛查患者AUC提升方法,包括如下步骤:
[0028]S1、数据收集,每个受试者先进行基本信息收集和问卷填写,然后通过肺功能测试判断其COPD是否阳性,形成数据库;
[0029]S2、对数据进行特征化,包括以下三种:
[0030]①
如果问题的答案是类别型的,直接转化为类别型特征变量,将文本化的答案进行归一标准化;
[0031]②
如果问题的答案是数值型的,对待测者的答案进行单位归一化后转化为数值;
[0032]③
如果问题本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于COPD风险判断的被筛查患者AUC提升方法,其特征在于,包括如下步骤:S1、数据收集,每个受试者先进行基本信息收集和问卷填写,然后通过肺功能测试判断其COPD是否阳性,形成数据库;S2、对数据进行特征化,包括以下三种:

如果问题的答案是类别型的,直接转化为类别型特征变量,将文本化的答案进行归一标准化;

如果问题的答案是数值型的,对待测者的答案进行单位归一化后转化为数值;

如果问题的答案是开放性的,根据答案进行总结,转化为上述类别型的答案,进而转化为类别型变量;S3、数据建模,采用五折交叉验证对单模进行评估,并采用回归等模型及其不同设定,对数据进行建模;S4、剔除交叉验证的平均AUC在后的模型,排名靠前的单模,用stacking方法进行集成,预测新的测试数据。2.根据权利要求1所述的一种基于COPD风险判断的被筛查患者AUC提升方法,其特征在于:所述步骤S1中的数据收集可以包括医学扫描仪被配置成扫描待测者的肺部,产生表示待测者肺部的图像数据;图像处理器被配置成利用机器学习模型、基于图像数据中表示的气道的分割和基于图像数据中表示的肺部的特征,从流动模型生成肺部中的COPD指示;该特征可以是疾病的纹理或基于成像的指示,显示器被配置成显示COPD指示。3.根据权利要求1所述的一种基于COPD风险判断的被筛查患者AUC提升方法,其特征在于:所述步骤S2中的对数据进行特征化的用于预测COPD急性加重的系统所使用的变量进一步包括社交数据和基于社交数据服务器提供的变量。4.根据权利要求3所述的一种基于COPD风险判断的被筛查患者AUC提升方法,其特征在于:所述社交数据是在与待测者的所述病历数据或所述临床方面数据相关联的变量被创建的特定时间点之前以及包括该特定时间点的预定时间段内收集的数据,并且由所述社交数据服务器提供的变量包括能够在搜索引擎和社交媒体的数据中发现的COPD相关术语的搜索频率...

【专利技术属性】
技术研发人员:宋思仪洪蕾张燕周一嘉周文博徐立文
申请(专利权)人:无锡启益医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1