一种基于COPD筛查用机器学习引导的EQ问卷赋分方法技术

技术编号:33249109 阅读:15 留言:0更新日期:2022-04-27 18:07
本发明专利技术公开了一种基于COPD筛查用机器学习引导的EQ问卷赋分方法,包括如下步骤:S1、数据收集,根据临床研究标准步骤,进行数据收集,对受试者先进行基本信息收集和问卷填写,然后通过肺功能测试判断其COPD是否阳性,将数据进行收集与特征化;S2、排序,采用step

【技术实现步骤摘要】
一种基于COPD筛查用机器学习引导的EQ问卷赋分方法


[0001]本专利技术涉及COPD筛查
,具体涉及一种基于COPD筛查用机器学习引导的EQ问卷赋分方法。

技术介绍

[0002]COPD是一种由于气流不畅所致的阻塞性肺部疾病。COPD的两个主要潜在原因是肺气肿和气道疾病(例如,支气管炎)。COPD可以基于初步问卷进行诊断,并且如果根据问卷结果显得必要,则然后在吸入药物和没有吸入药物这两种情况下都进行呼吸测量(肺活量测定)。问卷信息覆盖广泛的信息,包括家族史、症状和习惯(例如,吸烟)史、疾病史和相应的严重程度(例如,哮喘、癌症等)、活动水平以及一般健康度量。肺活量测定测试的主要输出是1秒钟用力呼气值(FEV1)和用力肺活量(FVC)。将这些值基于人口分布进行标准化。
[0003]COPD筛查问卷(PS问卷)在临床使用中,一般是根据患者选择的选项对应的分数,进行加和,对总分按照一个阈值来判断被筛查患者是否有COPD风险。这些选项的分值是通过专家讨论得到的,其在特定人群不一定具有最佳的筛查表现,专家通过人工定义的分数,并不一定具有最优的筛查标签,并没有对其进行赋分,准确性难以评判。

技术实现思路

[0004]本专利技术的目的在于提供一种基于COPD筛查用机器学习引导的EQ问卷赋分方法,问题简单,清晰,具体,公正,易于理解,快速、准确地鉴别受试者是否为肺部良性疾病患者,以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:
[0006]一种基于COPD筛查用机器学习引导的EQ问卷赋分方法,包括如下步骤:
[0007]S1、数据收集,根据临床研究标准步骤,进行数据收集,每个受试者先进行基本信息收集和问卷填写,然后通过肺功能测试判断其COPD是否阳性,将数据进行收集与特征化;
[0008]S2、排序,采用step

wise混合策略对上述特征化的数据进行排序;
[0009]S3、建模,用多个自变量通过xgboost、lightgbm、catboost、logistic模型,对因变量y进行拟合,得到重要性排名;
[0010]S4、赋分,步骤S1中得到的自变量设定为m,对所对应的题目进行分数搜索,依据步骤S2中得到的排序选项的最佳赋分组合,更新EQ问卷目前的赋分方案。
[0011]其中,所述步骤S1中的得到的自变量m所对应的题目进行分数搜索,(其中包括还没有进行赋分搜索的题目,采用医生人工给定的分数)赋分搜索步骤为:每个选项可能的分值为[0,0.5,1,1.5,2.0,2.5],且多个选项限定医学上更严重的选项分数更高,所得到的穷举的组合数大于是1k左右。
[0012]其中,所述步骤S2中的step

wise混合策略;假设有K个自变量,for i in K,

,1:
[0013]用i个自变量,通过xgboost,lightgbm,catboost,logistic模型,对因变量y进行拟合,每个模型下,得到i个自变量的重要性排名;i个自变量通过统计学的显著性检验,得
到显著性排序。
[0014]其中,所述建模包括至少一个数据处理单元;以及,与所述至少一个数据处理单元通信连接的数据存储单元;其中,所述数据存储单元存储有可被所述至少一个数据处理单元执行的指令,所述指令被所述至少一个数据处理单元执行,以使所述至少一个数据处理单元能够执行前述的一种控制受试者常处环境布局及空气质量的仿真设计方法。
[0015]其中,将受试者的各项赋分数据值标定在各条半径上,将相邻点连成不规则的多边形,成为最终的观察实测图,所述实测图的面积与初始数据参照图,所述初始数据参照图建立于筛查初期的数据存储单元,并做如下分档:
[0016]实测图的面积与初始数据参照图的面积之差小于初始数据参照图面积15

25%;
[0017]实测图的面积与初始数据参照图的面积之差大于于初始数据参照图面积15

25%;
[0018]实测图的面积与初始数据参照图的面积之差大于30%以上;
[0019]实测图的面积与初始数据参照图的面积之差在10%以内者;
[0020]被测者的实测图大多数为不规则多边形,其中向内凹进之项表示为功能减退,向外凸出。
[0021]其中,所述步骤S3中的数据建模还包括:从第一成像数据分割肺部的气道,和/或实行针对气道的计算流动动力学;针对气流的值可以是应力、压力、速度或体积值。在其它实施例中,该建模是利用三维模型对气道的第一部分的建模,以及是利用降阶模型对气道的第二部分的建模;第二部分具有与第一部分的气道相比具有更小直径的气道。
[0022]其中,所述受试者的基础特征信息包括性别信息、年龄信息、工作环境信息,所述受试者的基础特征信息的目标点偏好由正态分布生成获得,或者是根据事先做的问卷调查的记录结果获得。
[0023]其中,所述EQ问卷选择覆盖最大权重关键的最小集合,一个独立的问题集是一组设有两个节点相邻的问题,其涵盖的问题中包含的话题,其关键短语的权重之和被定义为,a(q,k)表示问题q包含关键短语k:
[0024]wo(S)=∑q∈S,a(q,k)w(k)o,
[0025]其中a即代表所述EQ问卷的问题中包含的话题。
[0026]其中,S是覆盖最大权重关键短语的最小独立问题集合,当且仅当:
[0027]①
S是独立的问题集合;
[0028]②
不存在独立的集合S'使得Wo(S')>Wo(S);
[0029]③
不存在独立的集合S',其中Wo(S')=Wo(S),而|S'|>|S。
[0030]综上所述,由于采用了上述技术,本专利技术的有益效果是:
[0031]本专利技术中,根据临床研究标准步骤,进行数据收集,对每个受试者先进行基本信息收集和问卷填写,作为初始筛查数据并通过数据存储单元进行存储,便于后期与问卷阙值进行自动对比,肺功能测试后通过xgboost、lightgbm、catboost、logistic模型,对因变量y进行拟合,判断其COPD是否阳性,将数据进行收集与特征化,极大程度的提升筛查的准确性。
附图说明
[0032]图1为本专利技术一种基于COPD筛查用机器学习引导的EQ问卷赋分方法的流程图。
具体实施方式
[0033]为使本专利技术实施方式的目的、技术方案和优点更加清楚,下面将结合本专利技术实施方式中的附图,对本专利技术实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本专利技术一部分实施方式,而不是全部的实施方式。基于本专利技术中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本专利技术保护的范围。因此,以下对在附图中提供的本专利技术的实施方式的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施方式。基于本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于COPD筛查用机器学习引导的EQ问卷赋分方法,其特征在于,包括如下步骤:S1、数据收集,根据临床研究标准步骤,进行数据收集,每个受试者先进行基本信息收集和问卷填写,然后通过肺功能测试判断其COPD是否阳性,将数据进行收集与特征化;S2、排序,采用step

wise混合策略对上述特征化的数据进行排序;S3、建模,用多个自变量通过xgboost、lightgbm、catboost、logistic模型,对因变量y进行拟合,得到重要性排名;S4、赋分,步骤S1中得到的自变量设定为m,对所对应的题目进行分数搜索,依据步骤S2中得到的排序选项的最佳赋分组合,更新EQ问卷目前的赋分方案。2.根据权利要求1所述的一种基于COPD筛查用机器学习引导的EQ问卷赋分方法,其特征在于:所述步骤S1中的得到的自变量m所对应的题目进行分数搜索,(其中包括还没有进行赋分搜索的题目,采用医生人工给定的分数)赋分搜索步骤为:每个选项可能的分值为[0,0.5,1,1.5,2.0,2.5],且多个选项限定医学上更严重的选项分数更高,所得到的穷举的组合数大于是1k左右。3.根据权利要求1所述的一种基于COPD筛查用机器学习引导的EQ问卷赋分方法,其特征在于:所述步骤S2中的step

wise混合策略;假设有K个自变量,for i in K,

,1:用i个自变量,通过xgboost,lightgbm,catboost,logistic模型,对因变量y进行拟合,每个模型下,得到i个自变量的重要性排名;i个自变量通过统计学的显著性检验,得到显著性排序。4.根据权利要求1所述的一种基于COPD筛查用机器学习引导的EQ问卷赋分方法,其特征在于:所述建模包括至少一个数据处理单元;以及,与所述至少一个数据处理单元通信连接的数据存储单元;其中,所述数据存储单元存储有可被所述至少一个数据处理单元执行的指令,所述指令被所述至少一个数据处理单元执行,以使所述至少一个数据处理单元能够执行前述的一种控制受试者常处环境布局及空气质量的仿真设计方法。5.根据权利要求4所述的一种基于COPD筛查用机器学习引导的EQ问卷赋分方法,其特征在于:将受试者的各项赋分数据值标定在各条半径上,...

【专利技术属性】
技术研发人员:宋思仪洪蕾张燕周一嘉周文博徐立文
申请(专利权)人:无锡启益医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1