基于CT的慢性阻塞性肺预测模型的生成装置、方法和介质制造方法及图纸

技术编号:32506736 阅读:20 留言:0更新日期:2022-03-02 10:29
基于CT的慢性阻塞性肺预测模型的生成装置、方法和介质。本发明专利技术提供一种基于计算机断层成像(CT)的慢性阻塞性肺预测模型的生成装置、方法和介质。包括:数据获取单元,配置为CT成像系统获取用户的个人信息以及获取用户的胸部CT数据,并且从所述胸部CT数据提取与慢性阻塞性肺有关的CT特征数据,从而生成CT特征数据集;特征工程处理单元,配置为对所述CT特征数据集进行特征工程处理以生成扩展的CT特征数据集;变量筛选单元,配置为基于一个或多个筛选规则,从所述扩展的CT特征数据集中筛选出至少包括一个或多个CT特征数据的一个或多个CT特征数据子集,作为生成慢性阻塞性肺的预测模型的变量;以及模型生成单元,配置为使用所筛选的变量训练并生成慢性阻塞性肺的预测模型。型。型。

【技术实现步骤摘要】
基于CT的慢性阻塞性肺预测模型的生成装置、方法和介质


[0001]本申请涉及基于计算机断层成像(CT)系统的慢性阻塞性肺的预测模型生成装置、方法和计算机记录介质。

技术介绍

[0002]慢性阻塞性肺疾病(慢阻肺,COPD)是一种常见的、可预防、可治疗、以持续性呼吸系统症状和气流受限为特征的慢性呼吸系统疾病。通过肺功能检查判断气流受限(使用支扩剂后FEV1/FVC<0.7)是诊断慢阻肺的“金标准”。
[0003]我国慢阻肺患者基数大,且存在肺功能检测率低、慢阻肺诊断率低的问题。根据最新发表的流行病学调查结果,我国慢阻肺患者数预计高达9990万人,其中仅12.0%患者自述曾接受过肺功能检查,仅2.6%知晓自身疾病。这一现状与我国肺功能仪普及率以及肺功能检查本身局限性相关:1)基层医疗机构(1级和2级医院)肺功能仪配备率低(例如,在湖南省中,分别为1.6%和39%);2)肺功能检查对技师能力和患者配合度要求高,而慢阻肺患者年龄普遍偏大,导致检查结果质控难度大(仅50%质控A级3);3)肺功能检查经济效益一般。
[0004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于计算机断层成像(CT)系统的慢性阻塞性肺的预测模型生成装置,包括:数据获取单元,配置为CT成像系统获取用户的个人信息以及获取用户的胸部CT数据,并且从所述胸部CT数据提取与慢性阻塞性肺有关的CT特征数据,从而生成CT特征数据集;特征工程处理单元,配置为对所述CT特征数据集进行特征工程处理以生成扩展的CT特征数据集;变量筛选单元,配置为基于一个或多个筛选规则,从所述扩展的CT特征数据集中筛选出至少包括一个或多个CT特征数据的一个或多个CT特征数据子集,作为生成慢性阻塞性肺的预测模型的变量;以及模型生成单元,配置为使用所筛选的变量训练并生成慢性阻塞性肺的预测模型。2.如权利要求1所述的系统,其中,所述模型生成单元进一步配置为通过符合真实世界的数据评估训练的预测模型的模型检验指标是否满足预定标准,并且当所述预测模型满足预定标准时,输出训练的预测模型作为生成的预测模型。3.如权利要求2所述的系统,其中,所述模型检验指标包括以下的一种或多种:稳定性、准确性、敏感性、特异性、混淆矩阵、准确率、精确率、召回率、作为精确率和召回率的调和值的F1值、ROC曲线、AUC曲线。4.如权利要求2所述的系统,其中,所述模型生成单元进一步配置为当所述训练的预测模型不满足预定标准时,丢弃训练的预测模型,所述变量筛选单元进一步配置为响应训练的预测模型被丢弃,重新筛选另一CT特征数据子集,作为生成慢性阻塞性肺的预测模型的变量,以及所述模型生成单元使用重新筛选的另一CT特征数据子集作为变量,训练并生成慢性阻塞性肺的预测模型。5.如权利要求1所述的系统,其中,所述用户的个人信息至少包括年龄、性别、身高、体重、吸烟史、粉尘相关工作中的一项或多项。6.如权利要求1所述的系统,还包括探索性数据分析单元,配置为根据一个或多个参数对所述CT特征数据集进行数据分析,从而对所述数据获取单元获取的数据执行数据清洗操作。7.如权利要求6所述的系统,其中,所述探索性数据分析单元配置为执行以下的一项或多项数据分析:探索数据分布以确定数据是否存在偏差,分析数据的缺失率以确定是否删除数据或填充数据,分析数据中是否有重复的记录,并删除重复记录,分析数据中是否存在单一值,并删除单一值。8.如权利要求1所述的系统,其中,所述CT特征数据集至少包括以下CT定量数据的一种或多种:指示平均CT值的数据,包括分别计算全肺以及各肺区或肺叶的平均CT值,指示肺气肿体积比的数据,其包括在预定HU区间内,以预定HU步长分别计算的在不同HU的肺气肿定义下、全肺以及各肺区或肺叶的的肺气肿区域的体积以及占比,指示气道形态的数据,包括分别计算第一范围级别气道的平均、最大、有效管壁厚度,平均、最大、有效管腔内径,管壁截面积,管腔截面积,
指示气道数量的数据,包括分别计算全肺以及各肺区/肺叶的单位肺体积下包含的第一范围级别级气道数,所述扩展的CT特征数据集至少包括以下数据的一种或多种:在所述CT值之间执行预定处理获得的处理后的值,在所述肺气肿区域的体积之间以及占比之间执行预定处理获得的处理后的值,对不同级别气道的上述气道形态的参数之间执行预定处理获得的处理后的值,对不同级别气道的上述气道数量的参数之间执行预定处理获得的处理后的值。9.如权利要求1所述的系统,其中所述变量筛选单元基于以下的一个或多个进行特征筛选:基于缺失率进行特征筛选以去除高缺失率特征,基于指示标准差与平均值之比的变异系数进行特征筛选,基于稳定性进行特征筛选以去除超过预定阈值的特征,基于指示变量和目标值之间的相关关系的信息值进行特征筛选,基于XGBOOST模型的变量重要性进行特征筛选,基于变量聚类进行特征筛选,基于单个变量的线性相关性...

【专利技术属性】
技术研发人员:王旻骏陈烜王浩宇胡智臻符莹莹
申请(专利权)人:阿斯利康投资中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1