一种基于肺活量数据的疾病预测模型的构建方法及系统技术方案

技术编号:26691911 阅读:40 留言:0更新日期:2020-12-12 02:45
本发明专利技术涉及一种基于肺活量数据的疾病预测模型的构建方法及系统,其方法包括如下步骤:获取包括患病人群的肺活量数据、健康人群的肺活量数据,将其作为第一样本集;根据肺活量数据异常所对应的疾病知识库对所述第一样本集进行数据清洗和标准化,构成第二样本集;将所述第二样本集划分为训练集、验证集,然后将所述训练集作为KNN分类器的输入;训练所述KNN分类器,直至该分类器的质心不再改变,得到预测模型。本发明专利技术一方面能应用于普通人群的肺功能相关的疾病预测和自我筛查,大大减小了医院检查的压力。另一方面利用机器学习中的KNN算法,将与肺活量相关的数据进行聚类和归一化,极大提高了预测的准确率和检测速度,具有科学依据。

【技术实现步骤摘要】
一种基于肺活量数据的疾病预测模型的构建方法及系统
本专利技术涉及智能医疗以及医疗信息
,涉及一种疾病预测模型的构建方法及系统,尤其涉及一种基于肺活量数据的疾病预测模型的构建方法及系统。
技术介绍
肺活量(VitalCapacity,VC)是指一次尽力吸气后,再尽力呼出的气体总量。肺活量在一定意义上可反映呼吸机能的潜在能力。成年男子肺活量约为3500毫升,女子约为2500毫升。壮年人的肺活量最大,幼年和老年人较小。健康状况愈好的人肺活量愈大,肺组织损害如肺结核、肺纤维化、肺不张或肺叶切除达一定程度时都可能使肺活量减小;脊柱后凸,胸膜增厚,渗出性胸膜炎或气胸等,也可使肺扩张受限,肺活量减小。因此,肺活量明显减小是限制性通气障碍的表现。由于肺活量的测定方法简单,重复性较好,故是健康检查常用的指标。目前暂未出现基于肺活量数据的疾病预测评估模型,为普通人群提供一种操作简单、易于执行的与肺功能疾病预测预防或自我筛查的方法。
技术实现思路
本专利技术针对现有技术中存在的技术问题,提出了一种基于肺活量数据的疾病预测评估模型,本本文档来自技高网...

【技术保护点】
1.一种基于肺活量数据的疾病预测模型的构建方法,其特征在于,包括如下步骤:/n获取包括患病人群的肺活量数据、健康人群的肺活量数据,将其作为第一样本集;/n根据肺活量数据异常所对应的疾病知识库对所述第一样本集进行数据清洗和标准化,构成第二样本集;/n将所述第二样本集划分为训练集、验证集,然后将所述训练集作为KNN分类器的输入;/n训练所述KNN分类器,直至该分类器的质心不再改变,得到预测模型。/n

【技术特征摘要】
1.一种基于肺活量数据的疾病预测模型的构建方法,其特征在于,包括如下步骤:
获取包括患病人群的肺活量数据、健康人群的肺活量数据,将其作为第一样本集;
根据肺活量数据异常所对应的疾病知识库对所述第一样本集进行数据清洗和标准化,构成第二样本集;
将所述第二样本集划分为训练集、验证集,然后将所述训练集作为KNN分类器的输入;
训练所述KNN分类器,直至该分类器的质心不再改变,得到预测模型。


2.根据权利要求1所述的基于肺活量数据的疾病预测模型的构建方法,其特征在于,所述根据肺活量数据异常所对应的疾病知识库对所述第一样本集进行数据清洗和标准化包括如下步骤:
根据所述疾病知识库中的人群、性别、年龄所确定的健康肺活量数据范围剔除第一样本集中的健康人群中肺活量数据异常的样本以及患病人群中肺活量数据正常的样本;
对经过数据清洗的的第一样本集中的肺活量数据根据不同人群的性别、年龄进行归一化。


3.根据权利要求2所述的基于肺活量数据的疾病预测模型的构建方法,其特征在于,还包括将所述第一样本集中的健康人群中肺活量数据异常的样本以及患病人群中肺活量数据正常的样本作为验证集对所述预测模型进行验证。


4.根据权利要求2所述的基于肺活量数据的疾病预测模型的构建方法,其特征在于,所述对经过数据清洗的的第一样本集中的肺活量数据不同人群、性别、年龄进行归一化包括如下步骤:
若样本人群的年龄低于20时,则按性别逐年对经过数据清洗的的第一样本集中的肺活量数据进行归一化;
若样本人群的年龄高于20时,则按性别对经过数据清洗的的第一样本集中的肺活量数据归一化。

【专利技术属性】
技术研发人员:杜乐杜登斌
申请(专利权)人:吾征智能技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1