【技术实现步骤摘要】
一种基于GAM的心脑血管疾病门诊量评价系统及其使用方法
本专利技术属于环境学与疾病学交叉的
,具体涉及一种基于GAM的心脑血管疾病门诊量评价系统及其使用方法。
技术介绍
心脑血管疾病是心血管疾病和脑血管疾病的总称,心脑血管疾病以其“发病率高、致残率高、死亡率高、复发率高,并发症多”等特点,导致心脑血管疾病的医疗成本很高,严重地影响着居民的生活质量及国民经济的发展,同时也加剧了医疗资源分配的紧张。影响心血管及脑血管疾病的因素主要包括生物风险因素(血脂、血压、血糖、肥胖)、生活方式风险因素(吸烟、酒精、饮食、体力活动)、环境风险因素(气象、大气污染和室内空气污染)。在众多影响因素中,只有环境风险因素可以通过制定相关公共政策和规划进行一定程度的改善。因此,如何深入评估大气污染对心脑血管疾病的影响,并得到有效的控制决策和个人防护建议已经受到了世界各地相关学者的广泛关注。GAM(GeneralizedAdditiveModel,广义相加模型):广义线性模型是传统线性回归模型的扩展,是一种自由灵活的统计模型。GAM采用模型中的每个预测变量并将其分成多个部分,然后通过光滑样条函数、核函数或者局部回归光滑函数,将多项式函数分别拟合到每个部分来探测变量之间的非线性回归关系。GAM模型中部分或全部的自变量采用平滑函数,降低线性设定带来的模型风险,并且克服了logistic回归中当解释变量个数较多时容易引起维度灾难的缺点。在保证残差最小化(即最高拟合优度)的同时,还保证模型的最大化简约性(即最低可能自由度)。目前用于评估空气 ...
【技术保护点】
1.一种基于GAM的心脑血管疾病门诊量评价系统,其特征在于:包括心脑血管疾病数据收集与处理模块、大气污染物和混杂变量的获取和处理模块、数据相关性分析模块、混杂变量的自由度确定模块、单污染物一周内的滞后效应输出模块、模型敏感性检验模块、双污染物模型结果输出模块、风险评估模块和针对性防控措施制定模块;通过收集并处理心脑血管疾病门诊数据做为模型自变量,收集处理大气污染物数据和混杂变量数据作为模型的因变量和混杂变量,通过数据相关性分析和确定混杂变量自由度来确保模型稳定性,然后建立单污染物模型,在单污染物模型和模型敏感性分析的基础上建立双污染物模型,之后根据单双污染物模型结果评估各污染物单独和两两组合后对心脑血管疾病门诊量的影响,最后根据评估结果,提出针对心脑血管疾病患者的有效防护建议,其中:/n心脑血管疾病数据收集与处理模块:从医院门诊就诊系统中获取心脑血管疾病数据,导出数据后对数据进行筛选、分类和脱敏处理;/n大气污染物和混杂变量的获取和处理模块:通过查阅文献,根据相关文献中数据来源,下载并处理大气污染物(PM
【技术特征摘要】
1.一种基于GAM的心脑血管疾病门诊量评价系统,其特征在于:包括心脑血管疾病数据收集与处理模块、大气污染物和混杂变量的获取和处理模块、数据相关性分析模块、混杂变量的自由度确定模块、单污染物一周内的滞后效应输出模块、模型敏感性检验模块、双污染物模型结果输出模块、风险评估模块和针对性防控措施制定模块;通过收集并处理心脑血管疾病门诊数据做为模型自变量,收集处理大气污染物数据和混杂变量数据作为模型的因变量和混杂变量,通过数据相关性分析和确定混杂变量自由度来确保模型稳定性,然后建立单污染物模型,在单污染物模型和模型敏感性分析的基础上建立双污染物模型,之后根据单双污染物模型结果评估各污染物单独和两两组合后对心脑血管疾病门诊量的影响,最后根据评估结果,提出针对心脑血管疾病患者的有效防护建议,其中:
心脑血管疾病数据收集与处理模块:从医院门诊就诊系统中获取心脑血管疾病数据,导出数据后对数据进行筛选、分类和脱敏处理;
大气污染物和混杂变量的获取和处理模块:通过查阅文献,根据相关文献中数据来源,下载并处理大气污染物(PM2.5,PM10,SO2,NO2,CO,O3)日均浓度数据,同时获取并处理对应的混杂变量:日均气象数据、时间长期趋势(Time)、星期几效应值(DOW)和假期效应值(Holiday);最后分别计算得到各影响变量一周内的单日滞后和累计滞后数据;
数据相关性分析模块:通过“Spearman”相关系数确定各影响因子及其与血脑血管疾病门诊量之间的相关性;根据相关性结果确定各因子之间是否存在显著相关关系;相关系数高于0.7的因子之间存在高度相关性,同时加入模型可能会造成严重共线性问题;
混杂变量的自由度确定模块:利用处理后的数据建立广义相加时,根据赤池信息量(AIC)最小原则控制各气象因子和时间长期趋势的自由度,以确保模型可靠性;
单污染物一周内的滞后效应输出模块:在确定了各混杂因子的模型参数后,将各污染物以及一周内的单日滞后和累计滞后数据分别引入广义相加模型,记录并分析模型结果;
模型敏感性检验模块:把所有污染物同时引入模型中,通过模型结果中各污染物的方差膨胀系数(varianceinflationfactor,VIF)来衡量多元线性回归模型中多重共线性严重程度,VIF大于10说明模型存在严重多重共线性;
双污染物模型结果输出模块:根据单污染物模型和敏感性分析结果,保证模型不存在多重共线性问题后,在最佳滞后期分别引入另一种污染物;最后记录并分析模型结果;
风险评估模块:根据记录的模型回归系数和模型标准差,分别计算一周滞后期内单污染物模型和最佳滞后期下双污染物模型中各污染物浓度升高10μg/m3后心脑血管疾病门诊量增加的超额危险度(ExcessRisk,ER)及其95%置信区间(ConfidenceInterval,CI),将ER值作为污染物对心脑血管疾病门诊量风险的量化指标,评价各污染物一周滞后期内对心脑血管疾病门诊量的影响;
针对性防控措施制定模块:根据单污染物模型和双污染物模型评估结果,提出针对心脑血管疾病患者的有效的个人防护建议。
2.一种如权利要求1所述的基于GAM的心脑血管疾病门诊量评价系统的使用方法,其特征在于:包括以下步骤:步骤1:采集心脑血管疾病数据:按照国际疾病分类(InternationalClassificationofDseases,ICD)第十次修订本分类方法,从医院门诊就诊系统中筛选出心血管(ICD-10分类编号为I21-I22,I46)和脑血管(ICD...
【专利技术属性】
技术研发人员:郭恒亮,王孟飞,龚喜云,魏海涛,
申请(专利权)人:郑州大学,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。