当前位置: 首页 > 专利查询>郑州大学专利>正文

一种基于GAM的心脑血管疾病门诊量评价系统及其使用方法技术方案

技术编号:29160141 阅读:11 留言:0更新日期:2021-07-06 23:00
本发明专利技术将空气污染物和心脑血管疾病门诊量联系起来,通过建立单污染物模型和双污染物模型,研究长时间序列下空气污染物在一周滞后期内对心脑血管疾病门诊量的影响,不仅可揭示一周内每天各空气污染物对心脑血管疾病门诊量的影响,还能得到不同污染物组合对心脑血管疾病门诊量的影响。本发明专利技术可应用到公共卫生部门制定心脑血管疾病的预防措施制定工作中去。

【技术实现步骤摘要】
一种基于GAM的心脑血管疾病门诊量评价系统及其使用方法
本专利技术属于环境学与疾病学交叉的
,具体涉及一种基于GAM的心脑血管疾病门诊量评价系统及其使用方法。
技术介绍
心脑血管疾病是心血管疾病和脑血管疾病的总称,心脑血管疾病以其“发病率高、致残率高、死亡率高、复发率高,并发症多”等特点,导致心脑血管疾病的医疗成本很高,严重地影响着居民的生活质量及国民经济的发展,同时也加剧了医疗资源分配的紧张。影响心血管及脑血管疾病的因素主要包括生物风险因素(血脂、血压、血糖、肥胖)、生活方式风险因素(吸烟、酒精、饮食、体力活动)、环境风险因素(气象、大气污染和室内空气污染)。在众多影响因素中,只有环境风险因素可以通过制定相关公共政策和规划进行一定程度的改善。因此,如何深入评估大气污染对心脑血管疾病的影响,并得到有效的控制决策和个人防护建议已经受到了世界各地相关学者的广泛关注。GAM(GeneralizedAdditiveModel,广义相加模型):广义线性模型是传统线性回归模型的扩展,是一种自由灵活的统计模型。GAM采用模型中的每个预测变量并将其分成多个部分,然后通过光滑样条函数、核函数或者局部回归光滑函数,将多项式函数分别拟合到每个部分来探测变量之间的非线性回归关系。GAM模型中部分或全部的自变量采用平滑函数,降低线性设定带来的模型风险,并且克服了logistic回归中当解释变量个数较多时容易引起维度灾难的缺点。在保证残差最小化(即最高拟合优度)的同时,还保证模型的最大化简约性(即最低可能自由度)。目前用于评估空气污染物和心脑血管疾病之间关系的模型中,GAM模型是最受欢迎和认可的一种模型。大气污染对人类健康的危害是不可否认的,目前很多证据表明空气污染物浓度升高会提高人类患病的可能性。“门诊量”是空气污染导致健康结局最为敏感的指标,而GAM模型是评估和预测空气污染与心脑血管等疾病相关关系的最优模型,模型结果不仅可得到各污染物浓度升高单位浓度后,心脑血管疾病门诊量增加的风险值和滞后效应值,还可以根据污染物浓度值预测相应的心脑血管疾病门诊量。每日心脑血管疾病门诊人数统计分布近似服从泊松分布,因此可选用半参数广义相加模型(GAM)评估PM2.5,PM10,NO2,SO2,O3,CO对血脑血管疾病门诊量的影响。评估结果可为阐明各污染物的健康危害特征提供一定参考,为相关部门制定相关防治策略提供科学依据。
技术实现思路
针对以上问题,本专利技术的目的是将空气污染物和心脑血管疾病门诊量同时加入GAM模型,提供一种基于GAM的心脑血管疾病门诊量评价系统及其使用方法。本专利技术的目的是这样实现的:一包括心脑血管疾病数据收集与处理模块、大气污染物和混杂变量的获取和处理模块、数据相关性分析模块、混杂变量的自由度确定模块、单污染物一周内的滞后效应输出模块、模型敏感性检验模块、双污染物模型结果输出模块、风险评估模块和针对性防控措施制定模块;通过收集并处理心脑血管疾病门诊数据做为模型自变量,收集处理大气污染物数据和混杂变量数据作为模型的因变量和混杂变量,通过数据相关性分析和确定混杂变量自由度来确保模型稳定性,然后建立单污染物模型,在单污染物模型和模型敏感性分析的基础上建立双污染物模型,之后根据单双污染物模型结果评估各污染物单独和两两组合后对心脑血管疾病门诊量的影响,最后根据评估结果,提出针对心脑血管疾病患者的有效防护建议;心脑血管疾病数据收集与处理模块:按照国际疾病分类(InternationalClassificationofDseases,ICD)第十次修订本分类方法,从医院门诊就诊系统中筛选出心血管(ICD-10分类编号为I21-I22,I46)和脑血管(ICD-10分类编号为I61-I65)心脑血管疾病就诊数据。之后将筛选和分类后的心脑血管疾病就诊数据进行脱敏处理,分别删去患者姓名、相关证件号码和居住地址等敏感信息。最后将筛选、分类和脱敏处理后的心脑血管疾病数据导入Excel表格中,汇总统计每日的心脑血管疾病门诊量;大气污染物和混杂变量的获取和处理模块:通过查阅文献,根据相关文献中数据来源,下载并处理PM2.5(μg·m-3),PM10(μg·m-3),SO2(μg·m-3),NO2(μg·m-3),CO(mg·m-3),O3(μg·m-3)日均浓度数据(数据获取网址:https://www.aqistudy.cn/historydata/),同时获取并处理对应的混杂变量:日均气象数据(气象数据包括日最高温(℃)、日最低温(℃)、日均温度(℃)、日均风速(m·s-1)、日均大气压强(hpa)、日均相对湿度和日均降水量(mm),数据获取网址:http://data.cma.cn/)、时间长期趋势(Time)、星期几效应值(DOW)和假期效应值(Holiday)。数据相关性分析模块:分析心脑血管疾病日门诊量与当日污染物浓度、气象数据的相关性:将研究日期内每天的疾病门诊量和污染物、气象因子数据导入IBSSPSSStatistics22进行相关性分析,得到各因子及其与心脑血管疾病门诊量之间的相关性,筛选出与心脑血管疾病门诊量之间存在显著相关性的气象因子。显著性检验水平为a=0.05。Spearman系相关系数显著高于0.7的两种污染物之间存在高度相关性,同时加入模型可能会造成严重共线性问题;混杂变量的自由度确定模块:通过确定合适的自由度可以保证模型的稳定性,因此在模型中引入各混杂变量时,首先要确定各因子在模型中的自由度。可通过改变不同的自由度后,计算不同自由度下模型的赤池信息量(AIC值),根据赤池信息量(AIC)最小原则各气象因子和时间长期趋势的自由度;单污染物一周内的滞后效应输出模块:单污染物模型是把PM2.5,PM10,SO2,NO2,CO,O3分别引入已经确定了各混杂因子自由度的广义相加模型中,记录并分析各个污染物在一周内的单日滞后和累计滞后结果;模型敏感性检验模块:由于污染物之间可能存在高度相关性,因此同时引入相关性较高的污染物在双污染物模型中时,可能会引起模型的严重共线性问题,从而影响实验结果的可靠性。模型中各污染物的方差膨胀系数(varianceinflationfactor,VIF)可以作为衡量双污染物模型中多重共线性严重程度的有效指标。为保证模型稳定性,VIF值大于或等于10时说明模型可能存在严重多重共线性;双污染物模型结果输出模块:双污染物模型是根据敏感性分析和单污染物模型结果,在最佳滞后期分别引入另一种污染物分别引入另一种污染物。之后记录并分析双污染物模型结果;风险评估模块:根据单污染物模型和双污染物模型的结果,分别计算单污染物模型和双污染物模型中各污染物浓度升高10μg/m3后心脑血管疾病门诊量增加的超额危险度(ExcessRisk,ER)及其95%置信区间(ConfidenceInterval,CI),其中ER值作为污染物对心脑血管疾病门诊量风险的量化指标,95%CI可揭示该风险是否具有显著意义,以此评价各污染物对心脑血管疾病门诊量的影响,选择ER值最高并且95%置信区间本文档来自技高网
...

【技术保护点】
1.一种基于GAM的心脑血管疾病门诊量评价系统,其特征在于:包括心脑血管疾病数据收集与处理模块、大气污染物和混杂变量的获取和处理模块、数据相关性分析模块、混杂变量的自由度确定模块、单污染物一周内的滞后效应输出模块、模型敏感性检验模块、双污染物模型结果输出模块、风险评估模块和针对性防控措施制定模块;通过收集并处理心脑血管疾病门诊数据做为模型自变量,收集处理大气污染物数据和混杂变量数据作为模型的因变量和混杂变量,通过数据相关性分析和确定混杂变量自由度来确保模型稳定性,然后建立单污染物模型,在单污染物模型和模型敏感性分析的基础上建立双污染物模型,之后根据单双污染物模型结果评估各污染物单独和两两组合后对心脑血管疾病门诊量的影响,最后根据评估结果,提出针对心脑血管疾病患者的有效防护建议,其中:/n心脑血管疾病数据收集与处理模块:从医院门诊就诊系统中获取心脑血管疾病数据,导出数据后对数据进行筛选、分类和脱敏处理;/n大气污染物和混杂变量的获取和处理模块:通过查阅文献,根据相关文献中数据来源,下载并处理大气污染物(PM

【技术特征摘要】
1.一种基于GAM的心脑血管疾病门诊量评价系统,其特征在于:包括心脑血管疾病数据收集与处理模块、大气污染物和混杂变量的获取和处理模块、数据相关性分析模块、混杂变量的自由度确定模块、单污染物一周内的滞后效应输出模块、模型敏感性检验模块、双污染物模型结果输出模块、风险评估模块和针对性防控措施制定模块;通过收集并处理心脑血管疾病门诊数据做为模型自变量,收集处理大气污染物数据和混杂变量数据作为模型的因变量和混杂变量,通过数据相关性分析和确定混杂变量自由度来确保模型稳定性,然后建立单污染物模型,在单污染物模型和模型敏感性分析的基础上建立双污染物模型,之后根据单双污染物模型结果评估各污染物单独和两两组合后对心脑血管疾病门诊量的影响,最后根据评估结果,提出针对心脑血管疾病患者的有效防护建议,其中:
心脑血管疾病数据收集与处理模块:从医院门诊就诊系统中获取心脑血管疾病数据,导出数据后对数据进行筛选、分类和脱敏处理;
大气污染物和混杂变量的获取和处理模块:通过查阅文献,根据相关文献中数据来源,下载并处理大气污染物(PM2.5,PM10,SO2,NO2,CO,O3)日均浓度数据,同时获取并处理对应的混杂变量:日均气象数据、时间长期趋势(Time)、星期几效应值(DOW)和假期效应值(Holiday);最后分别计算得到各影响变量一周内的单日滞后和累计滞后数据;
数据相关性分析模块:通过“Spearman”相关系数确定各影响因子及其与血脑血管疾病门诊量之间的相关性;根据相关性结果确定各因子之间是否存在显著相关关系;相关系数高于0.7的因子之间存在高度相关性,同时加入模型可能会造成严重共线性问题;
混杂变量的自由度确定模块:利用处理后的数据建立广义相加时,根据赤池信息量(AIC)最小原则控制各气象因子和时间长期趋势的自由度,以确保模型可靠性;
单污染物一周内的滞后效应输出模块:在确定了各混杂因子的模型参数后,将各污染物以及一周内的单日滞后和累计滞后数据分别引入广义相加模型,记录并分析模型结果;
模型敏感性检验模块:把所有污染物同时引入模型中,通过模型结果中各污染物的方差膨胀系数(varianceinflationfactor,VIF)来衡量多元线性回归模型中多重共线性严重程度,VIF大于10说明模型存在严重多重共线性;
双污染物模型结果输出模块:根据单污染物模型和敏感性分析结果,保证模型不存在多重共线性问题后,在最佳滞后期分别引入另一种污染物;最后记录并分析模型结果;
风险评估模块:根据记录的模型回归系数和模型标准差,分别计算一周滞后期内单污染物模型和最佳滞后期下双污染物模型中各污染物浓度升高10μg/m3后心脑血管疾病门诊量增加的超额危险度(ExcessRisk,ER)及其95%置信区间(ConfidenceInterval,CI),将ER值作为污染物对心脑血管疾病门诊量风险的量化指标,评价各污染物一周滞后期内对心脑血管疾病门诊量的影响;
针对性防控措施制定模块:根据单污染物模型和双污染物模型评估结果,提出针对心脑血管疾病患者的有效的个人防护建议。


2.一种如权利要求1所述的基于GAM的心脑血管疾病门诊量评价系统的使用方法,其特征在于:包括以下步骤:步骤1:采集心脑血管疾病数据:按照国际疾病分类(InternationalClassificationofDseases,ICD)第十次修订本分类方法,从医院门诊就诊系统中筛选出心血管(ICD-10分类编号为I21-I22,I46)和脑血管(ICD...

【专利技术属性】
技术研发人员:郭恒亮王孟飞龚喜云魏海涛
申请(专利权)人:郑州大学
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1