【技术实现步骤摘要】
一种呼吸系统疾病门诊量预测方法
本专利技术涉及一种基于HoltWinters-XGBoost的呼吸系统疾病门诊量预测方法,属于时间序列预测领域。
技术介绍
呼吸系统疾病是我国最为常见的多发疾病,常年居我国总人口死亡病因首位。呼吸系统疾病种类多,病因复杂,通常受到大气污染、吸烟、工业粒化因子、生物因子吸入和感染以及年龄、个人体质等因素影响。常见的呼吸系统疾病如急性上呼吸道感染、流行性感冒和肺炎、慢性下呼吸道疾病,在人群中发病量大,且呈现出明显的季节周期性和时间趋势性。20世纪90年代以来,时间序列分析已经被广泛应用于呼吸系统疾病的短期发病规律研究。针对呼吸系统疾病门诊量进行智能预测,不仅能够辅助医院管理者及时、准确的了解医院的综合运营趋势,从而有的放矢的优化医务人员结构,分配医疗资源,实现医院精细化管理。当前,针对呼吸系统疾病的预测方法多集中于单模型预测,包括传统的时间序列模型(如ARIMA、SARIMA、HoltWinters等),机器学习模型(如决策树、GBDT、随机森林等),以及深度学习模型(如BP神经网络、深层信念网络、LSTM等)。然而,两者都有其各自的局限性,传统的时间序列模型通常以单指标形式建模,包含信息有限,无法刻画带漂移的节假日因素(如春节等),同时也无法加入天气和大气污染对就诊人数的影响;机器学习模型能够进行多指标建模,充分纳入一切可搜集的因素进行建模,然而当时间序列有单调趋势规律(不平稳)时,模型预测值范围只能局限在历史信息范围内,所以通常会出现预测值总是偏小或偏大的情况;深度学习模型不仅 ...
【技术保护点】
1.一种呼吸系统疾病门诊量预测方法,其特征在于,包括以下步骤:/n步骤1、进行数据信息采集,所采集到的数据至少包括门诊量数据;/n步骤2、对步骤1采集得到的数据进行数据预处理;/n步骤3、采用数据填补方法进行数据填补;/n步骤4、数据规律检验,包括以下内容:/n(1)白噪声检验:对门诊量数据进行Ljung-Box检验,得到检验p值,若检验p值小于预先设定的值,则通过检验,否则终止方法,返回数据为白噪声,无法建模;/n(2)周期性检验:设定周期参数k的取值区间,分别以不同取值下的k作为时间序列周期,对历史的门诊量数据进行标记周期次序;以周期次序数据作为分组因素,对门诊量数据进行单因素方差分析,计算显著性差异的检验指标,得到不同取值k下的检验指标p
【技术特征摘要】
1.一种呼吸系统疾病门诊量预测方法,其特征在于,包括以下步骤:
步骤1、进行数据信息采集,所采集到的数据至少包括门诊量数据;
步骤2、对步骤1采集得到的数据进行数据预处理;
步骤3、采用数据填补方法进行数据填补;
步骤4、数据规律检验,包括以下内容:
(1)白噪声检验:对门诊量数据进行Ljung-Box检验,得到检验p值,若检验p值小于预先设定的值,则通过检验,否则终止方法,返回数据为白噪声,无法建模;
(2)周期性检验:设定周期参数k的取值区间,分别以不同取值下的k作为时间序列周期,对历史的门诊量数据进行标记周期次序;以周期次序数据作为分组因素,对门诊量数据进行单因素方差分析,计算显著性差异的检验指标,得到不同取值k下的检验指标pk,取检验指标最小时的作为最终的周期参数;
步骤5、自变量筛选:将经过步骤3处理的门诊量数据、空气质量数据和天气数据包含的多个指标数据以时间进行关联,得到m个自变量指标数据,针对m个自变量指标,以1为步长分别构造t个滞后指标,分别计算门诊量数据指标与m×t个指标数据计算皮尔逊相关系数γi,i=1,2,...,m×t,设定相关系数阈值αγ,若皮尔逊相关系数γi<αγ,则剔除该指标;反之,则保留该指标作为建模自变量;
步骤6、模型建立和预测:建立HoltWinters-Xgboost混合预测模型,HoltWinters-Xgboost混合预测模型包含HoltWinters模块、Xgboost模块和混合预测模块,其中:
HoltWinters模块:构建HoltWinters加法预测模型,设定模型季节周期长度s=ko,HoltWinters加法预测模型输入数据为历史门诊量数据,即数据结构为q×1的矩阵,q为门诊量数据的样本量,通过模型学习,计算得到q个门诊量数据的拟合残差ei,i=1,2,3,...,q,以及未来p步预测值
Xgboo...
【专利技术属性】
技术研发人员:张敬谊,李静,卢鹏飞,施宇,韩涛,沈佳杰,李光亚,
申请(专利权)人:万达信息股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。