当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于Prophet-ARMA的医院门诊就诊量预测方法技术

技术编号:19779255 阅读:16 留言:0更新日期:2018-12-15 11:38
本发明专利技术公开了一种基于Prophet‑ARMA的医院门诊就诊量预测方法,包括步骤1:获取与待测时段相邻的历史时段的门诊数据并生成每类门诊的门诊数据集;步骤2:将每个门诊数据集分别输入每类门诊的Prophet模型得到第一预测数据和拟合数据;步骤3:计算每类门诊的残差序列;步骤4:分别判断每类门诊的残差序列是否为纯随机序列,若不是,将残差序列输入对应ARMA模型得到第二预测数据,再执行步骤5;若是执行步骤6;步骤5:分别将同一类门诊的第一预测数据、第二预测数据相加得到待测时段的就诊量预测值;步骤6:将第一预测数据作为待测时段的就诊量预测值。本发明专利技术通过将Prophet和ARMA相结合来提高就诊量预测精度。

【技术实现步骤摘要】
一种基于Prophet-ARMA的医院门诊就诊量预测方法
本专利技术属于数值建模预测领域,具体涉及一种Prophet-ARMA的医院门诊就诊量预测方法。
技术介绍
近年来,门诊病人就医难、就医繁是大型综合医院的一大通病,暴露出医疗资源不合理分配与公众的就医需求的矛盾。门诊的任何一个服务环节都有排长队的可能,如何提高医疗资源的配置效率,有效减少门诊患者无效等待一直是管理者所关注的问题。在众多的医院数据指标中,门诊就诊量一直是度量门诊医疗工作质量的重要指标之一,科学的对医院日门诊量进行分析预测,及时、准确地分析门诊部的人流量变化及趋势特征,不仅可以反映出医院规模及医疗水平,而且还可以为管理者统筹安排医护人员和制定工作计划提供科学的决策依据,从而提高医院的工作效率和管理水平,进而提高患者满意度。时间序列一般都跨较长的时间段才具有研究意义,时间粒度可以是时、分、秒等,按照时间顺序和统一的时间粒度搜集目标对象相关指标的一系列统计值,逐渐形成规模庞大的时间序列数据库。人们希望通过分析和挖掘时间序列来发现和揭示研究对象的发展变化趋势,以便从可用数据中提取尽可能多的数据信息,并将这些信息形成知识来掌握和控制未来行为。现实生活中,普遍存在时间序列数据对象,如医院门诊就诊量、银行日存取款额度、公路车流量的周期序列等等,如何从这些庞大的时间序列库挖掘信息形成知识应用就成为一个有价值的研究分向。可见,不管事工业界还是科学研究中,时间序列有着重要的应用和研究价值。其中,医院门诊就诊量具有长期趋势性、季节性、节假日等不规则周期性以及部分异常值等序列特性,现有对时间序列研发方法中的Prophet方法只适用于序列具有明显周期性或模式的时序特性,若用Prophet方法进行预测拟合医院门诊就诊量,容易遗漏目标序列不具周期性的平稳成分,降低了预测的准确性。此外还有采用ARMA方法进行预测,但是ARMA方法仅仅适合平稳序列的短期预测,需要若干次的差分变换来消除序列的周期性、季节性等序列特性,造成预测序列具有较大的误差,而平稳性条件往往难以满足,同时,对于周期长度不恒定的周期成分,例如节假日的影响,节假日的时间间隔是不相等的,ARMA模型无法很好的剥离节假日影响,若将其应用于医院门诊的就诊量预测,其预测结果的准确性则难以满足要求。因此,已有的时间序列研究方法不能满足于医院门诊就诊量的预测需求。
技术实现思路
本专利技术的目的是提供一种基于Prophet-ARMA的门诊就诊量预测方法,通过将Prophet模型以及ARMA模型相结合实现就诊量预测精度高的特点。一种基于Prophet-ARMA的门诊就诊量预测方法,包括如下步骤:步骤1:获取与待测时段相邻的历史时段的门诊数据,并生成每类门诊的门诊数据集;其中,所述待测时段为连续时段,门诊数据包括日期、门诊类型以及就诊量,所述门诊数据集包括所述历史时段内每天一类门诊的就诊量;步骤2:将每个门诊数据集分别输入每类门诊的Prophet模型得到每类门诊的第一预测数据和拟合数据;所述第一预测数据包括一类门诊在当前待测时段内每天的Prophet就诊量预测值,所述拟合数据包括一类门诊在所述历史时段内每天的就诊量拟合值;步骤3:填充每个门诊的门诊数据集中的缺失值,并分别计算填充后的每个门诊数据集与对应拟合数据的差得到每类门诊的残差序列;步骤4:分别判断每类门诊的残差序列是否为纯随机序列,若不是,将残差序列输入对应一类门诊的ARMA模型得到第二预测数据,再执行步骤5;若是,执行步骤6;所述第二预测数据包括一类门诊在当前待测时段内每天的ARMA就诊量预测值;步骤5:分别将同一类门诊的所述第一预测数据、所述第二预测数据中同一天的数据相加得到所述当前待测时段内在每天对应一类门诊的就诊量预测值,完成预测;步骤6:将第一预测数据中的Prophet就诊量预测值作为当前待测时段内在每天对应一类门诊的就诊量预测值,完成预测。本专利技术中历史时段和待测时段均为连续时段,且相邻两个待测时段也是连续时段,即本专利技术是基于就诊量时间序列进行的就诊量预测。第一预测数据为Prophet模型的预测结果,第二预测数据为ARMA模型的预测结果。纯随机序列的判断方式是现有方法可以实现的。本专利技术将Prophet模型与ARMA模型相结合并应用于同一个待测时段的就诊量预测,且其结合过程是将Prophet模型的拟合结果以及历史时段的门诊数据集得到残差序列,并将其作为ARMA模型的输入值。一方面,本专利技术采集历史时段的数据,由于就诊量时间序列是具有明显的周期性,因此充分利用了Prophet模型拟合就诊量时间序列中周期性的特征得到拟合结果以及预测结果,实现就诊量时间序列的动荡成分拟合。第二方面,将残差序列作为ARMA模型的输入值得到的ARMA模型的预测结果可以更有效地弥补Prophet模型预测结果中因遗漏就诊量时间序列不具周期性的平稳成分而导致的预测误差。第三方面,通过Prophet模型的拟合结果以及历史时段的门诊数据集相减得到的残差序列已经是具有较高的平稳性,可以有效地的避免常规ARMA模型预测时多次差分变化带来的预测误差。进一步优选,步骤4中将残差序列输入对应一类门诊的ARMA模型得到第二预测数据时,执行如下步骤:首先,将残差序列输入对应一类门诊的ARMA模型,并获取所述ARMA模型的自相关系数、偏自相关系数以及贝叶斯信息准则数值;其中,在预设取值范围内进行取值得到自相关系数和偏自相关系数的每种取值组合,并通过现有方法计算每种取值组合下所述ARMA模型的贝叶斯信息准则数值,再获取贝叶斯信息准则数值最小时的取值组合中的自相关系数和偏自相关系数;最后,基于计算出的自相关系数和偏自相关系数的ARMA模型获取第二预测数据。进一步优选,自相关系数和偏自相关系数的预设取值范围均为[0,20]。从0到20遍历自相关系数p和偏自相关系数q,获得ARMA模型的贝叶斯信息准则数值(bic值),将最小bic值对应的p和q取值确定为模型最终的p和q值,以此模型结构进行ARMA模型训练。进一步优选,步骤4中将每类门诊的残差序列分别输入每类门诊的ARMA模型之前还包括对每类门诊的残差序列进行平稳性处理;所述平稳性处理过程如下:首先,通过ADF(AutomaticDirectionFinder:自动方位搜寻器)单位根检验方法检验残差序列是否平稳;若是,将残差序列输入对应的ARMA模型;若不是,对残差序列进行差分处理直至残差序列平稳。通过Prophet模型的拟合结果以及历史时段的门诊数据集相减得到的残差序列已经是具有较高的平稳性,因此,本专利技术的差分处理只需要进行一阶或者二阶差分即可达到平稳性。相较于常规的多次差分处理,可以有效地降低差分处理带来的预测误差。进一步优选,所述每类门诊的Prophet模型均设有模型特征参数,所述模型特征参数包括事件日期列表、就诊量的长期趋势、拐点日期列表;所述事件日期列表包括历史时段以及待测时段内的事件日、每个所述事件日前t1天和后t2天,t1、t2均为非零正整数;所述就诊量的长期趋势分为线性趋势和非线性趋势;所述拐点日期列表包括在历史时段内对应一类门诊的部分或全部就诊量拐点的日期。事件日包括法定节假日以及就诊量异常日,其中就诊量异常日是指因气候、空气等因素造成就诊量异本文档来自技高网
...

【技术保护点】
1.一种基于Prophet‑ARMA的门诊就诊量预测方法,其特征在于:包括如下步骤:步骤1:获取与待测时段相邻的历史时段的门诊数据,并生成每类门诊的门诊数据集;其中,所述待测时段为连续时段,门诊数据包括日期、门诊类型以及就诊量,所述门诊数据集包括所述历史时段内每天一类门诊的就诊量;步骤2:将每个门诊数据集分别输入每类门诊的Prophet模型得到每类门诊的第一预测数据和拟合数据;所述第一预测数据包括一类门诊在当前待测时段内每天的Prophet就诊量预测值,所述拟合数据包括一类门诊在所述历史时段内每天的就诊量拟合值;步骤3:填充每个门诊的门诊数据集中的缺失值,并分别计算填充后的每个门诊数据集与对应拟合数据中同一天数据的差得到每类门诊的残差序列;步骤4:分别判断每类门诊的残差序列是否为纯随机序列,若不是,将残差序列输入对应一类门诊的ARMA模型得到第二预测数据,再执行步骤5;若是,执行步骤6;所述第二预测数据包括一类门诊在当前待测时段内每天的ARMA就诊量预测值;步骤5:分别将同一类门诊的所述第一预测数据、所述第二预测数据中同一天的数据相加得到所述当前待测时段内在每天对应一类门诊的就诊量预测值,完成预测;步骤6:将第一预测数据中的Prophet就诊量预测值作为当前待测时段内在每天对应一类门诊的就诊量预测值,完成预测。...

【技术特征摘要】
1.一种基于Prophet-ARMA的门诊就诊量预测方法,其特征在于:包括如下步骤:步骤1:获取与待测时段相邻的历史时段的门诊数据,并生成每类门诊的门诊数据集;其中,所述待测时段为连续时段,门诊数据包括日期、门诊类型以及就诊量,所述门诊数据集包括所述历史时段内每天一类门诊的就诊量;步骤2:将每个门诊数据集分别输入每类门诊的Prophet模型得到每类门诊的第一预测数据和拟合数据;所述第一预测数据包括一类门诊在当前待测时段内每天的Prophet就诊量预测值,所述拟合数据包括一类门诊在所述历史时段内每天的就诊量拟合值;步骤3:填充每个门诊的门诊数据集中的缺失值,并分别计算填充后的每个门诊数据集与对应拟合数据中同一天数据的差得到每类门诊的残差序列;步骤4:分别判断每类门诊的残差序列是否为纯随机序列,若不是,将残差序列输入对应一类门诊的ARMA模型得到第二预测数据,再执行步骤5;若是,执行步骤6;所述第二预测数据包括一类门诊在当前待测时段内每天的ARMA就诊量预测值;步骤5:分别将同一类门诊的所述第一预测数据、所述第二预测数据中同一天的数据相加得到所述当前待测时段内在每天对应一类门诊的就诊量预测值,完成预测;步骤6:将第一预测数据中的Prophet就诊量预测值作为当前待测时段内在每天对应一类门诊的就诊量预测值,完成预测。2.根据权利要求1所述的方法,其特征在于:步骤4中将残差序列输入对应一类门诊的ARMA模型得到第二预测数据时,执行如下步骤:首先,将残差序列输入对应一类门诊的ARMA模型,并获取所述ARMA模型的自相关系数和偏自相关系数;其中,在预设取值范围内进行取值得到自相关系数和偏自相关系数的每种取值组合,并计算每种取值组合下所述ARMA模型的贝叶斯信息准则数值,再获取贝叶斯信息准则数值最小时的自相关系数和偏自相关系数的取值;最后,基于计算出的自相关系数和偏自相关系数的ARMA模型获取第二预测数据。3.根据权利要求2所述的方法,其特征在于:自相关系数和偏自相关系数的预设取值范围均为[0,20]。4.根据权利要求2所述的方法,其特征在于:步骤4中将残差序列输入对应一类门诊的ARMA模型之前还包括对每类门诊的残差序列进行平稳性处理;所述平稳性处理过程如下:首先,通过ADF单位根检验方法检验残差序列是否平稳;若是,将残差序列输入对应的ARMA模型;若不是,对残差序列进行差分处理直至残差序列平稳。5.根据权利要求1所述的方法,其特征在于:所述每类门诊的Prophet模型均设有模型特征参数,所述模型特征参数包括事件日期列表、就诊量的长期趋势、拐点日期列表;所述事件日期列表包括历史时段以及待测时段内的事件日、每个所述事件日前t1天和后t2天,t1、t2均为非零正整数;所述就诊量的长期趋势分为线性趋势和非线性趋势;所述拐点日期列表包括在历史时段内对应一类门诊的部分或全部就诊量拐点的日期。6.根据权利要求5所述的方法,其特征在于:步骤2中将门诊数据集输入的Prophet模型为对应一类门诊的最新Prophet模型;若当前预测为第一次预测,所述最新的Prophet模型为预设Prophet模型;若当前预测非第一次预测,所述最新的Prophet模型为与当前待测时段相邻的前一个待测时段在同一类门诊的Prophet就诊量预测时采用的Prophet模型。7.根据权利要求6所述的方法...

【专利技术属性】
技术研发人员:王建新李丽萍肖湘佳慧安莹
申请(专利权)人:中南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1