【技术实现步骤摘要】
基于两步回归的医院门诊就诊人数的预测方法、装置、设备和存储介质
[0001]本专利技术属于时间序列分析领域,具体涉及针对医院科室就诊患者人数的预测方法。
技术介绍
[0002]医院每天均有巨大的人流量,且这些就诊患者的数量受各类因素的影响不断变化,这给医院的管理制度带来了极大的挑战。过往的人员排班模式可能不适合新环境的变化,这便需要对未来医院的人流量进行预测,以针对性地安排医疗人员的出勤,避免造成人流高峰期过于拥堵,而低谷期人力资源浪费等问题,合理进行资源的分配管理。
[0003]医院对于人员排班的安排通常基于经验,好处在于简单易行,但有时不能因为某些因素的变化较为灵活的应对患者人数的变化。构建模型可以有效解决这一问题,但目前没有很好的先例。
[0004]多种因素会影响前来就诊患者的数量,如天气、假期、气温等,也有不可知的潜在因素,这些因素使患者人流量的时间序列不断波动。因此,预测的难点在于把握各因素对于人流量的作用,以及各因素之间的相关性,搭建出一个合理可行的预测模型。但是,现有医院并不存在这种能够提前预测 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于两步回归的医院门诊就诊人数的预测方法,其特征在于,包括:步骤S1:构建基于两步回归的医院门诊就诊人数的预测模型,预测模型为:其中t=1,2,...,T.y
t
为第t天人数;D
it
表示第t天是否为星期i,若第t天恰为星期i,则D
it
取值为1,否则D
it
取值为0,b
i
为星期i前的系数;表示为节假日前,表示为节假日后;分别为工作时段最高气温与最低气温;W
t
为第t天的天气,若有降雨或降雪则W
t
=1,其余天气为0;a,b,c,d,f,g,h为回归项系数,代表上述因素对于y
t
的影响大小e
t
满足一个ARIMA模型:p为自回归阶数,d为差分的阶数,q为滑动平均的阶数;φ,θ为自回归以及滑动项的系数;B为延迟算子,其定义为Be
t
=e
t
‑1;∈
t
为服从独立同分布的白噪声序列;n为一周工作的天数,例如n=5、6或7;步骤S2:采用上述预测模型预测未来一段时间内的医院门诊就诊人数。2.如权利要求1所述的基于两步回归的医院门诊就诊人数的预测方法,其特征在于,步骤S1包括:步骤S1.1:选取影响医院门诊就诊人数的若干变量,所述变量分别为星期数、节假日、气温和天气;步骤S1.2:将星期数变量、节假日变量、气温变量和天气变量组成解释变量矩阵X=(D1,D2,...,D
n
,H
before
,H
after
,T
high
,T
low
,W),并将X作标准化处理得到X
*
:设X=(x
ij
)
n
×
p
,则其中步骤S1.3:将X
*
进行主成分分析:1)找到一个正交矩阵Γ,满足Γ
T
Γ=I,且使得Γ
T
X*
T
XΓ为一p
×
p对角阵Λ=diag(σ1,σ2,...,σ
m
,0,...,0),m≤p且σ1≥σ2≥σ
m
>0;2)计算主成分方差贡献率以及累计贡献率3)选取i,1≤i≤p,使得γ
i
≥0.95,并取Γ的前i列,记为并记并记即为X
*
的主成分矩阵;步骤S1.4:使用解释变量来拟合线性回归模型:
其中y=(y1,y2,...,y
T
)
T
为科室每天人数,e=(e1,e2,...,e
T
)
T
首先假设满足独立同分布,采用最小二乘法得到估计参数并计算残差步骤S1.5:将残差序列拟合ARIMA模型:其中p为自回归阶数,d为差分的阶数,q为滑动平均的阶数;φ,θ为自回归以及滑动项的系数;B为延迟算子,其定义为Be
t
=e
t
‑1;∈
t
为服从独立同分布的白噪声序列;首先采用Hyndman
‑
Khandakar算法来选择最优的阶数(p,d,q):(1)通过重复地KPSS测试来确定差分阶数d:0≤d≤2(2)对数据差分d次之后,通过最小化AICc来选择最优的p,q:AIC=2k
‑
2log(Likelihood)其中n为样本容量,即样本的个数,k为去除噪声方差后总的参数数量,极大似然函数的计算步骤见下文参见步骤S1.7中的系数φ,θ的估计方法:(1)拟合四个初始模型:ARIMA(0,d,0)、ARIMA(2,d,2)、ARIMA(1,d,0)、ARIMA(0,d,1),(2)步骤(1)中拟合出的最好的模型(AICc最小)称为“current model”;(3)考察“current model”的以下两个变种模型:1.对p和/或q的值改变
±
1;2.包含/不包含常数项c;将上述变种和原来的current model中AICc最小的模型即为最新的“current model”;(4)重复(3),直到没有更小的AICc的模型;步骤S1.6:将原来的线性回归模型调整为:步骤S1.6:将原来的线性回归模型调整为:步骤S1.7:使用极大似然估计来确定自回归以及滑动项的系数φ,θ的值,从而估计得到参数并带入模型以完成预测模型的构建:假设各∈
t
是相互独立的,且服从零均值与相同的标准差则各∈
t
的概率密度函数(pdf)为:由独立性,得到(∈1,∈2,...,∈
T
)的联合概率密度函数(pdf)为:
由此得到似然函数Likelihood:其中g
t
为将用y1,...,y
t
,β,φ,θ表示的函数,可以根据模型公式将∈
t
用可以观测到的y以及表示,并求出使得(∈1,∈2,...,∈
T
)的联合概率密度函数(pdf)达到极大值:将估计得到的参数带入模型,从而完成了模型的构建。3.如权利要求1或2所述的基于两步回归的医院门诊就诊人数的预测方法,其特征在于,步骤S2包括:采用构建完成的所述预测模型来预测未来k天各科室的人流量,已知的数据有前T天的人流量y=(y1,y2,...,y
T
)
T
,以及k天的解释变量矩阵X
forecast
=(D1,D2,...,D
n
,H
before
,H
after
,T
high
,T
low
,W)逐一预测科室后k天的人流量首先将X
l
按步骤S1.2同样的方法进行变换得到再带入回归模型中:此处要求出预测值y
forecast
则需要先计算出e
forecast
根据e
forecast
满足的模型其中t=T+1,T+2,...,T+k,可以将模型中的t用T+l代替:由于T时刻之前事件已经发生,为已知事件,记e
T
(l)=E(e
技术研发人员:李子靖,陈颢,张淑芹,王立鹏,高卫国,邓璐,王孜怡,
申请(专利权)人:中国人民解放军海军军医大学第一附属医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。