【技术实现步骤摘要】
一种面向流行病智能监测系统的疫情预测分析方法及系统
[0001]本专利技术属于软件工程领域,具体涉及一种面向流行病智能监测系统的疫情预测分析方法及系统。
技术介绍
[0002]世界各地的研究人员一直在使用现有的数学和统计方法预测疫情的发展,包括随机模拟、对数正态分布、机器学习和人工智能。短期的预测目前主流的方法:1.随机模拟中的SIR模型,一种数学流行病模型;2.使用机器学习中的日期序列的预测模型,这种方法是预测像COVID
‑
19这样的传染病的方法。2020年5月25日,兰州大学发布“全球COVID
‑
19疫情预测系统”这个系统就是基于SIR模型,该系统通过历史数据拟合来确定参数,从而可以对各种情况进行有效地预测,获得更好的预测结果。然而,疫情的情况是复杂的,“全球COVID
‑
19疫情预测系统”模型的预测结果与实际数据存在差异;因此,结果需要进一步修改。许多方法已经被使用来修正预测结果。例如,模拟
‑
动态方法被用于修正天气预报模型。为了修改模型的结果 ...
【技术保护点】
【技术特征摘要】
1.一种面向流行病智能监测系统的疫情预测分析方法,其特征在于,该方法包括以下步骤:步骤1:对时间序列数据进行预测分析,时间序列数据集S的特征包含日期、截至到该日期累计感染人数、每日新增感染人数,首先采用MinMaxSclar将时间序列数据集中的新增每日感染人数中最大值和最小值进行记录,最后归一化到(
‑
1,1),将时间序列数据集S中的新增每日感染人数归一化之后,通过滑动窗口创建为新的数据集S
′
,滑动窗口的大小为30,建立的S
′
的标签为预测的每日新增感染人数,特征是预测的每日新增感染人数的前30天的每日新增感染人数;步骤2:采用数据集S
′
训练DLSTM时间序列预测模型,之后对未来的每日新增感染人数进行预测,首先,利用第1天到第30天的每日新增感染人数作为特征,记作Q1,来预测第31天的每日新增感染人数a1,利用第2天到第31天的每日新增感染人数作为特征,记作Q2,第31天的每日新增感染人数采用预测出的每日新增感染人数a1的值,通过训练完的DLSTM模型进一步预测出第32天的每日新增感染人数记为a2;利用第3天到第32天的每日新增感染人数作为特征,记作Q3,通过训练完的DLSTM模型进一步预测出第33天的每日新增感染人数记为a3,重复N次以得到未来的每日新增感染人数的集合记为a,其中,每个Q
i
对应得到一个a
i
,所有的a
i
组成集合a,i为1,2,3,
…
,N;步骤3:采用模型融合方法中的瀑布融合法,将DLSTM时间序列预测模型和Transformer模型作为过滤器前后衔接的方式来进行融合,将融合模型称为Dlstm_transformer模型,采用数据集S
′
训练Dlstm_transformer时间序列预测模型,之后对未来的每日新增感染人数进行预测;首先,利用第1天到第30天的每日新增感染人数作为特征记作P1,来预测第31天的每日新增感染人数b1,然后利用第2天到第31天的每日新增感染人数作为特征记作P2,第31天的每日新增感染人数采用预测出的每日新增感染人数b1的值,通过训练完的Dlstm_transformer模型进一步预测第32天的每日新增感染人数记为b2;然后利用第3天到第32天的每日新增感染人数作为特征记作P3,通过训练完的Dlstm_transformer模型进一步预测第33天的每日新增感染人数记为b3;重复N次以得到未来的每日新增感染人数的集合记为b,其中,每个P
i
对应得到一个b
i
,所有的b
i
组成集合b,i为1,2,3,
…
,N;步骤4:设置融合状态机制,融合状态机制是通过DLSTM模型和Dlstm_transformer模型对已知的每日新增感染人数进行预测,预测结果记为a
′
和b
′
,通过融合状态机制和预测的每日新增感染人数的集合a
′
和b
′
对加权融合的权重配比进行计算;步骤5:通过融合状态机制对之前预测的感染人数集合a和b进行修正,a和b同一天的预测数值通过融合状态机制求得的权重配比进行加权获得最终预测结果集合c,并画制预测感染人数折线图。2.根据权利要求1所述的一种面向流行病智能监测系统的疫情预测分析方法,其特征在于:对步骤1中采用式(1)对数据集S的每日新增感染人数进行归一化处理:式中,是归一化处理之后的第j条每日新增感染人数记录,S
j
为时间序列数据集S中第j条每日新增感染人数记录,max(S)和min(S)分别为时间序列数据集S中每日新增感染人数
的最大值和最小值,采用式(1)对时间序列数据集S的特征进行归一化处理,将所有的组成新的3.根据权利要求1所述的一种面向流行病智能监测系统的疫情预测分析方法,特征在于:对归一化之后的时间序列数据集进行数据集的重新构建,采用了滑动窗口的思想,滑动窗口的大小为30,最后建立的S
′
的标签为预测的每日新增感染人数,特征是预测的每日新增感染人数的前30天的每日新增感染人数。4.根据权利要求1所述的一种面向流行病智能监测系统的疫情预测分析方法,特征在于:所述步骤2中采用式(2)预测出未来一段时间的每日新增感染人数集合a:a
u
=DLSTM(Q
i
)
ꢀꢀꢀꢀ
(2)式中,DLSTM()是经过数据集S
′
训练之后得到的最终DLSTM模型,DLSTM模型对LSTM模型进行了改进,LSTM模型向前传播的时候采用的是求和方式,将其改进为线性层方式,且保持维度不变;采用式(3)对LSTM模型进行改进:更新遗忘门:f
t
=σ(linear(W
f
h
t
‑1,U
f
x
t
))更新输入门:i
t
=σ(linear(W
i
h
t
‑1,U
i
x
t
))更新细胞状态:更新输出门:h
t
=σ(linear(W
o
h
t
‑1,U
o
x
t
))*tanh(C
t
)
ꢀꢀꢀꢀ
(3)式中,LSTM模型中更新遗忘门的公式采用求和,f
t
表示遗忘门的状态,i
t
表示输入门的状态,表示被选值向量,C
t
表示细胞状态,h
t
表示更新门,σ()表示sigmod函数,linear()即为改进的线性层函数,W
f
和U
f
,W
i
和U
i
,W
c
和U
c
,W
o
和U
o
为原LSTM模型中设置的一个权重,h
t
‑1为t
‑
1时间上的输出,x
t
为t时间上的输入,tanh()为双曲正切函数。5.根据权利要求1所述的一种面向流行病智能监测系统的疫情预测分析方法,特征在于:所述步骤3中,采用了模型融合中的瀑布融合法,将DLSTM时间序列预测模型和Transformer模型作为过滤器前后衔接的方式进行融合,该融合模型称为Dlstm_transformer模型,采用式(4)预测出未来一段时间的每日新增感染人数集合b:b
i
=Dlstm_transformer(P
i
)
ꢀꢀꢀꢀ
(4)上述Dlstm_transformer()是经过数据集S
′
训练之后得到的最终Dlstm_transformer模型。6.根据权利要求1所述的一种面向流...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。