一种基于生活物资流动的疫情态势预测方法技术

技术编号:38491642 阅读:11 留言:0更新日期:2023-08-15 17:04
本发明专利技术提供了疫情预测技术领域的一种基于生活物资流动的疫情态势预测方法,包括如下步骤:步骤S10、通过爬虫技术获取疫情历史数据;步骤S20、基于ARIMA模型创建一疫情态势预测模型,利用所述疫情历史数据对疫情态势预测模型进行预训练;步骤S30、获取生活物资流动数据,对所述生活物资流动数据进行预处理,得到物资数据集;步骤S40、将所述物资数据集划分为训练集和验证集;步骤S50、利用所述训练集和验证集对预训练后的疫情态势预测模型进行训练和验证;步骤S60、利用验证通过后的所述疫情态势预测模型进行疫情态势预测。本发明专利技术的优点在于:极大的提升了疫情预测的准确性。极大的提升了疫情预测的准确性。极大的提升了疫情预测的准确性。

【技术实现步骤摘要】
一种基于生活物资流动的疫情态势预测方法


[0001]本专利技术涉及疫情预测
,特别指一种基于生活物资流动的疫情态势预测方法。

技术介绍

[0002]在传染病的传播初期不少居民会去购买生活物资而导致大规模人员聚集,没有采购到足够物资的人群也通过其它平台订购生活物资,增加了传播的风险,因此产生了基于生活物资进行疫情预测的需求,而传统上并不存在相关的预测方法,仅凭工作人员的经验,导致预测的准确性不佳。
[0003]因此,如何提供一种基于生活物资流动的疫情态势预测方法,实现提升疫情预测的准确性,成为一个亟待解决的技术问题。

技术实现思路

[0004]本专利技术要解决的技术问题,在于提供一种基于生活物资流动的疫情态势预测方法,实现提升疫情预测的准确性。
[0005]本专利技术是这样实现的:一种基于生活物资流动的疫情态势预测方法,包括如下步骤:
[0006]步骤S10、通过爬虫技术获取疫情历史数据;
[0007]步骤S20、基于ARIMA模型创建一疫情态势预测模型,利用所述疫情历史数据对疫情态势预测模型进行预训练;
[0008]步骤S30、获取生活物资流动数据,对所述生活物资流动数据进行预处理,得到物资数据集;
[0009]步骤S40、将所述物资数据集划分为训练集和验证集;
[0010]步骤S50、利用所述训练集和验证集对预训练后的疫情态势预测模型进行训练和验证;
[0011]步骤S60、利用验证通过后的所述疫情态势预测模型进行疫情态势预测。<br/>[0012]进一步地,所述步骤S10具体包括:
[0013]步骤S11、爬虫基于header和cookie获取目标网页,基于所述目标网页的elements部分定位selector部分,基于所述selector部分查找tr子类的网页内容;
[0014]步骤S12、通过正则表达式从所述网页内容中匹配疫情历史数据,将所述疫情历史数据存储到excel文件中。
[0015]进一步地,所述步骤S20中,所述ARIMA模型的公式为:
[0016][0017]其中,L表示滞后算子;i表示当前时间序列的差分次数;L
i
表示当前差分的时间序列的滞后算子;p表示自回归项的阶数,即时间序列的前p个数据对当前数据有影响;d表示差分次数,即时间序列需要做d次差分才能平稳;q表示移动平均项的阶数,即时间序列前q
个差分数据对当前差分数据的影响程度;X
t
表示时间序列;θ
i
表示模型MA在当前差分次数的系数;ε
t
表示残差,即时间序列的随机波动部分;Φ
i
表示模型AR在当前差分次数的系数。
[0018]进一步地,所述步骤S30具体为:
[0019]获取生活物资流动数据,对所述生活物资流动数据进行至少包括删除重复值、填补缺失值、删除异常值的预处理后,得到物资数据集。
[0020]进一步地,所述步骤S40具体为:
[0021]通过交叉验证法将所述物资数据集划分为训练集和验证集。
[0022]进一步地,所述步骤S50具体为:
[0023]设定一收敛条件以及一准确率阈值,利用所述训练集对预训练后的疫情态势预测模型进行训练,直至满足所述收敛条件;
[0024]利用所述验证集对训练后的所述疫情态势预测模型进行验证,判断所述疫情态势预测模型的预测准确率是否大于准确率阈值,若是,则进入步骤S60;若否,则扩充所述训练集继续训练。
[0025]本专利技术的优点在于:
[0026]通过爬虫技术获取疫情历史数据,利用疫情历史数据对基于ARI MA模型创建的疫情态势预测模型进行预训练;对获取的生活物资流动数据进行预处理得到物资数据集,通过交叉验证法将物资数据集划分为训练集和验证集,利用训练集和验证集对预训练后的疫情态势预测模型进行训练和验证,利用验证通过后的疫情态势预测模型进行疫情态势预测,由于先利用疫情历史数据对疫情态势预测模型进行预训练,再利用生活物资流动数据对预训练后的疫情态势预测模型进行训练,以提高生活物资特征对疫情态势预测模型的影响权重,且ARI MA模型具有结构简单、适用性强、数据解析能力强的优点,最终极大的提升了疫情预测的准确性,可基于疫情预测结果解决居民的生活物资发放问题,不仅不会影响生活,还可以避免在生活物资发放过程中造成疫情的二次传播。
附图说明
[0027]下面参照附图结合实施例对本专利技术作进一步的说明。
[0028]图1是本专利技术一种基于生活物资流动的疫情态势预测方法的流程图。
[0029]图2是本专利技术疫情历史数据中感染人数的示意图。
[0030]图3是本专利技术基于自适应权重均值的深度双Q网络模型的示意图。
[0031]图4是本专利技术疫情态势预测模型的残差自相关示意图。
[0032]图5是本专利技术疫情态势预测模型的残差偏自相关示意图。
[0033]图6是本专利技术未预训练的疫情态势预测模型(0,1,0)拟合和预测示意图。
[0034]图7是本专利技术预训练的疫情态势预测模型模型(0,2,1)的预测结果示意图。
[0035]图8是本专利技术未发放生活物资预测与实际总计的感染人数差值的示意图。
具体实施方式
[0036]本申请实施例中的技术方案,总体思路如下:先利用疫情历史数据对疫情态势预测模型进行预训练,再利用生活物资流动数据对预训练后的疫情态势预测模型进行训练,以提高生活物资特征对疫情态势预测模型的影响权重,且ARIMA模型具有结构简单、适用性
强、数据解析能力强的优点,进而提升疫情预测的准确性。
[0037]请参照图1至图8所示,本专利技术一种基于生活物资流动的疫情态势预测方法的较佳实施例之一,包括如下步骤:
[0038]步骤S10、通过爬虫技术获取疫情历史数据;
[0039]步骤S20、基于ARIMA模型创建一疫情态势预测模型,利用所述疫情历史数据对疫情态势预测模型进行预训练;
[0040]疫情态势预测是很明显的时间序列预测问题,而对时间序列数据进行分析和预测,比较完善和精确的算法是博克思

詹金斯(Box

Jenkins)方法,其常用模型包括:自回归模型(AR模型)、滑动平均模型(MA模型)、ARMA模型(自回归

滑动平均混合模型)、ARIMA模型(差分整合移动平均自回归模型),其中ARIMA(p,d,q)模型是ARMA(p,q)模型的扩展,相对于其它时间序列模型具有结构简单、适用性强和数据解释能力强的优点;
[0041]步骤S30、获取生活物资流动数据,对所述生活物资流动数据进行预处理,得到物资数据集;
[0042]步骤S40、将所述物资数据集划分为训练集和验证集;
[0043]步骤S50、利用所述训练集和验证集对预训练后的疫情态势预测模型进行训练和验证;
[0044]步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生活物资流动的疫情态势预测方法,其特征在于:包括如下步骤:步骤S10、通过爬虫技术获取疫情历史数据;步骤S20、基于ARIMA模型创建一疫情态势预测模型,利用所述疫情历史数据对疫情态势预测模型进行预训练;步骤S30、获取生活物资流动数据,对所述生活物资流动数据进行预处理,得到物资数据集;步骤S40、将所述物资数据集划分为训练集和验证集;步骤S50、利用所述训练集和验证集对预训练后的疫情态势预测模型进行训练和验证;步骤S60、利用验证通过后的所述疫情态势预测模型进行疫情态势预测。2.如权利要求1所述的一种基于生活物资流动的疫情态势预测方法,其特征在于:所述步骤S10具体包括:步骤S11、爬虫基于header和cookie获取目标网页,基于所述目标网页的elements部分定位selector部分,基于所述selector部分查找tr子类的网页内容;步骤S12、通过正则表达式从所述网页内容中匹配疫情历史数据,将所述疫情历史数据存储到excel文件中。3.如权利要求1所述的一种基于生活物资流动的疫情态势预测方法,其特征在于:所述步骤S20中,所述ARIMA模型的公式为:其中,L表示滞后算子;i表示当前时间序列的差分次数;L
i
表示当前差分的时间序列的滞后算子;p表示自回归项的阶数,即时间序列的...

【专利技术属性】
技术研发人员:吴志雄徐春梅张惠臻侯济恭
申请(专利权)人:南威软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1