一种周ILI占比趋势预测系统及方法技术方案

技术编号:30165856 阅读:17 留言:0更新日期:2021-09-25 15:21
本发明专利技术公开了一种周ILI占比趋势预测系统及方法,属于疾病控制技术领域。本发明专利技术的周ILI占比趋势预测系统包括数据采集模块、模型开发模块、历史周ILI占比监测模块、未来一周ILI占比预测模块和周增幅异常模块,数据采集模块用于采集百度指数数据、气象数据和门诊与流感样数据;模型开发模块包括数据预处理、特征工程、模型调优和生成模型;历史周ILI占比监测模块用于对历史周ILI占比的监测;周增幅异常模块利用历史周ILI占比监测结果与未来一周ILI占比预测结果进行预警。该发明专利技术的周ILI占比趋势预测系统在预测时增加了天气和百度指数数据因素,进而提高了预测的合理性与准确性,具有很好的推广应用价值。很好的推广应用价值。很好的推广应用价值。

【技术实现步骤摘要】
一种周ILI占比趋势预测系统及方法


[0001]本专利技术涉及疾病控制
,具体提供一种周ILI占比趋势预测系统及方法。

技术介绍

[0002]流行性感冒(简称流感),是由流感病毒引起的一种急性呼吸道传染病,传染性强,发病率高,容易引起暴发流行或大流行。传统的疾病监测系统建立在医院诊断和实验室检查的基础上,在症状报告或样品采集和疾病的最后诊断之间通常存在一段时间的滞后期。
[0003]随着人工智能技术的崛起,各类人工智能模型逐步应用于流感预测中。鉴于流感疾病是一种典型的季节性疾病,具有较高的周期性,因此业界多使用时间序列类模型对ILI(流感样病例)占比进行未来趋势预测。
[0004]经研究发现,每当流感爆发前期,多出现天气骤冷现象。随着网络的发展,伴随流感流行季的到来,网络中关于感冒用药、感冒症状等词汇搜索量增加。然而,这种仅使用时间序列算法进行未来ILI占比预测的方法,却只能考虑历史ILI占比对未来ILI占比的印象,而无法将其他影响因素融入预测。

技术实现思路

[0005]本专利技术的技术任务是针对上述存在的问题,提供一种在预测时增加了天气和网络数据因素,进而提高了预测的合理性与准确性的周ILI占比趋势预测系统。
[0006]本专利技术进一步的技术任务是提供一种周ILI占比趋势预测方法。
[0007]为实现上述目的,本专利技术提供了如下技术方案:
[0008]一种周ILI占比趋势预测系统,包括数据采集模块、模型开发模块、历史周ILI占比监测模块、未来一周ILI占比预测模块和周增幅异常模块,数据采集模块用于采集百度指数数据、气象数据和门诊与流感样数据;模型开发模块包括数据预处理、特征工程、模型调优和生成模型;历史周ILI占比监测模块用于对历史周ILI占比的监测;周增幅异常模块利用历史周ILI占比监测结果与未来一周ILI占比预测结果进行预警。百度指数采集时首先通过网络爬取方式,采集流感相关81词日百度搜索指数近三年数据;之后以一周为周期,定时采集该81词日百度搜索指数。气象数据,首先通过网络爬取方式,采集包括白天天气、白天温度、白天风级、夜天气、夜温度、夜风级在内近三年气象数据;之后以一周为周期,定时对以上气象数据进行采集。采集数据将存储于kudu数据库。
[0009]门诊与流感样数据,首先分别统计呼吸道症候群疾病相关门诊、流感样病例门诊近三年日就诊量;之后以一周为周期,定时采集呼吸道症候群疾病相关门诊、流感样病例门诊周就诊量。
[0010]作为优选,所述数据预处理为针对门诊与流感样数据、气象数据、百度指数数据进行数据的预处理,并将预处理后的数据回填至存储表中;特征工程为从存储表中提取门诊与流感样数据、气象数据、百度指数数据近三年的预处理数据,分别对门诊与流感样数据、气象数据、百度指数数据进行特征处理;模型调优为对多元回归模型Xgboost与时间序列模
型ARIMA进行模型调优;基于模型调优结果,利用数据采集中近三年的数据通过特征工程后进行模型训练,生成模型,最终以接口形式进行模型开发。开发接口的输入为待预测周周一的日期pre_date;输出为模型对待预测周ILI占比的预测结果pre_value。
[0011]历史周ILI占比监测模块对历史周ILI占比的监测,具体实现方法如下:
[0012]第一步,从门诊与流感样病例数据库中获取从待预测周向前推一年的呼吸道症候群疾病相关科室日门诊量、流感样病例日门诊量;
[0013]第二步,以周为单位,计算这一年呼吸道症候群疾病相关科室周门诊量与流感样病例周门诊量;
[0014]第三步,计算这一年周ILI占比,并以折线图形式展示。计算公式如下:
[0015][0016]作为优选,未来一周ILI占比预测模块对未来一周ILI占比预测包括以下过程:
[0017]1)编写定时程序,每周一调用模型接口,输入当日日期;
[0018]2)自动从数据库抓取预测所需的气候、百度指数数据及历史门诊与流感样病例数据;
[0019]3)将抓取的数据,经特征工程处理后输入模型,生成预测结果,并将预测结果以json形式返回;
[0020]4)模型在每次返回结果时,将Xgboost预测结果、最终预测结果、上一周ILI占比值分别存入数据库供下次计算使用。
[0021]作为优选,周增幅异常模块在进行周增幅异常预警时,将待预测周的上一周作为周增幅异常预警中的本周计算,将待预测周作为周增幅异常预警中的本周计算。
[0022]一种周ILI占比趋势预测方法,基于本专利技术所述周ILI占比趋势预测系统来实现,包括以下步骤:
[0023]S1、数据预处理:对采集来的数据进行清洗,转化为满足特征工程的数据,包括门诊与流感样数据、气象数据和百度指数数据;
[0024]S2、特征工程:对预处理完成的数据进行特征组合、筛选及特征向量化;
[0025]S3、融合时间因素的多元回归模型预测。
[0026]作为优选,门诊与流感样数据处理包括时间数据的处理与门诊量数据的处理,其中时间数据的处理是提取每一日属于该年的第几周作为该部分的时间特征,门诊量数据的处理为计算日门诊量、日流感门诊量;气象数据包括白天天气、白天温度、白天风级、夜天气、夜温度、夜风级;百度指数数据为网络中对流感相关词的搜索热度。
[0027]作为优选,门诊与基于数据预处理结果的流感样数据特征工程以年周为索引计算周门诊量、周ILI、周流感样样门诊量、近两周的ILI量、近三周的ILI量;基于数据预处理结果的气象数据特征工程包括数值型数据的处理与类别型数据的处理;基于数据预处理结果的百度指数数据以年周为单位分别计算各关键词的周平均百度指数,使用Z_score方式,在周维度上对各关键词进行标准化处理。
[0028]作为优选,融合时间因素的多元回归模型预测以特征工程处理后的历史气象数据、百度指数数据、门诊与流感样数据为输入因素,对未来一周ILI占比进行预测,包括多元回归网络、时间序列网络与自适应权重调节。
[0029]与现有技术相比,本专利技术的周ILI占比趋势预测系方法具有以下突出的有益效果:该周ILI占比趋势预测系方法在保留时间因素基础上,预测时增加了天气、百度指数数据因素,进而提高了模型的合理性与准确性,具有良好的推广应用价值。
附图说明
[0030]图1是本专利技术所述周ILI占比趋势预测系统的拓扑图;
[0031]图2是模型开发的流程图;
[0032]图3是本专利技术所述周ILI占比趋势预测方法的多元回归模型预测流程图。
具体实施方式
[0033]下面将结合附图和实施例,对本专利技术的周ILI占比趋势预测系统及方法作进一步详细说明。
[0034]实施例
[0035]如图1所示,本专利技术的周ILI占比趋势预测系统,包括数据采集模块、模型开发模块、历史周ILI占比监测模块、未来一周ILI占比预测模块和周增幅异常模块。
[0036]数据采集模块用于采集百度指数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种周ILI占比趋势预测系统,其特征在于:包括数据采集模块、模型开发模块、历史周ILI占比监测模块、未来一周ILI占比预测模块和周增幅异常模块,数据采集模块用于采集百度指数数据、气象数据和门诊与流感样数据;模型开发模块包括数据预处理、特征工程、模型调优和生成模型;历史周ILI占比监测模块用于对历史周ILI占比的监测;周增幅异常模块利用历史周ILI占比监测结果与未来一周ILI占比预测结果进行预警。2.根据权利要求1所述的周ILI占比趋势预测系统,其特征在于:所述数据预处理为针对门诊与流感样数据、气象数据、百度指数数据进行数据的预处理,并将预处理后的数据回填至存储表中;特征工程为从存储表中提取门诊与流感样数据、气象数据、百度指数数据近三年的预处理数据,分别对门诊与流感样数据、气象数据、百度指数数据进行特征处理;模型调优为对多元回归模型Xgboost与时间序列模型ARIMA进行模型调优;基于模型调优结果,利用数据采集中近三年的数据通过特征工程后进行模型训练,生成模型。3.根据权利要求2所述的周ILI占比趋势预测系统,其特征在于:未来一周ILI占比预测模块对未来一周ILI占比预测包括以下过程:1)编写定时程序,每周一调用模型接口,输入当日日期;2)自动从数据库抓取预测所需的气候、百度指数数据及历史门诊与流感样病例数据;3)将抓取的数据,经特征工程处理后输入模型,生成预测结果,并将预测结果以json形式返回;4)模型在每次返回结果时,将Xgboost预测结果、最终预测结果、上一周ILI占比值分别存入数据库供下次计算使用。4.根据权利要求3所述的周ILI占比趋势预测系统,其特征在于:周增幅异常模块在进行周增幅异常预警时,将待预测周的上一周作为周增幅...

【专利技术属性】
技术研发人员:刘文丽李向阳
申请(专利权)人:山东健康医疗大数据有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1