当前位置: 首页 > 专利查询>集美大学专利>正文

利用细粒度数据的手足口病预测方法、电子设备及介质技术

技术编号:26175527 阅读:26 留言:0更新日期:2020-10-31 14:09
本申请提供一种利用细粒度数据的手足口病预测方法及装置、电子设备以及计算机可读介质。方法包括:获取手足口病的历史病例数据;对历史病例数据进行预处理,并统计为两种不同时间间隔的时序数据;根据时间聚合预所述两种不同时间间隔的时序数据,得到多元时序数据,并将多元时序数据转化为有监督数据;根据有监督数据,训练手足口病预测模型;将实时采集的手足口病的病例数据输入训练好的手足口病预测模型,得到实时预测的手足口病的发病人数。本方案,统计了历史病例数据不同粒度时间间隔的时序数据,结合更细粒度的时序数据提高了基于等时间粒度预测手足口病发病人数的准确度,并且无需额外的数据辅助,提高了预测效率。

【技术实现步骤摘要】
利用细粒度数据的手足口病预测方法、电子设备及介质
本申请涉及公共卫生预测
,具体涉及一种利用细粒度数据的手足口病预测方法及装置、一种电子设备以及一种计算机可读介质。
技术介绍
随着全球经济一体化进程的加快,经济与交流活动增加,人群流动日益频繁,为疾病的传播与爆发提供了有利环境,公共卫生健康问题越来越严峻。同时,社会与自然环境也发生着变化,环境污染、自然灾害等影响公众健康事件的增多也增加了突发公共卫生事件爆发的可能性。手足口病是发病率最高的传染病之一,在世界范围内影响着公共卫生安全。早期预测对传染病的防治起到预警和决策支持的重要作用。此外,手足口病的管控也是政府、医疗机构和普通民众所关心的事。传统的方法在预测未来某一个时间间隔内手足口病的发病人数时,都是基于观察的若干个相同时间间隔的发病人数来做的,例如利用过去多年同期的发病人数来预测今年同期的发病人数,但是如上传统方法的预测往往差强人意。
技术实现思路
本申请的目的是提供一种利用细粒度数据的手足口病预测方法及装置、一种电子设备以及一种计算机可读介质。本申请第一方面提供一种利用细粒度数据的手足口病预测方法,包括:S1、获取手足口病的历史病例数据;S2、对所述历史病例数据进行预处理,并统计为两种不同时间间隔的时序数据;S3、根据时间聚合预所述两种不同时间间隔的时序数据,得到多元时序数据,并将所述多元时序数据转化为有监督数据;S4、根据所述有监督数据,训练手足口病预测模型;S5、将实时采集的手足口病的病例数据输入训练好的所述手足口病预测模型,得到实时预测的手足口病的发病人数。本申请第二方面提供一种利用细粒度数据的手足口病预测装置,包括:获取模块,用于获取手足口病的历史病例数据;预处理模块,用于对所述历史病例数据进行预处理,并统计为两种不同时间间隔的时序数据;聚合模块,用于根据时间聚合预所述两种不同时间间隔的时序数据,得到多元时序数据,并将所述多元时序数据转化为有监督数据;模型训练模块,用于根据所述有监督数据,训练手足口病预测模型;预测模块,用于将实时采集的手足口病的病例数据输入训练好的所述手足口病预测模型,得到实时预测的手足口病的发病人数。本申请第三方面提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行以实现本申请第一方面所述的方法。本申请第四方面提供一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现本申请第一方面所述的方法。相较于现有技术,本申请提供的利用细粒度数据的手足口病预测方法、装置、电子设备及介质,获取手足口病的历史病例数据;对所述历史病例数据进行预处理,并统计为两种不同时间间隔的时序数据;根据时间聚合预所述两种不同时间间隔的时序数据,得到多元时序数据,并将所述多元时序数据转化为有监督数据;根据所述有监督数据,训练手足口病预测模型;将实时采集的手足口病的病例数据输入训练好的所述手足口病预测模型,得到实时预测的手足口病的发病人数。本方案,统计了历史病例数据不同粒度时间间隔的时序数据来训练预测模型,通过预测模型,结合更细粒度的时序数据提高了基于等时间粒度预测手足口病发病人数的准确度,并且无需额外的数据辅助,提高了预测效率。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本申请的一些实施方式所提供的一种利用细粒度数据的手足口病预测方法的流程图;图2示出了本申请的一些实施方式所提供的一种具体的利用细粒度数据的手足口病预测方法的流程图;图3示出了本申请的一些实施方式所提供的一种利用细粒度数据的手足口病预测装置的示意图;图4示出了本申请的一些实施方式所提供的一种电子设备的示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本申请所属领域技术人员所理解的通常意义。另外,术语“第一”和“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。由于疾病存在潜伏期,目前绝大多数的手足口病预测模型不能精准预测手足口病的爆发期,因此从细粒度的数据中挖掘潜在的爆发人数成为可能。因此,本申请通过收集手足口病的历史发病病例,设置和预测目标相等时间间隔以及比预测目标的时间间隔更细粒度的时间间隔,统计并得到以两种时间粒度为单位的发病人数时间序列,聚合两个不同时间间隔的时间序列,转化时序数据为有监督的数据,利用有监督的数据训练融合两种数据的时序神经网络,最后利用训练好的模型提供比仅仅利用和预测目标等间隔的时间序列更精准的预测。具体的,本申请实施例提供一种利用细粒度数据的手足口病预测方法及装置、一种电子设备以及计算机可读介质,下面结合附图进行说明。请参考图1,其示出了本申请的一些实施方式所提供的一种利用细粒度数据的手足口病预测方法的流程图,如图所示,所述利用细粒度数据的手足口病预测方法,可以包括以下步骤:步骤S101:获取手足口病的历史病例数据;步骤S102:对所述历史病例数据进行预处理,并统计为两种不同时间间隔的时序数据;步骤S103:根据时间聚合预所述两种不同时间间隔的时序数据,得到多元时序数据,并将所述多元时序数据转化为有监督数据;步骤S104:根据所述有监督数据,训练手足口病预测模型;步骤S105:将实时采集的手足口病的病例数据输入训练好的所述手足口病预测模型,得到实时预测的手足口病的发病人数。具体的,步骤S101中,手足口病的历史病例数据可以包括发病人数及发病的时间。例如,每个月份对应的发病人数,或者每个季度对应的发病人数,或者每年对应的发病人数。步骤S102中,针对历史病例数据进行初步数据清洗,过滤零值、去除无效的样本。对清洗后的数据进行归一化处理,将历史病例数据的数值压缩至确定的区间,得到归一化后的数据。然后将归一化后的数据统计为两种不同时间间隔的时序数据。在这里,也可以是先统计为两种不同时间间隔的时序数据,然后在进行归一化处理,本申请对此本文档来自技高网...

【技术保护点】
1.一种利用细粒度数据的手足口病预测方法,其特征在于,包括:/nS1、获取手足口病的历史病例数据;/nS2、对所述历史病例数据进行预处理,并统计为两种不同时间间隔的时序数据;/nS3、根据时间聚合预所述两种不同时间间隔的时序数据,得到多元时序数据,并将所述多元时序数据转化为有监督数据;/nS4、根据所述有监督数据,训练手足口病预测模型;/nS5、将实时采集的手足口病的病例数据输入训练好的所述手足口病预测模型,得到实时预测的手足口病的发病人数。/n

【技术特征摘要】
1.一种利用细粒度数据的手足口病预测方法,其特征在于,包括:
S1、获取手足口病的历史病例数据;
S2、对所述历史病例数据进行预处理,并统计为两种不同时间间隔的时序数据;
S3、根据时间聚合预所述两种不同时间间隔的时序数据,得到多元时序数据,并将所述多元时序数据转化为有监督数据;
S4、根据所述有监督数据,训练手足口病预测模型;
S5、将实时采集的手足口病的病例数据输入训练好的所述手足口病预测模型,得到实时预测的手足口病的发病人数。


2.根据权利要求1所述的方法,其特征在于,所述步骤S2中的两种不同时间间隔中,第一种时间间隔与目标时间间隔相同,把根据第一种时间间隔统计的时序数据称为等粒度时序数据;第二种时间间隔小于目标时间间隔,把根据第二种时间间隔统计的时序数据称为细粒度时序数据;
设置第一种时间间隔个数为M个,用[y1,y2,…,yM]表示等粒度时序数据;
设置第一种时间间隔包含N个第二种时间间隔,用[x1,x2,…,xM]表示等粒度时序数据,则任意满足其中xt,i表示等粒度时刻t内的第i个细粒度数据。


3.根据权利要求2所述的方法,其特征在于,所述步骤S2中的预处理步骤包括:
对所述历史病例数据进行数据清洗,对清洗后的数据进行归一化处理。


4.根据权利要求3所述的方法,其特征在于,所述步骤S3包括:
设置常数变量T为影响下一个时间间隔发病人数的时间间隔个数,将所述等粒度时序数据转化后,表示为:



设定第i个细粒度时刻的时序数据[x1,i,x2,i,…,xM,i],将该时序数据转化后,表示为:



其中,i∈{1,…,N};
根据时间将两种不同时间间隔的时序数据进行数据聚合,得到多元时序数据,并将所述多元时序数据转化为有监督数据,表示为:




【专利技术属性】
技术研发人员:王智谨黄耀辉付永钢
申请(专利权)人:集美大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1