疾病预测方法及装置、计算机装置及可读存储介质制造方法及图纸

技术编号:18459775 阅读:59 留言:0更新日期:2018-07-18 13:05
一种疾病预测方法,所述方法包括:获取疾病监测数据、天气数据和舆情数据;对所述疾病监测数据、天气数据和舆情数据进行预处理;构建多层GRU模型;对所述多层GRU模型进行训练和性能验证,得到优化后的多层GRU模型;利用所述优化后的多层GRU模型对预测时间点进行预测,得到所述预测时间点的疾病预测结果。本发明专利技术还提供一种疾病预测装置、计算机装置及可读存储介质。本发明专利技术可以实现快速高准确率的疾病预测。

Disease prediction method and device, computer device and readable storage medium

A method for predicting disease, including obtaining disease monitoring data, weather data and public opinion data, preprocessing the disease monitoring data, weather data and public opinion data, constructing a multi-layer GRU model, training and validating the multi-layer GRU model, and obtaining the optimized multilayer GRU model; The optimized multi-layer GRU model is used to predict the time points, and the disease prediction results of the prediction time points are obtained. The invention also provides a disease prediction device, a computer device and a readable storage medium. The invention can achieve rapid and accurate prediction of diseases.

【技术实现步骤摘要】
疾病预测方法及装置、计算机装置及可读存储介质
本专利技术涉及预测
,具体涉及一种疾病预测方法及装置、计算机装置和计算机可读存储介质。
技术介绍
随着全球经济一体化进程的加快,经济与交流活动增加,人群流动日益频繁,为疾病的传播与爆发提供了有利环境,公共卫生健康问题越来越严峻。同时,社会与自然环境也发生着变化,环境污染、自然灾害等影响公众健康事件的增多也增加了突发公共卫生事件爆发的可能性。如何能早期识别到疾病突发公共卫生事件,及时发出预警,尽早采取相应的控制措施,将突发公共卫生事件造成的损失降到最低,是公共卫生领域长期以来关注的焦点,也是卫生应急工作的重要内容。突发公共卫生事件预警,是通过对有关数据的收集,整理、分析和整合,运用计算机、网络、通讯等现代先进的技术,对事件的征兆进行监测、识别、诊断与评价,及时报警,告知有关部门和公众做好相关的应对和准备工作,及时采取有效的防控措施,尽可能阻止或减缓突发事件的发生或减少事件的危害。突发公共卫生事件预警中的一个重要工作是疾病预测,即根据历史的疾病监测数据(即病患数据)预测未来的疾病监测数据。随着机器学习技术的发展,越来越多的机器学习方法应用在疾病预测上。然而,应用于疾病预测的传统的机器学习往往需要人为去定义特征集,然后从定义好的特征集中搜寻最好的特征组合,且效果往往都不够好,从而影响了疾病预测的准确率。
技术实现思路
鉴于以上内容,有必要提出一种疾病预测方法及装置、计算机装置和计算机可读存储介质,其可以实现快速高准确率的疾病预测。本申请的第一方面提供一种疾病预测方法,所述方法包括:获取疾病监测数据,所述疾病监测数据是时间序列数据;获取所述疾病监测数据相关的天气数据,所述天气数据是与所述疾病监测数据对应的时间序列数据;获取所述疾病监测数据相关的舆情数据,所述舆情数据是与所述疾病监测数据对应的时间序列数据;对所述疾病监测数据、天气数据和舆情数据进行预处理;构建多层门控递归单元神经网络模型,即多层GRU模型;从预处理后的所述疾病监测数据、天气数据和舆情数据中获取训练数据和验证数据,利用所述训练数据和所述验证数据对所述多层GRU模型进行训练和性能验证,得到优化后的多层GRU模型;从预处理后的所述疾病监测数据、天气数据和舆情数据中获取预测时间点之前的疾病监测数据、天气数据和舆情数据,将所述预测时间点之前的疾病监测数据、天气数据和舆情数据输入所述优化后的多层GRU模型,得到所述预测时间点的疾病预测结果。另一种可能的实现方式中,所述从网页中抓取天气数据包括:生成面向天气信息网站的API接口的种子URL以及后续的URL;向所述天气信息网站的API接口发送HTTP请求,请求访问所述API接口;对所述天气信息网站提供的数据内容进行分析和识别,以查看所述数据内容;判断所述数据内容是否为预定信息内容;若所述数据内容为预定信息内容,则抓取所述数据内容;将抓取的数据内容作为所述天气数据保存到本地。另一种可能的实现方式中,所述舆情数据包括:特定词的搜索次数;或者特定舆情网站包含特定词的舆情信息的数量。另一种可能的实现方式中,所述对所述疾病监测数据、天气数据和舆情数据进行预处理包括:填补所述疾病监测数据、天气数据和舆情数据中的缺失值;修正对所述疾病监测数据、天气数据和舆情数据中的异常值;对所述疾病监测数据、天气数据和舆情数据进行数据格式转换。另一种可能的实现方式中,所述天气数据包括湿度、气温、气压、降水量、水汽压、风速、风向、日照时数。另一种可能的实现方式中,所述多层GRU模型包括两层GRU单元层和一层全连接层,第一层GRU单元层用于对输入数据构造特征,得到第一隐藏层单元,第二层GRU单元层用于对所述第一隐藏层单元进行组合,得到第二隐藏层单元,所述全连接层用于根据所述第二隐藏层单元得到预测结果,每个GRU单元层包括重置门和更新门,所述重置门和更新门控制所述GRU单元层的记忆状态。另一种可能的实现方式中,所述多层GRU模型训练过程中使用的损失函数为均方差,使用的算法为RMSprop算法。本申请的第二方面提供一种疾病预测装置,所述装置包括:第一获取单元,用于获取疾病监测数据,所述疾病监测数据是时间序列数据;第二获取单元,用于获取所述疾病监测数据相关的天气数据,所述天气数据是与所述疾病监测数据对应的时间序列数据;第三获取单元,用于获取所述疾病监测数据相关的舆情数据,所述舆情数据是与所述疾病监测数据对应的时间序列数据;预处理单元,用于对所述疾病监测数据、天气数据和舆情数据进行预处理;构建单元,用于构建多层门控递归单元神经网络模型,即多层GRU模型;优化单元,用于从预处理后的所述疾病监测数据、天气数据和舆情数据中获取训练数据和验证数据,利用所述训练数据和所述验证数据对所述多层GRU模型进行训练和性能验证,得到优化后的多层GRU模型;预测单元,用于从预处理后的所述疾病监测数据、天气数据和舆情数据中获取预测时间点之前的疾病监测数据、天气数据和舆情数据,将所述预测时间点之前的疾病监测数据、天气数据和舆情数据输入所述优化后的多层GRU模型,得到所述预测时间点的疾病预测结果。另一种可能的实现方式中,所述装置分别对地区和地区下属医院进行疾病预测,得到针对地区的地区异常值和针对地区下属医院的地区下属医院异常值;所述装置还包括第三比较单元,用于比较所述地区异常值和所述地区下属医院异常值,根据所述地区异常值和所述地区下属医院异常值的比较结果得到最终的异常值。另一种可能的实现方式中,所述预处理单元具体用于:填补所述疾病监测数据、天气数据和舆情数据中的缺失值;修正对所述疾病监测数据、天气数据和舆情数据中的异常值;对所述疾病监测数据、天气数据和舆情数据进行数据格式转换。另一种可能的实现方式中,所述天气数据包括湿度、气温、气压、降水量、水汽压、风速、风向、日照时数。本申请的第三方面提供一种计算机装置,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述疾病预测方法。本申请的第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述疾病预测方法。本专利技术获取疾病监测数据,所述疾病监测数据是时间序列数据;获取所述疾病监测数据相关的天气数据,所述天气数据是与所述疾病监测数据对应的时间序列数据;获取所述疾病监测数据相关的舆情数据,所述舆情数据是与所述疾病监测数据对应的时间序列数据;对所述疾病监测数据、天气数据和舆情数据进行预处理;构建多层门控递归单元神经网络模型,即多层GRU模型;从预处理后的所述疾病监测数据、天气数据和舆情数据中获取训练数据和验证数据,利用所述训练数据和所述验证数据对所述多层GRU模型进行训练和性能验证,得到优化后的多层GRU模型;从预处理后的所述疾病监测数据、天气数据和舆情数据中获取预测时间点之前的疾病监测数据、天气数据和舆情数据,将所述预测时间点之前的疾病监测数据、天气数据和舆情数据输入所述优化后的多层GRU模型,得到所述预测时间点的疾病预测结果。本专利技术通过多层GRU模型对患病数据进行预测。GRU模型可以从数据中直接去提取知识,构造出有利于预测的特征向量,提高了预测精度。并且,本专利技术将天气数据、舆情数据作为影响因素在加入到疾病预测中,提高了疾病本文档来自技高网...

【技术保护点】
1.一种疾病预测方法,其特征在于,所述方法包括:获取疾病监测数据,所述疾病监测数据是时间序列数据;获取所述疾病监测数据相关的天气数据,所述天气数据是与所述疾病监测数据对应的时间序列数据;获取所述疾病监测数据相关的舆情数据,所述舆情数据是与所述疾病监测数据对应的时间序列数据;对所述疾病监测数据、天气数据和舆情数据进行预处理;构建多层门控递归单元神经网络模型,即多层GRU模型;从预处理后的所述疾病监测数据、天气数据和舆情数据中获取训练数据和验证数据,利用所述训练数据和所述验证数据对所述多层GRU模型进行训练和性能验证,得到优化后的多层GRU模型;从预处理后的所述疾病监测数据、天气数据和舆情数据中获取预测时间点之前的疾病监测数据、天气数据和舆情数据,将所述预测时间点之前的疾病监测数据、天气数据和舆情数据输入所述优化后的多层GRU模型,得到所述预测时间点的疾病预测结果。

【技术特征摘要】
1.一种疾病预测方法,其特征在于,所述方法包括:获取疾病监测数据,所述疾病监测数据是时间序列数据;获取所述疾病监测数据相关的天气数据,所述天气数据是与所述疾病监测数据对应的时间序列数据;获取所述疾病监测数据相关的舆情数据,所述舆情数据是与所述疾病监测数据对应的时间序列数据;对所述疾病监测数据、天气数据和舆情数据进行预处理;构建多层门控递归单元神经网络模型,即多层GRU模型;从预处理后的所述疾病监测数据、天气数据和舆情数据中获取训练数据和验证数据,利用所述训练数据和所述验证数据对所述多层GRU模型进行训练和性能验证,得到优化后的多层GRU模型;从预处理后的所述疾病监测数据、天气数据和舆情数据中获取预测时间点之前的疾病监测数据、天气数据和舆情数据,将所述预测时间点之前的疾病监测数据、天气数据和舆情数据输入所述优化后的多层GRU模型,得到所述预测时间点的疾病预测结果。2.如权利要求1所述的方法,其特征在于,所述从网页中抓取天气数据包括:生成面向天气信息网站的API接口的种子URL以及后续的URL;向所述天气信息网站的API接口发送HTTP请求,请求访问所述API接口;对所述天气信息网站提供的数据内容进行分析和识别,以查看所述数据内容;判断所述数据内容是否为预定信息内容;若所述数据内容为预定信息内容,则抓取所述数据内容;将抓取的数据内容作为所述天气数据保存到本地。3.如权利要求1所述的方法,其特征在于,所述舆情数据包括:特定词的搜索次数;或者特定舆情网站包含特定词的舆情信息的数量。4.如权利要求1所述的方法,其特征在于,所述对所述疾病监测数据、天气数据和舆情数据进行预处理包括:填补所述疾病监测数据、天气数据和舆情数据中的缺失值;修正对所述疾病监测数据、天气数据和舆情数据中的异常值;对所述疾病监测数据、天气数据和舆情数据进行数据格式转换。5.如权利要求1-4中任一项所述的方法,其特征在于,所述天气数据包括湿度、气温、气压、降水量、水汽压、风速、风向、日照时数。6.如权利要...

【专利技术属性】
技术研发人员:阮晓雯徐亮肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1