当前位置: 首页 > 专利查询>中国疾病预防控制中心环境与健康相关产品安全所专利>正文

一种基于机器学习预测中暑发生的模型及方法技术

技术编号：20390900 阅读：33 留言：0更新日期：2019-02-20 03:15

本发明专利技术公开一种基于机器学习预测中暑发生的模型及方法，步骤一：建立典型高温城市的高温事件发生数据库；步骤二：对数据库进行数据匹配及清理；步骤三：应用Boruta算法进行变量筛选；步骤四：建立随机森林模型的训练数据集及验证数据集；步骤五：确定随机森林参数并建立随机森林模型；步骤六：变量重要性排序；步骤七：模型预测结果评估；步骤八：应用Bland‑Altman一致性评价方法对模型结果进行评估。本发明专利技术方法更能代表高温热浪事件的不良健康效应；能够较好的拟合非线性关系变量，提高模型拟合的效果；较为全面的对中暑事件的发生进行预测；能够较好的减少人群健康损伤，降低人群健康相关的经济损失。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于机器学习预测中暑发生的模型及方法
本专利技术涉及一种基于机器学习预测中暑发生的模型及方法，包含基于随机森林方法的模型建立以及其模型拟合效果的评估，尤其是一种预测不同地区日均中暑发生例数的模型及方法，基于不同地区的气象以及社会经济学等参数，结合机器学习方法建立预测模型，评估未来日均中暑发生例数，属于机器学习应用于高温健康危害的智能预测的

技术介绍
近年来，全球范围内的热浪事件形势严峻。根据联合国政府间气候变化专门委员会发布的报告，过去半个世纪中热浪的发生频率呈增加趋势，提示未来几十年中，地表温度将持续增加并伴随极端高温事件频发，其带来的严峻的不良健康效应更是不容忽视。因此，对于热浪及其相关的健康后果的有效预估可以更好的提升人群健康防护，同时减少热浪相关的健康损失。其中，中暑则是热浪事件对应的重要不良健康结局。中暑事件一般发生在机体处于高温、高湿等极端环境中，从而产生身体温度的异常升高。但由于中暑事件报道具有时间延迟性，相关变量具有潜在共线性，这些可能的因素都会影响中暑发生预测的效率。现有的相关预测模型在可靠性等方面尚存在不足之处，并且缺乏基于实际数...

【技术保护点】
1.一种基于机器学习预测中暑发生的模型及方法，其特征在于：具体步骤如下：步骤一：建立典型高温城市的高温事件发生数据库整理中国典型城市的经济学及社会学指标，同时整理历年高温时段的气象因素以及中暑数据，建立我国典型城市的中暑事件数据库；步骤二：对数据库进行数据匹配及清理将步骤一建立的中暑事件数据库，进行清理和剔除，得到匹配数据库，具体为：以日均中暑事件发生数量为标准，以前一日、前三日、前五年的温度、湿度气象因素数据以及社会经济学数据为变量，建立匹配数据库；步骤三：应用Boruta算法进行变量筛选采用Boruta特征选择算法，根据特征即各变量重要性判断特征变化后的平均减少精度，以评价每个特征即变量的...

【技术特征摘要】
1.一种基于机器学习预测中暑发生的模型及方法，其特征在于：具体步骤如下：步骤一：建立典型高温城市的高温事件发生数据库整理中国典型城市的经济学及社会学指标，同时整理历年高温时段的气象因素以及中暑数据，建立我国典型城市的中暑事件数据库；步骤二：对数据库进行数据匹配及清理将步骤一建立的中暑事件数据库，进行清理和剔除，得到匹配数据库，具体为：以日均中暑事件发生数量为标准，以前一日、前三日、前五年的温度、湿度气象因素数据以及社会经济学数据为变量，建立匹配数据库；步骤三：应用Boruta算法进行变量筛选采用Boruta特征选择算法，根据特征即各变量重要性判断特征变化后的平均减少精度，以评价每个特征即变量的重要性，迭代逐步删除非重要的特征，最后给出接受或拒绝特征变量的结果，达到模型变量筛选的目的；步骤四：建立随机森林模型的训练数据集及验证数据集从步骤三得到的已删除非重要特征的匹配数据库即总数据库中，随机抽取90％的数据作为随机森林模型的训练数据集，将剩余10％的数据设为模型的验证数据集，以后续评估模型的预测效果；步骤五：确定随机森林参数并建立随机森林模型在随机森林模型建立中对需要的参数进行确定，即确定模型中特征数量以及树数量；通过十折交叉验证方法将数据随机分为十份，分别依次将九份数据进行分析并用剩余一份数据进行验证，通过R方拟合度最终确定最优的特征数量以及树数量，建立随机森林模型；步骤六：变量重要性排序结合步骤五建立的随机森林模型以及确定的特征数量，...

【专利技术属性】
技术研发人员：李湉湉，王彦文，杜艳君，王情，
申请(专利权)人：中国疾病预防控制中心环境与健康相关产品安全所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人