当前位置: 首页 > 专利查询>杨祺铭专利>正文

一种基于数据挖掘的飓风强度变化预测方法技术

技术编号:25519901 阅读:41 留言:0更新日期:2020-09-04 17:10
本发明专利技术公开了一种基于数据挖掘模型的飓风强度变化预测方法,包括以下步骤:步骤一:获取飓风气象数据并对其进行预处理;步骤二:寻找合适分类算法以及探究RI型飓风分类的可能性;步骤三:将数据测试集放入飓风强度预测模型进行集成训练;步骤四:从集成学习中根据评价指标体系选取最优的飓风强度预测模型;步骤五:飓风未来6小时、12小时、18小时飓风风力分级预测实验;本发明专利技术在Weka平台利用数据挖掘和集成学习方法建立了一种性能较好且不那么复杂,能够基本准确预测的飓风强度模型,不依赖于气象学、动力学知识,不关心飓风物理模型和形成原因的预测模型,确保及时预警和筹备救灾方案的时间,使人们提前知晓飓风到来,做好防备,减少经济损失。

【技术实现步骤摘要】
一种基于数据挖掘的飓风强度变化预测方法
本专利技术涉及飓风强度变化预测
,具体是一种基于数据挖掘的飓风强度变化预测方法。
技术介绍
热带气旋是产生于热带以及亚热带海面的气旋性环流,其中,中心风速达到每秒33米每秒及以上的气旋被称之为台风或飓风。虽然飓风能为干旱地区增加降雨,同时平衡热量,但它带来的危害是极大的,比如说摧毁房屋、树木以及带来洪水,使人的生命财产安全受到威胁,同时给国家增加经济负担。但是飓风的成因目前的研究无法完全清楚,同时影响飓风强度增加的因子也包括很多方面,其中有的因素还是未知的。现有的飓风预报模式主要分为三类,分别是统计模式、统计——动力模式和数值模式,这些方法在计算不同的飓风最大可能强度(MPI)时需要根据专家经验选择合适的方案,不同的计算方案对于同一飓风事件的强度预测结果也不相同。因此,需要利用科学的手段,探索一种通用的,不依赖于气象学,动力学知识,不关心飓风物理结构和形成原因的预测模型对飓风进行预测,从而减少飓风带来的损失。在信息技术不断革新的浪潮中,各行各业产生了大量不同类别不同结构的数据,这些数本文档来自技高网...

【技术保护点】
1.一种基于数据挖掘模型的飓风强度变化预测方法,其特征在于,包括以下步骤:/n步骤1:获取飓风气象数据并对其进行预处理/n数据预处理包括飓风强度分级、数据清理、数据格式转换、数据分割和分级数据处理成预测分级数据五个部分;/n步骤2:寻找合适分类算法以及探究RI型飓风分类的可能性/n利用RI策略,在进行飓风强度变化预测时,将数据集中“是否为RI型”属性设置为分类属性,然后利用分类算法进行训练;/n步骤3:将数据测试集放入飓风强度预测模型进行集成训练/n合理选择算法作为Bagging基分类器对数据集进行学习从而得到最优的飓风强度变化预测模型。/n步骤4:从集成学习中根据评价指标体系选取最优的飓风强...

【技术特征摘要】
1.一种基于数据挖掘模型的飓风强度变化预测方法,其特征在于,包括以下步骤:
步骤1:获取飓风气象数据并对其进行预处理
数据预处理包括飓风强度分级、数据清理、数据格式转换、数据分割和分级数据处理成预测分级数据五个部分;
步骤2:寻找合适分类算法以及探究RI型飓风分类的可能性
利用RI策略,在进行飓风强度变化预测时,将数据集中“是否为RI型”属性设置为分类属性,然后利用分类算法进行训练;
步骤3:将数据测试集放入飓风强度预测模型进行集成训练
合理选择算法作为Bagging基分类器对数据集进行学习从而得到最优的飓风强度变化预测模型。
步骤4:从集成学习中根据评价指标体系选取最优的飓风强度预测模型
训练后系统得到的10个预测函数,按照分类准确性排序,选出准确率最高的5个加入决策小组,再通过考虑各种指标对分类结果进行投票选择;
步骤5:飓风未来6小时、12小时、18小时飓风风力分级预测实验
在步骤3的选出的最好的算法集合的基础上进行步骤4的实验,探究飓风未来6小时、12小时、以及18小时飓风风力分级预测的能力。


2.根据权利要求1所述的基于数据挖掘模型的飓风强度变化预测方法,其特征在于,步骤1的具体实现过程包括以下子步骤:
步骤1.1:将飓风强度按照中心风速大小分为12个级别,并在数据表中建立新的数据项VCLASS;
步骤1.2:将数据缺失率高于1%的属性列删除,使用Weka平台中Weka.filters.unsupervised.attribute.RepelaceMissingValues功能把低于1%的属性列的缺失值补全;
步骤1.3:使用Weka平台上的Weka.filters.unsupervised.attri-bute.NumericToNorminal对飓风等级数据进行离散化处理;
步骤1.4:将步骤1.3得到的数据作为初始数据用于数据挖掘实验,从中分离出训练集和测试集;
步骤1.5:将分级数据处理成预测数据,依据飓风名对飓风数据进行处理,对每一个飓风的x条数据进行处理,预测值设置为6小时、12小时和18小时后的那一条数据,也就是第i条数据的6小时、12小时和18小时的预测级别为i+1、i+2和i+3的条数据的VCLASS属性项的值,然后删除每一个飓风x条数据的末尾3条数据,最后得到3组数据集和训练集,分别是预测6小时后等级、12小时后等级、18小时后等级。


3.根据权利要求1所述的基于数据挖掘模型的飓风强度变化预测方法,其特征在于,步骤2的具体实现过程包括以下子步骤:
步骤2.1:选择REPTree、LMT(Logistic模型树)、J48(C4.5)、IBk(kNN)和MultilayerPerceptron(BP神经网络)5种算法进行分类,...

【专利技术属性】
技术研发人员:杨祺铭
申请(专利权)人:杨祺铭
类型:发明
国别省市:北京;11

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1