【技术实现步骤摘要】
一种基于数据挖掘的沙尘暴数据分析方法
本专利技术涉及一种数据挖掘方法,具体涉及一种基于数据挖掘的沙尘暴数据分析方法。
技术介绍
沙尘暴是沙暴和尘暴两者兼有的总称,是指强风把地面大量沙尘卷入空中,使空气特别混浊,水平能见度低于1km的天气现象。它主要出现在北非、西南亚、中亚、中蒙、澳大利亚及美国西南部等干旱荒漠化区。我国西北和华北许多地区,以及东北个别地区都可能出现强或特强沙尘暴,但总频数在20次以上的多发区仅有5大片(根据1952-2001年的我国北方强和特强沙尘暴数据):以民勤为中心(53次)的河西走廊区;以和田为中心(42次)的南疆盆地区;以拐子湖为中心(25次)的内蒙古阿拉善高原区;以伊克乌素镇为中心(27次)的鄂尔多斯高原区;以及以朱日和为中心(22次)的浑善达克沙地区。其中,内蒙古中西部多发区的强及特强沙尘暴几乎占我国北方总沙尘暴频数的2/3。统计表明,我国北方每年平均出现6次左右的强或特强沙尘暴,最多年达13、14次,如1959,1966年和1976年。内蒙古中、西部及河西走廊地区的沙尘暴主要出现在春季(3~5月,占63%),特别是4月(占30%),而 ...
【技术保护点】
一种基于数据挖掘的沙尘暴数据分析方法,其特征在于,所述方法包括下述步骤:(1)采用决策树中的CART算法对沙尘暴数值进行评估;(2)运用时间序列中的简单季节模型和ARIMA季节乘积模型对沙尘暴数据进行分析;(3)月平均沙尘暴预测。
【技术特征摘要】
1.一种基于数据挖掘的沙尘暴数据分析方法,其特征在于,所述方法包括下述步骤:(1)采用决策树中的CART算法对沙尘暴数值进行评估;(2)运用时间序列中的简单季节模型和ARIMA季节乘积模型对沙尘暴数据进行分析;(3)月平均沙尘暴预测。2.如权利要求1所述的沙尘暴数据分析方法,其特征在于,所述步骤(1)包括下述步骤:1)确定沙尘暴数值中的月平均沙尘暴评估指标;2)建立月平均沙尘暴划分生成的决策树模型;3)建立分季节沙尘暴划分生成的决策树模型;4)运用步骤2)和3)生成的决策树模型对沙尘暴进行预测。3.如权利要求2所述的沙尘暴数据分析方法,其特征在于,所述步骤1)中的月平均沙尘暴评估指标包括月平均气压、月平均水汽压、月最小相对湿度、月蒸发量和月降水量以及月平均风速;所述月平均气压的单位为hpa,月平均水汽压的单位为hpa,月最小相对湿度用百分数表示,月蒸发量和月降水量的单位为mm,月平均沙尘暴的单位为℃,月平均风速的单位m/s。4.如权利要求2所述的沙尘暴数据分析方法,其特征在于,所述步骤2)中建立月平均沙尘暴划分生成的决策树模型包括下述步骤:a、收集50年历史数据作为训练集;b、运用CART算法中的增长方式生成月平均沙尘暴划分生成的决策树模型,其中月平均沙尘暴划分生成的决策树模型父节点的最小个数为20,子节点的最小个数为10;c、将50年历史数据后的5年月沙尘暴数据对决策树模型进行正确率检测。5.如权利要求4所述的沙尘暴数据分析方法,其特征在于,所述月平均沙尘暴划分生成的决策树模型中以月平均气压、月平均水汽压和月蒸发量为主的气象因子。6.如权利要求4所述的沙尘暴数据分析方法,其特征在于,正确率检测包括:每一项数据沿决策树模型走到某个叶子节点,如果该项数据的实际月平均沙尘暴在预测沙尘暴的标准差范围之内,则判定该项数据测试结果为正确,否则判为错误。7.如权利要求2所述的沙尘暴数据分析方法,其特征在于,所述步骤3)中,将10年历史数据分开季节做沙尘暴的决策树分析,包括下述步骤:a、选取春季3、4、5月的数...
【专利技术属性】
技术研发人员:仁庆道尔吉,李娜,
申请(专利权)人:内蒙古工业大学,
类型:发明
国别省市:内蒙古,15
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。