一种基于改进的Naive Bayesian-CNN多目标分类算法的沙尘暴预测方法技术

技术编号:21182132 阅读:53 留言:0更新日期:2019-05-22 14:01
一种基于改进的Naive Bayesian‑CNN多目标分类算法的沙尘暴预测方法,以“中国强沙尘暴序列及其支撑数据集”,“中国强沙尘暴序列及其支撑数据集”和“中国陆地区域云图(IR1)”为研究对象。本发明专利技术首先考虑沙尘暴发生的地面因素,运用朴素贝叶斯算法,对气象台站收集的气象数据进行分析,建立沙尘暴预测模型;其次,考虑到大气运动也对沙尘暴发生产生影响,运用卷积神经网络算法,对红外卫星云图进行分析,建立沙尘暴预测模型;最后,运用多目标算法,对两个沙尘暴预测模型输出概率进行归一化,提出可扩展性强的一种基于改进的Naive Bayesian‑CNN多目标分类算法的沙尘暴预测方法。本发明专利技术提供的算法及沙尘暴预测方法,全面考虑地面及大气运动对沙尘暴发生的影响,符合沙尘暴发生特点。

A sandstorm prediction method based on improved Naive Bayesian-CNN multi-objective classification algorithm

A sandstorm prediction method based on improved Naive Bayesian CNN multi-objective classification algorithm is proposed. The research objects are \China's strong sandstorm sequence and its supporting data set\, \China's strong sandstorm sequence and its supporting data set\ and \China Land Regional Cloud Map (IR1)\. The invention firstly considers the ground factors of sand-dust storm occurrence, uses naive Bayesian algorithm to analyze the meteorological data collected by meteorological stations, and establishes a Sand-Dust Storm Prediction model; secondly, considering the influence of atmospheric movement on the occurrence of sand-dust storm, uses convolution neural network algorithm to analyze infrared satellite cloud images and establish a Sand-Dust Storm Prediction model; lastly, uses many methods; The target algorithm normalizes the output probabilities of two Sand-dust Storm Prediction models, and proposes a scalable Sand-dust Storm Prediction Method Based on improved Naive Bayesian CNN multi-objective classification algorithm. The algorithm and the prediction method of sandstorm provided by the invention comprehensively consider the influence of ground and atmospheric movement on the occurrence of sandstorm, and accord with the characteristics of sandstorm occurrence.

【技术实现步骤摘要】
一种基于改进的NaiveBayesian-CNN多目标分类算法的沙尘暴预测方法
本专利技术属于人工智能以及极端天气预测
,涉及沙尘暴的预测预报,特别涉及一种基于改进的NaiveBayesian-CNN多目标分类算法的沙尘暴预测方法。
技术介绍
在地球上的干旱地带,尤其是沙漠及其毗邻地区,常发生沙尘天气,严重的就是沙尘暴。这种自然现象自古而然,是特定的自然地理环境和气候条件使然。全世界只有欧洲未报导过发生沙尘暴,亚洲、非洲、美洲和澳大利亚都有沙尘暴,这和气候的长期且较有规律的和短期且比较无规律的变化有关。全球大面积干旱、沙漠化、洪水及冰冻等自然灾害对人类的威胁有频发和逐渐加重的趋势。根据联合国环境计划署公布,全球有35%的土地和20%的人口受到干旱、沙漠化的威胁。由此可见,沙尘暴已经对成为影响人类生存和发展的重要自然灾害。内蒙古中西部地区分布着6大沙漠和沙地,大部分地区地表干旱,降水少,冬春季多大风,是我国沙尘暴的主要源地之一。分析和研究该地区的沙尘暴对我国沙尘暴的研究和预测具有一定意义。因此,深入了解沙尘暴的发生规律和特点,分析研究各种天气气候因素对沙尘暴的影响以及沙尘暴的预测方法,较准确的预测沙尘暴,对防灾减灾,人民生活有着重要作用。随着沙尘暴的危害日益为广大民众、科研人员乃至政府决策机构所认识和重视,国内外针对中国北方沙尘暴的气候特征已做了不少研究,特别是近10年来我国科研人员对沙尘暴的地理分布和时间(尤其是年际和年代际)变化趋势进行了大量分析研究,由于所使用的资料、方法不尽相同,各人所得的结论也存在很大差异。卷积神经网络和朴素贝叶斯算法是非常重要的数据挖掘算法,将其应用于气象领域的数据分析和处理,探索各种气象要素间的内在联系,寻找各种潜在规律去揭示未知的气象理论,不但对气象科学研究很重要,而且在丰富天气预报方法、提高天气预报水平等方面产生积极重要的作用。目前,基于数据挖掘方法的气象预报技术是一个非常炙手可热的研究领域,具有较大的研究空间,尽管使用数据挖掘方法挖掘气象资料进行气象预报的文献不是很多,但国内外已经开始了这方面的研究工作,并且已经积累了不少的优秀成果,在气象预报的诸多方面已经取得了突破性的进展,但是由于很多理论和方法还是不够成熟,还有待探究出更多的更有效的气象数据挖掘方法来提高预报能力。
技术实现思路
为了克服上述基于统计的现有沙尘暴预测模型仅考虑沙尘暴发生时单一因素的缺点,本专利技术的目的在于提供一种基于改进的NaiveBayesian-CNN多目标分类算法的沙尘暴预测方法,针对沙尘暴预测问题,在满足沙尘暴预测准确率约束的条件下,不断优化模型,从而解决从空间三维视角解决预测沙尘暴问题,达到能够有效预测沙尘暴发生强度及发生位置的目标。为了实现上述目的,本专利技术采用的技术方案是:一种基于改进的NaiveBayesian-CNN多目标分类算法的沙尘暴预测方法,首先,考虑到大气运动因素对沙尘暴产生的影响,建立基于卷积神经网络算法的沙尘暴预测模型,考虑到地面气象因素对沙尘暴产生的影响,建立基于朴素贝叶斯算法的沙尘暴预测模型,然后,运用多目标算法,对两个模型进行归一化,得到基于改进的NaiveBayesian-CNN多目标分类算法的沙尘暴预测模型,最后,利用归一化得到的模型,求解在考虑地面气象因素和大气运动因素情况下的沙尘暴发生概率。所述基于卷积神经网络算法建立沙尘暴预测模型的建立流程如下:步骤1:对红外卫星云图进行标记,并制作数据源;步骤2:设置卷积神经网络拓扑结构及超参数;步骤3:用训练集训练神经网络,建立预测模型;步骤4:用测试集测试预测模型,分析预测模型预测准确率。所述步骤1中,卫星云图源自中国陆地区域云图(IR1),先将卫星云图格式转化为PNG,然后从中国强沙尘暴序列及其支撑数据集中找出站点数据,基于单站强沙尘暴标准,对查找出的站点数据进行分析,以每三十分钟为间隔,利用Hash函数对各个站点沙尘暴发生时间序列进行离散,分析各个时间点上沙尘暴等级,统计并分析所有站点在各个时间点上发生沙尘暴的最大强度,以时间为基准标记该时刻卫星拍摄的卫星云图,制作lmdb数据源,其中所述站点数据包括区站号、经度、纬度、年份、月份、日期、沙尘暴天气现象代码、沙尘暴开始时间、沙尘暴结束时间、能见度、十分钟平均最大风速、风向、极大风速。所述步骤4中,测试流程为:步骤4.1:输入带标签的测试集数据;步骤4.2:输出预测值;步骤4.3:比较预测值和实际值,统计预测准确率;步骤4.4:根据经验值设置预测准确值所处区间的合理范围;步骤4.5:分析实验结果。所述基于朴素贝叶斯算法建立沙尘暴预测模型的建立流程如下:步骤1:确定所有待分类数据的特征属性;步骤2:生成分类器,计算每个特征属性在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率估计,并将结果记录,计算公式如下:步骤3:使用分类器对待分类项进行分类,求得P(x|yi)P(yi)的最大值的yi作为x所属的类别。其中x={a1,a2...,am}为一个待分类项,而每个am为x的一个特征属性,具体包括气压、气温、降水量、蒸发量、相对湿度、风向风速、日照时数和0cm地温要素。类别集合C={y1,y2...,yn},而每个yn为C的一个特征属性,具体包括沙尘暴等级5、4、3、2、1。所述待分类数据包括气压、气温、降水量、蒸发量、相对湿度、风向风速、日照时数和0cm地温要素。运用多目标算法,对两个模型进行归一化,计算公式如下:P=αP(X)+(1-α)P(Y)(0<α<1)其中P(X)为测试数据输入到基于卷积神经网络建立预测模型,计算得出的沙尘暴发生概率;P(Y)为测试数据输入基于朴素贝叶斯算法建立预测模型,计算得出的沙尘暴发生概率;α为权重因子,α可以根据模型预测准确率确定,如果该模型预测准确率高,那么对应概率所赋予的权重就大,反之,则低。与现有的沙尘暴预测算法相比,本专利技术首先在基于“卷积神经网络算法”沙尘暴预测模型中,考虑到大气运动对沙尘暴产生的影响,对大气运动和沙尘暴发生强度之间进行详细的刻画;其次,在基于“朴素贝叶斯算法”沙尘暴预测模型中,考虑到地面气象因素,如:温度、气压等对沙尘暴产生的影响,对地面因素和沙尘暴发生强度之间进行详细的刻画;最后,运用多目标算法,把基于“卷积神经网络算法”的沙尘暴预测模型和基于“朴素贝叶斯算法”的沙尘暴预测模型进行归一化,提出了可扩展性强的沙尘暴预测算法,从而可以从空间三维角度研究沙尘暴发生规律。附图说明图1是改进的NaiveBayesian-CNN多目标分类算法流程图。图2是基于卷积神经网络算法的沙尘暴预测模型建立方法流程图。图3是基于朴素贝叶斯算法的沙尘暴预测模型建立方法流程图。图4是基于改进的NaiveBayesian-CNN多目标分类算法的沙尘暴预测模型训练过程。图5是基于改进的NaiveBayesian-CNN多目标分类算法的沙尘暴预测模型建立过程。具体实施方式下面结合附图和实施例详细说明本专利技术的实施方式。问题描述:在考虑地面气象因素和大气运动因素情况下,预测沙尘暴发生强度。时间复杂度约束:模型训练时间<=Tmax。空间复杂度约束:模型训练所需存储空间<=Smax。决策变量:在不同沙尘暴等本文档来自技高网
...

【技术保护点】
1.一种基于改进的Naive Bayesian‑CNN多目标分类算法的沙尘暴预测方法,其特征在于,首先,考虑到大气运动因素对沙尘暴产生的影响,建立基于卷积神经网络算法的沙尘暴预测模型,考虑到地面气象因素对沙尘暴产生的影响,建立基于朴素贝叶斯算法的沙尘暴预测模型,然后,运用多目标算法,对两个模型进行归一化,得到基于改进的Naive Bayesian‑CNN多目标分类算法的沙尘暴预测模型,最后,利用归一化得到的模型,求解在考虑地面气象因素和大气运动因素情况下的沙尘暴发生概率。

【技术特征摘要】
1.一种基于改进的NaiveBayesian-CNN多目标分类算法的沙尘暴预测方法,其特征在于,首先,考虑到大气运动因素对沙尘暴产生的影响,建立基于卷积神经网络算法的沙尘暴预测模型,考虑到地面气象因素对沙尘暴产生的影响,建立基于朴素贝叶斯算法的沙尘暴预测模型,然后,运用多目标算法,对两个模型进行归一化,得到基于改进的NaiveBayesian-CNN多目标分类算法的沙尘暴预测模型,最后,利用归一化得到的模型,求解在考虑地面气象因素和大气运动因素情况下的沙尘暴发生概率。2.根据权利要求1所述基于改进的NaiveBayesian-CNN多目标分类算法的沙尘暴预测方法,其特征在于,所述基于卷积神经网络算法建立沙尘暴预测模型的建立流程如下:步骤1:对红外卫星云图进行标记,并制作数据源;步骤2:设置卷积神经网络拓扑结构及超参数;步骤3:用训练集训练神经网络,建立预测模型;步骤4:用测试集测试预测模型,分析预测模型预测准确率。3.根据权利要求2所述基于改进的NaiveBayesian-CNN多目标分类算法的沙尘暴预测方法,其特征在于,所述步骤1中,卫星云图源自中国陆地区域云图(IR1),先将卫星云图格式转化为PNG,然后从中国强沙尘暴序列及其支撑数据集中找出站点数据,基于单站强沙尘暴标准,对查找出的站点数据进行分析,以每三十分钟为间隔,利用Hash函数对各个站点沙尘暴发生时间序列进行离散,分析各个时间点上沙尘暴等级,统计并分析所有站点在各个时间点上发生沙尘暴的最大强度,以时间为基准标记该时刻卫星拍摄的卫星云图,制作lmdb数据源,其中所述站点数据包括区站号、经度、纬度、年份、月份、日期、沙尘暴天气现象代码、沙尘暴开始时间、沙尘暴结束时间、能见度、十分钟平均最大风速、风向、极大风速。4.根据权利要求2所述基于改进的NaiveBayesian-CNN多目标分类算法的沙尘暴预测方法,其特征在于,所述步骤4中,测试流程为:步骤4.1:输入带标签的测试集数据;步骤4.2:输出预测值;步骤4.3:比较预测值和实际值,统计预...

【专利技术属性】
技术研发人员:仁庆道尔吉李天成李娜邱莹
申请(专利权)人:内蒙古工业大学
类型:发明
国别省市:内蒙古,15

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1