雾霾天气预测方法技术

技术编号:30019188 阅读:17 留言:0更新日期:2021-09-11 06:34
本发明专利技术公开了一种雾霾天气预测方法,包括:采集历史雾霾数据,得到样本集和测试集,并进行集成特征选择,得到集成特征集;改进支持向量机的核函数应用到支持向量机中,得到多核支持向量机;将模糊支持向量机和最小二乘支持向量机相结合引入至多核支持向量机中,以构建模糊多核最小二乘支持向量机;利用集成特征集对模糊多核最小二乘支持向量机进行训练,得到模糊多核最小二乘支持向量机预测模型;改进萤火虫算法对模糊多核最小二乘支持向量机进行参数优化,得到最优模糊多核最小二乘支持向量机预测模型;将测试集输入预测模型中得到预测结果。该方法避免了核函数对支持向量机性能的影响,提高了支持向量机的分类准确率、预测精度和鲁棒性。度和鲁棒性。度和鲁棒性。

【技术实现步骤摘要】
雾霾天气预测方法


[0001]本专利技术涉及气象预测
,特别涉及一种基于改进的萤火虫算法和模糊多核最小二乘支持向量机的雾霾天气预测方法。

技术介绍

[0002]随着经济水平日益快速的发展和城市化进程的不断加快,环境问题也随之而来。例如雾霾天气在多地区频繁爆发,给人们的生活、出行和健康都带来不同程度的影响,因此对雾霾天气进行预测具有十分重要的意义。
[0003]目前的预测模型有很多,可以分为统计模型和机器学习模型。统计模型是基于对历史数据的统计分析进行预测,然雾霾天气预测是一个非线性的复杂问题,很难满足所有假设问题。机器学习模型不依赖于自变量与应变量之间精确的数学公式,可以在没有求解问题的先验知识的情况下求解任何复杂的函数,具有很强的鲁棒性和预测能力。因此选用机器学习模型进行雾霾天气预测。
[0004]支持向量机在分类预测领域性能优越,因核函数的应用能够很好处理非线性问题,计算复杂性低可避免维数灾难,是基于结构风险最小化且能得到全局最优解,因此选用支持向量机模型进行雾霾预测。但支持向量机的分类性能往往受到核函数和核参数的影响,以及噪音对数据的影响、学习模型的计算复杂度等等都会对支持向量机的性能、求解速度和预测精度产生不利的影响。

技术实现思路

[0005]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006]为此,本专利技术的目的在于提出一种雾霾天气预测方法,该方法能够取得更为理想的分类预测效果。
[0007]为达到上述目的,本专利技术实施例提出了雾霾天气预测方法,包括以下步骤:步骤S1,采集历史雾霾数据,并对所述历史雾霾数据进行归一化处理,得到样本集数据和测试集数据;步骤S2,对所述样本集数据进行集成特征选择,得到集成特征集;步骤S3,改进支持向量机的核函数应用到支持向量机中,得到多核支持向量机;步骤S4,将模糊支持向量机和最小二乘支持向量机相结合引入至所述多核支持向量机中,以构建模糊多核最小二乘支持向量机;步骤S5,利用所述集成特征集对所述模糊多核最小二乘支持向量机进行训练,得到模糊多核最小二乘支持向量机预测模型;步骤S6,改进萤火虫算法,以对所述模糊多核最小二乘支持向量机进行参数优化,得到最优模糊多核最小二乘支持向量机预测模型;步骤S7,将所述测试集数据输入所述最优模糊多核最小二乘支持向量机预测模型中,经过计算后得到预测结果。
[0008]本专利技术实施例的雾霾天气预测方法,通过多核学习方法构建组合核函数,避免核函数的选取对支持向量机性能的影响;其次对标准支持向量机提出改进,建立模糊多核最小二乘支持向量机模型,提高支持向量机的分类准确率和预测精度;最后对标准萤火虫算
法的种群多样性、移动步长和局部搜索能力提出改进,将改进后的萤火虫算法优化支持向量机的参数,进一步增强了支持向量机的鲁棒性和预测能力;最终能够取得更为理想的雾霾天气预测效果。
[0009]另外,根据本专利技术上述实施例的雾霾天气预测方法还可以具有以下附加的技术特征:
[0010]进一步地,在本专利技术的一个实施例中,所述步骤S2具体包括:步骤S201,利用最大信息系数和关联信息熵度量去除所述样本集数据的无关特征和冗余特征,得到第一特征子集;步骤S202,采用最大相关最小冗余算法去除所述样本集数据的无关特征和冗余特征,得到第二特征子集;步骤S203,采用遗传算法搜索策略对所述样本集数据进行特征选择,得到第三特征子集;步骤S204,将所述第一特征子集、所述第二特征子集和所述第三特征子集进行集成,得到所述集成特征集。
[0011]进一步地,在本专利技术的一个实施例中,所述步骤S201中采用两阶段特征选择算法包括相关性分析阶段和冗余性分析阶段,先利用所述最大信息系数去除无关特征,再利用所述关联信息熵去除冗余特征。
[0012]进一步地,在本专利技术的一个实施例中,所述多核支持向量机中的多核函数K(x,y)为:
[0013]K(x,y)=αK
rbf
(x,y)+(1

α)K
poly
(x,y)
[0014]其中,K
rbf
(x,y)为径向基核函数,K
poly
(x,y)为多项式核函数,α为权重系数,α∈[0,1]。
[0015]进一步地,在本专利技术的一个实施例中,所述步骤S4具体包括:
[0016]步骤S401,根据所述样本集数据建立所述多核支持向量机的决策函数:
[0017][0018]其中,ω为支持向量机分类超平面的法向量,b为截距;
[0019]步骤S402,将最小二乘法引入所述多核支持向量机的决策函数中,得到多核最小二乘支持向量机的决策函数:
[0020][0021]其中,ω为支持向量机分类超平面的法向量,b为截距,C为惩罚因子,e
i
为训练误差;
[0022]步骤S403,将模糊隶属度引入所述最小二乘支持向量机的决策函数中,得到模糊多核最小二乘支持向量机的决策函数:
[0023][0024]其中,μ
i
为模糊隶属度值,μ
i
∈(0,1)。
[0025]进一步地,在本专利技术的一个实施例中,所述步骤S5中改进后的萤火虫算法为:
[0026]利用精英选择策略和反向学习初始化萤火虫种群;
[0027]加入指数因子设置自适应步长,改进后的位置更新公式为:
[0028]x
j
(t+1)=ω
·
x
j
(t)+β
ij
(r
ij
)(x
i
(t)

x
j
(t))+αε
[0029]其中,指数因子ω=1

e
t/T
,t为当前迭代次数,T为总的迭代次数;
[0030]混沌局部搜索策略动态初始化惰性粒子,惰性粒子的位置更新公式为:
[0031]x
t+1
=x
min
+H
i+1
(x
max

x
min
)
[0032]其中,x
t+1
为惰性粒子的位置变量,H
i+1
为混沌粒子变量。x
max
为粒子移动的最大值,x
min
为最小值。
[0033]进一步地,在本专利技术的一个实施例中,还包括:步骤S8,利用所述集成特征集对所述优化后的模糊多核最小二乘支持向量机预测模型进行验证,评估所述最优模糊多核最小二乘支持向量机预测模型的性能。
[0034]本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0035]本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0036本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种雾霾天气预测方法,其特征在于,包括以下步骤:步骤S1,采集历史雾霾数据,并对所述历史雾霾数据进行归一化处理,得到样本集数据和测试集数据;步骤S2,对所述样本集数据进行集成特征选择,得到集成特征集;步骤S3,改进支持向量机的核函数应用到支持向量机中,得到多核支持向量机;步骤S4,将模糊支持向量机和最小二乘支持向量机相结合引入至所述多核支持向量机中,以构建模糊多核最小二乘支持向量机;步骤S5,利用所述集成特征集对所述模糊多核最小二乘支持向量机进行训练,得到模糊多核最小二乘支持向量机预测模型;步骤S6,改进萤火虫算法,以对所述模糊多核最小二乘支持向量机进行参数优化,得到最优模糊多核最小二乘支持向量机预测模型;步骤S7,将所述测试集数据输入所述最优模糊多核最小二乘支持向量机预测模型中,经过计算后得到预测结果。2.根据权利要求1所述的雾霾天气预测方法,其特征在于,所述步骤S2具体包括:步骤S201,利用最大信息系数和关联信息熵度量去除所述样本集数据的无关特征和冗余特征,得到第一特征子集;步骤S202,采用最大相关最小冗余算法去除所述样本集数据的无关特征和冗余特征,得到第二特征子集;步骤S203,采用遗传算法搜索策略对所述样本集数据进行特征选择,得到第三特征子集;步骤S204,将所述第一特征子集、所述第二特征子集和所述第三特征子集进行集成,得到所述集成特征集。3.根据权利要求1所述的雾霾天气预测方法,其特征在于,所述步骤S201中采用两阶段特征选择算法包括相关性分析阶段和冗余性分析阶段,先利用所述最大信息系数去除无关特征,再利用所述关联信息熵去除冗余特征。4.根据权利要求1所述的雾霾天气预测方法,其特征在于,所述多核支持向量机中的多核函数K(x,y)为:K(x,y)=αK
rbf
(x,y)+(1

α)K
poly
(x,y)其中,K
rbf
(x,y)为径向基核函数,K
poly
(x,y)为多项式核函数,α为权重系数,α∈[0,1]。5.根据权利要求1所述的雾霾天气预测方法,其特征在于,所述步骤S4具体包括...

【专利技术属性】
技术研发人员:陈海龙张颖宇杨畅杜梅
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1