一种基于支持向量机与KNN相结合的水质预测方法技术

技术编号:22884965 阅读:15 留言:0更新日期:2019-12-21 07:39
一种基于SVM-KNN的水质预测方法,包括以下步骤:1)对采集到的水质数据进行预处理;2)使用K‑近邻算法对数据进行预分类;3)建立支持向量机回归模型,通过k折交叉验证算法选取水质数据预测模型的最优化参数,并应用到模型中;4)训练模型,以温度和pH值为预测目标,对预测效果评估。本发明专利技术提出的将KNN与支持向量机相结合的水质预测方法,采用支持向量机(SVM)与最近邻算法(KNN)相结合的方法实现对水质时间序列的预测,旨在改善预测准确度,属于水质预测方法技术领域,成功的实现了水质的准确预测。

A water quality prediction method based on the combination of support vector machine and KNN

【技术实现步骤摘要】
一种基于支持向量机与KNN相结合的水质预测方法
本专利技术涉及环境污染水质监测
,尤其涉及一种基于支持向量机(SVM)与KNN相结合的水质预测方法。
技术介绍
生态兴,则文明兴。近年来,随着工业化程度的加深,工业、农业和生活污水的排放,严重破坏了环境,水污染问题已经与国民的生命健康息息相关了。水质预测是水资源管理和水资源控制的重要方法,对及时掌握水质变化的发展趋势,为水质预测预警和水污染的治理提供重要的科学依据和技术支持。随着物联网技术的兴起和大数据时代的到来,人工智能算法成为了当前的研究热点,基于智能算法的预测,在水质预测中得到了广泛的应用,主要有人工神经网络、支持向量机等有监督的学习算法,还有像聚类这种无监督的学习算法。支持向量机是以统计学理论为基础的,具有严格的数学基础。它是基于结构风险最小化原则,保证了良好的泛化能力,因此在模式识别、回归分析、函数估计、时间序列预测等领域得到广泛的引用。目前,支持向量机在水质预测上的应用主要采用回归的功能。现有技术中,XiangYunrong等人提出了最小二乘支持向量机与粒子群混合优化算法,通过粒子群实现了最小二乘支持向量机的参数调整,对该流域水质进行时间序列预测,提高了算法效率与预测能力。Li等人通过光谱分析法针对性地选择好的训练采样器,优化了基于最小二乘支持向量机的非线性建模方法,提高了模型的精度和计算过程的时间。程庭莉等人对于所提的基于支持向量机水质预测模型,其参数优化选择了自适应遗传算法,通过变种群数提升了参数优化的效率。梁坚等人的研究解决了SVM预测模型中参数选择的问题,在水质预测模型求解中融合了小波变化技术以及支持向量回归机,利用小波分析来提取水质数据有用的信息,优化参数选择。但上述现有技术并没有对于水质预测上起到明显精准预测的有益效果,为了能防范于未然,面对目前复杂的水质环境,亟需提供一种有效的进行水质预测的方法。
技术实现思路
为了克服现有的水质预测方法的预测精度较低的不足,本专利技术提出一种预测精度较高的基于支持向量机与KNN相结合的水质预测方法。本专利技术解决其技术问题所采用的技术方案是:一种基于支持向量机与KNN相结合的水质预测方法,所述方法包括以下步骤:1)利用机器仿生鱼采集水质数据,并对数据进行预处理,建立样本数据集;2)采用K-近邻算法对水质数据预分类;3)建立支持向量机回归模型,通过k折交叉验证算法选取最优化参数,构建最优化支持向量机回归模型;4)训练得到最优化水质预测模型,对温度和pH值进行预测,并对预测效果进行评估。进一步,所述步骤1)中,数据预处理包括以下过程:步骤101,将提取到的数据转化格式,并以时间序列排序;步骤102,使用3σ准则对数据进行异常值检测,将数据偏离3倍标准差以上的作为异常值,进行剔除;步骤103,由于不同的参数基本单位相差较大,对数据进行标准化处理,本专利技术采用离差标准化,通过线性变换缩小到[0,1]区间,公式如下,其中xmin为样本最小值,xmax为样本最大值,x为样本值,x*为标准化后的样本值;步骤104,将样本数据集划分为训练集和测试集。再进一步,步所述骤2)中,K-近邻算法进行数据预分类包括以下过程;步骤201,构建KNN模型,输入训练样本,进行训练,根据温度与pH值进行分类;步骤202,此时已知样本集X={x1,x2,…xn}中xi所对应的所属类别,当测试样本输入时,计算该点与最近的k个点的距离,采用多数表决法,有k个点的类别决定新样本点的类别。更进一步,所述步骤2)中,K-近邻算法进行数据预分类的多数表决法如式所示,其中对于vj为类别V的第j个标签,f(yi)为新标签样本,当vj=f(yi)时,δ(vj,f(yi))=1,否则为0。最终得出待分类样本yi的类别所述步骤3)中,构建最优化支持向量机模型包括以下过程:步骤301,首先将水质数据集分为k个集合,每个集合都会轮流作为测试集,剩余集合则作为训练集,这样重复进行k次训练与测试,保证每个集合都作为测试集将被验证过一次;步骤302,计算并比较k次训练的平均交叉验证正确率,选取交叉验证正确率最高的一组参数,这个参数(C,g)将作为k折交叉验证的最优值应用到支持向量机回归预测中,其中惩罚参数C控制了模型结构风险与经验风险的相对比重,决定了模型的优越性,预测模型选取g为径向基核函数,如式步骤303,将参数应用到模型中,构建最优化模型,根据温度与pH值进行时间序列的预测。所述步骤5)中,对模型预测效果进行评估包括以下过程:采用平均相对误差值MAPE、均方根误差RMSE及纳什效率系数NSE三个指标构建模型预测效果评价体系,三个评价方式公式如下,平均相对误差:均方根误差:纳什效率系数:其中yi为实际检测值,为预测值,表示实际检测值的平均值,n为检测次数,N为样本总个数。本专利技术的技术构思是,提出了将KNN算法与支持向量机相结合,利用机器仿生鱼采集到的水质数据,进行数据预处理,然后采用KNN算法对数据进行预分类,进一步利用支持向量机的方法对数据进行预测。本专利技术的有益效果主要表现在:将两种方法结合在一起,成功的进行了预测,并且相较于传统的基于支持向量机的方法,取得了更优的预测效果。附图说明图1是一种基于支持向量机与KNN相结合的水质预测方法的流程图。具体实施方式下面结合附图对本专利技术做进一步说明,参照图1,一种基于支持向量机与KNN相结合的水质预测方法,包括以下步骤:1)利用机器仿生鱼采集水质数据,并对数据进行预处理,建立样本数据集;2)采用K-近邻算法对水质数据预分类;3)建立支持向量机回归模型,通过k折交叉验证算法选取最优化参数,构建最优化支持向量机回归模型;4)训练得到最优化水质预测模型,对温度和pH值进行预测,并对预测效果进行评估。进一步,所述步骤1)中,数据预处理包括以下过程:步骤101,将提取到的数据转化格式,并以时间序列排序;步骤102,使用3σ准则对数据进行异常值检测,将数据偏离3倍标准差以上的作为异常值,进行剔除;步骤103,由于不同的参数基本单位相差较大,对数据进行标准化处理,本专利技术采用离差标准化,通过线性变换缩小到[0,1]区间,公式如下,其中xmin为样本最小值,xmax为样本最大值,x为样本值,x*为标准化后的样本值;步骤104,将样本数据集划分为训练集和测试集。再进一步,所述步骤2)中,K-近邻算法进行数据预分类包括以下过程;步骤201,构建KNN模型,输入训练样本,进行训练,根据温度与pH值进行分类;步骤202,此时已知样本集X={x1,x2,…xn}中xi所对应的所属类别,当测试样本输入时,计算该点与最近的k个点的距离,采用多数表决法本文档来自技高网
...

【技术保护点】
1.一种基于支持向量机与KNN相结合的水质预测方法,其特征在于,所述方法包括以下步骤:/n1)利用机器仿生鱼采集水质数据,并对数据进行预处理,整理出符合实验要求的数据;/n2)利用K-近邻方法对水质数据预分类;/n3)建立支持向量机回归模型,通过k折交叉验证算法选取最优化参数,构建最优化支持向量机回归模型;/n4)训练得到最优化水质预测模型,对温度和pH值进行预测,并对预测效果进行评估。/n

【技术特征摘要】
1.一种基于支持向量机与KNN相结合的水质预测方法,其特征在于,所述方法包括以下步骤:
1)利用机器仿生鱼采集水质数据,并对数据进行预处理,整理出符合实验要求的数据;
2)利用K-近邻方法对水质数据预分类;
3)建立支持向量机回归模型,通过k折交叉验证算法选取最优化参数,构建最优化支持向量机回归模型;
4)训练得到最优化水质预测模型,对温度和pH值进行预测,并对预测效果进行评估。


2.如权利要求1所述的一种基于支持向量机与KNN相结合的水质预测方法,其特征在于,所述步骤1)中,数据预处理包括以下过程:
步骤101,将提取到的数据转化格式,并以时间序列排序;
步骤102,使用3σ准则对数据进行异常值检测,将数据偏离3倍标准差以上的作为异常值,进行剔除;
步骤103,由于不同的参数基本单位相差较大,对数据进行标准化处理,本发明采用离差标准化,通过线性变换缩小到[0,1]区间,公式如下,



其中xmin为样本最小值,xmax为样本最大值,x为样本值,x*为标准化后的样本值;
步骤104,将样本数据集划分为训练集和测试集。


3.如权利要求1或2所述的一种基于支持向量机与KNN相结合的水质预测方法,其特征在于,所述步骤2)中K-近邻方法进行数据预分类包括以下过程:
步骤201,构建KNN模型,输入训练样本,进行训练,根据温度与pH值进行分类;
步骤202,此时已知样本集X={x1,x2,…xn}中xi所对应的所属类别,当测试样本输入时,计算该点与最近的k个点的距离,本采用多数表决法,有k个点的类别决定新样本点的类...

【专利技术属性】
技术研发人员:洪榛李涛涛潘晓曼刘燕娜
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1