当前位置: 首页 > 专利查询>山东大学专利>正文

基于聚类-回归算法的近岸海域叶绿素a浓度预测方法技术

技术编号:23559016 阅读:85 留言:0更新日期:2020-03-25 04:24
本发明专利技术公开了基于聚类‑回归算法的近岸海域叶绿素a浓度预测方法,首先对近岸海域环境监测数据集进行预处理;然后选择聚类模型,对预处理所得数据集进行聚类计算,根据聚类结果将近岸海域划分为一组分区;对每一个分区,基于回归算法实现叶绿素a浓度的预测。本发明专利技术所述方法面向近岸海域,可实现对近岸海域未来一个月及以上时间段叶绿素a浓度的预测。

Prediction method of chlorophyll a concentration in coastal waters based on clustering regression algorithm

【技术实现步骤摘要】
基于聚类-回归算法的近岸海域叶绿素a浓度预测方法
本公开涉及海洋环境研究
,特别是涉及近岸海域叶绿素a浓度预测方法。
技术介绍
本部分的陈述仅仅是提到了与本公开相关的
技术介绍
,并不必然构成现有技术。水体富营养化是我国海域水质退化的主要问题,研究表明,叶绿素a(简写为Chl-a)的含量是衡量海洋初级生产力的重要指标,同时也是水体理化性质动态变化的综合反映,Chl-a浓度的变化情况间接反映了水体富营养化现象的变化。因而,Chl-a浓度的预测对预防近岸海域水体富营养化和保护海域生态环境具有重要意义。在实现本公开的过程中,专利技术人发现现有技术中存在以下技术问题:由于近岸海域是一个复杂的开放性系统,受风向、洋流、水质因子以及海域功能区划、沿岸人类活动等因素影响较大,因而近岸海水Chl-a浓度的预测研究比较复杂。已有的Chl-a数值预测方法面向非近岸海域水体,如:河流、湖泊、室内水体等,不适用于近岸海域。
技术实现思路
为了解决现有技术的不足,本公开提供了基于聚类-回归算法的近岸海域叶绿素a浓度预测方法。基于聚类-回归算法的近岸海域叶绿素a浓度预测方法,包括:步骤1:获取待预测近岸海域的环境监测数据集,对所述数据集进行预处理;步骤2:基于聚类算法,对步骤1预处理所得数据集进行聚类计算,根据聚类结果将待预测近岸海域划分为若干个分区;步骤3:对步骤2划分后的每一个分区,基于回归算法实现该分区叶绿素a浓度的预测。与现有技术相比,本公开的有益效果是:1.本专利技术所述方法面向近岸海域,可对近岸海域未来一个月及以上时间跨度的Chl-a浓度进行预测,且具有较高的预测准确度。2.本专利技术所述方法兼顾近岸海域的理化因子、生物因子、水文气象、功能使用、人类活动强度等叶绿素-a浓度的相关信息。3.本专利技术所述方法具有空间和时间属性,首先通过聚类算法实现细粒度、数据级的近岸海域划分,体现其空间属性;然后,基于回归算法实现海域Chl-a浓度的预测,体现其时间属性。说明书附图构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1为一个实施例的工作原理示意图;图2为一个实施例的数据预处理示意图;图3为一个实施例基于聚类算法的近岸海域区域划分示意图;图4为一个实施例基于回归算法的近岸海域Chl-a浓度预测示意图。具体实施方式应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作和/或它们的组合。实施例,本实施例提供了基于聚类-回归算法的近岸海域叶绿素a浓度预测方法实例;如图1所示,基于聚类-回归算法的近岸海域叶绿素a浓度预测方法,包括:S1:获取待预测近岸海域的环境监测数据集,对所述数据集进行预处理;S2:基于聚类算法,对S1预处理所得数据集进行聚类计算,根据聚类结果将待预测近岸海域划分为若干个分区;S3:对S2划分后的每一个分区,基于回归算法实现该分区叶绿素a浓度的预测。应理解的,所述近岸海域,是指:近海岸20米水深线以内海域。作为一个或多个实施例,如图2所示,所述S1中,获取待预测近岸海域的环境监测数据集,对所述数据集进行预处理,得到对Chl-a浓度具有重要影响的近岸海域环境数据;具体步骤包括:S101:获取待预测近岸海域的环境监测数据集D;S102:对数据集D进行去重处理;S103:对去重处理后的数据进行特征选择,删除缺失率大于限定阈值的特征;S104:对特征选择后的数据进行周期下采样;S105:对下采样后仍然缺失的数据值进行插值处理;S106:构造新特征,将新特征纳入数据集;S107:对数据集进行归一化处理;S108:对归一化后的数据集进行特征重要性分析,剔除重要性低的特征,最后得到预处理后的数据集D′。应理解的,所述S101中,所述近岸海域环境监测数据,包括:各个监测站的水质监测数据和气象监测数据;所述水质监测数据,包括:采样年份、采样季度、采样深度、采样时间对应的Chl-a浓度、pH值、盐度、溶解氧浓度、化学需氧量、无机磷浓度、亚硝酸盐浓度、硝酸盐浓度、铵盐浓度、无机氮浓度、石油含量、总氮、总磷、硅酸盐浓度或悬浮物浓度;所述气象监测数据,包括:采样时间对应的水温、透明度、风速、风向、水色、水况或光照强度。应理解的,所述S104中,所述周期下采样,可采用平均法等方法。应理解的,所述S105中,所述插值处理,可采用线性插值等方法。进一步地,所述S106中,构造新特征是将具有相关性的特征数据,通过数学运算,以其运算结果作为新特征;例如:将无机氮DIN与无机磷DIP两个特征通过除法运算,构造出无机氮与无机磷的比例DIN/DIP,DIN/DIP即为新特征。进一步地,所述S106中,构造的新特征包括:无机氮与无机磷的比例、无机氮与硅酸盐的比例、无机磷与硅酸盐的比例、硝酸盐与亚硝酸盐的比例、铵盐与硝酸盐的比例、铵盐与亚硝酸盐的比例。应理解的,所述S107中,数据归一化处理,可采用min-max或z-score等方法。进一步地,所述S108中,所述特征重要性分析,包括:对于任意特征C,采用XGBOOST和随机森林算法进行重要性分析,分别得到重要性评分C_XGBOOST和C_RF,采用C_XGBOOST和C_RF的平均值作为特征C的重要性评分;按照重要性评分进行排序,删除评分低于设定阈值的特征。作为一个或多个实施例,如图3所示,所述S2中,基于聚类算法,对S1预处理所得数据进行聚类计算,根据聚类结果将待预测近岸海域划分为若干个分区;具体步骤包括:S201:选取数据聚类模型M;S202:根据所选取的数据聚类模型M,对预处理得到的数据进行聚类计算;S203:根据聚类结果将待预测近岸海域划分为若干个分区;其中,每一个分区均包含至少一个环境监测站。进一步地,所述S201中,数据聚类模型的选取范围,包括但不限于:K均值聚类模型、层次聚类模型和高斯混合聚类模型。进一步地,所述S201中,选取数据聚类模型的方法,包括:确定聚类模型评估函数;按照评估函数计算各个聚类模型的评估分值;选择具有最优评估分值的聚类模型作为近岸海域区域划分聚类模型M;应理解的,评估函数可采用CH(Calinski-Harabasz本文档来自技高网
...

【技术保护点】
1.基于聚类-回归算法的近岸海域叶绿素a浓度预测方法,其特征是,包括:/nS1:获取待预测近岸海域的环境监测数据集,对所述数据集进行预处理;/nS2:基于聚类算法,对S1所得数据集进行聚类计算,根据聚类结果将待预测近岸海域划分为若干个分区;/nS3:对S2划分后的每一个分区,基于回归算法实现该分区叶绿素a浓度的预测。/n

【技术特征摘要】
1.基于聚类-回归算法的近岸海域叶绿素a浓度预测方法,其特征是,包括:
S1:获取待预测近岸海域的环境监测数据集,对所述数据集进行预处理;
S2:基于聚类算法,对S1所得数据集进行聚类计算,根据聚类结果将待预测近岸海域划分为若干个分区;
S3:对S2划分后的每一个分区,基于回归算法实现该分区叶绿素a浓度的预测。


2.如权利要求1所述的方法,其特征是,获取待预测近岸海域的环境监测数据集,对所述数据集进行预处理,得到对Chl-a浓度具有重要影响的近岸海域环境数据;具体步骤包括:
S101:获取待预测近岸海域的环境监测数据集D;
S102:对数据集D进行去重处理;
S103:对去重处理后的数据进行特征选择,删除缺失率大于限定阈值的特征;
S104:对特征选择后的数据进行周期下采样;
S105:对下采样后仍然缺失的数据值进行插值处理;
S106:构造新特征,将新特征纳入数据集;
S107:对数据集进行归一化处理;
S108:对归一化后的数据集进行特征重要性分析,剔除重要性低的特征,最后得到预处理后的数据集D′。


3.如权利要求1所述的方法,其特征是,基于聚类算法,对S1所得数据集进行聚类计算,根据聚类结果将待预测近岸海域划分为若干个分区;具体步骤包括:
S201:选取数据聚类模型;
S202:根据所选取的数据聚类模型,对预处理得到的数据进行聚类计算;
S203:根据聚类结果将待预测近岸海域划分为若干个分区;其中,每一个分区均包含至少一个环境监测站。


4.如权利要求1所述的方法,其特征是...

【专利技术属性】
技术研发人员:程杰贾潍佳
申请(专利权)人:山东大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1