System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于Ordinal Forests模型的水华级别早期预警方法技术_技高网
当前位置: 首页 > 专利查询>厦门大学专利>正文

一种基于Ordinal Forests模型的水华级别早期预警方法技术

技术编号:41400517 阅读:5 留言:0更新日期:2024-05-20 19:25
本发明专利技术公开了一种基于Ordinal Forests模型的水华级别早期预警方法,包括以下步骤:S1、对水质水生态在线监测系统的水质数据进行预处理;S2、根据叶绿素a值,对预处理后的水质数据划分水华级别;S3、应用重采样方法解决水华级别数据不平衡问题,合成水华级别平衡的数据集;S4、基于Ordinal Forests模型以步骤S3新合成的数据集作为输入变量,构建水华级别早期预警模型,利用训练后的水华级别早期预警模型进行水华级别早期预警;该方法直接易用,在处理次序数据和不平衡数据时有明显的优势,能有效提升饮用水水源地的水华预警精度。

【技术实现步骤摘要】

本专利技术涉及水质监测处理,具体涉及一种基于ordinal forests模型的水华级别早期预警方法。


技术介绍

1、当前在线监测系统可以实时反映水库水质的情况,开发水华的预测模型是改善水库水华管理和预警的关键步骤。在《水华遥感与地面监测评价技术规范》(hj 1098-2020)中,根据藻密度的高低,水华程度被分为五个级别。因此,基于等级的预测能够准确反映水体当前的水华状况与未来水华程度的变化趋势。水库管理者可以根据预测结果及时采取措施,保障饮用水资源安全,防治水华事件的发生。因此,对水华级别进行准确预测和预警,对水库管理与水华防治有重要的意义。

2、水华预测常采用机器学习模型,其预测对象通常为连续变量,而水华级别作为预测对象属于分类变量。然而水华级别不同于一般的分类数据,属于序数数据,即各个类别之间存在典型的次序关系。在对序数数据进行预测时,常规的机器学习模型在识别类别间的次序关系时具有局限性,经典的次序回归模型在处理高维数据时具有局限性。因此,应用一种能够处理高维数据的次序机器学习模型,对于提高水华级别预测的准确性至关重要。


技术实现思路

1、本专利技术的目的在于提供一种基于ordinal forests模型的水华级别早期预警方法,该方法直接易用,在处理次序数据和不平衡数据时有明显的优势,能有效提升饮用水水源地的水华预警精度。

2、为实现上述目的,本专利技术采用以下技术方案:

3、一种基于ordinal forests模型的水华级别早期预警方法,包括以下步骤:

4、s1、对水质水生态在线监测系统的水质数据进行预处理;

5、步骤s1中所述水质数据的预处理方法具体步骤为:

6、s11、对水质数据进行质量控制,包括剔除类型异常数据、剔除重复数据和数据重采样;

7、s12、对水质数据进行缺失值处理,采用卡尔曼滤波法填补缺失值,通过不断地融合测量值和状态估计,逐步提高状态估计的准确性,完成缺失值填充;

8、s13、应用主成分分析的方法,对水质数据进行特征选择;

9、s14、对水质数据进行标准化处理,计算公式为:其中,是标准化后的数据;是实测数据;是数据集的平均值;是数据集的标准差;

10、s2、根据叶绿素 a值,对预处理后的水质数据划分水华级别;

11、s3、应用重采样方法解决水华级别数据不平衡问题,合成水华级别平衡的数据集;

12、s4、基于ordinal forests模型以步骤s3新合成的数据集作为输入变量,构建水华级别早期预警模型,利用训练后的水华级别早期预警模型进行水华级别早期预警;

13、步骤s4的具体过程为:

14、s41、对步骤s3新合成的数据集采取五折交叉验证的方法划分数据集,将新合成的数据集划分为5等份,5折反复轮流,每轮都选定1等分的数据集作为测试集,其他的数据汇总作为训练集;

15、s42、在超参数给定的情况下,应用训练集数据训练ordinal forests模型。ordinal forests是一种用于解决响应变量为序数数据的机器学习模型,它假设存在一个潜在的连续变量y*以替代类别值y,通过最大化袋外误差(out-of-bag,oob)预测性能来优化y*值。在模型训练阶段,使用前一天的水华级别和水质数据作为模型的输入变量,当天的水华级别作为模型的输出变量,实现基于ordinal forests方法的水华级别早期预警模型的构建;

16、s43、将测试集数据输入水华级别早期预警模型,应用准确性和一致性评估训练好的水华级别早期预警模型性能,调整水华级别早期预警模型的超参数;

17、s44、将训练好的水华级别早期预警模型应用到水质监测站点,每天采取相同的步骤进行水质数据预处理和水华级别划分,将前一天的水华级别和水质数据作为输入变量输入到水华级别早期预警模型中,得到当地每日的水华等级预报单。

18、优选地,步骤s1中所述水质数据包括叶绿素 a浓度数据、ph数据、水温数据、电导率数据、浊度数据、溶解性无机氮数据和溶解性无机磷数据。

19、优选地,步骤s11中所述剔除类型异常数据是将非数值型数据剔除,其中,非数值型数据包括字符和空值;所述剔除重复数据是将时间戳重复的数据剔除;所述数据重采样是通过取中位数的方法将数据频率统一为天频。

20、优选地,步骤s13的具体过程为:

21、s131、对原始水质数据进行中心化与标准化处理,使得每个特征的均值为0,方差为1;

22、s132、计算标准化后的数据的协方差矩阵,再对协方差矩阵进行特征值分解,得到特征值和对应的特征向量;

23、s133、根据特征值的大小选择保留的主成分个数,选择出建模所需特征。

24、优选地,步骤s2中所述划分水华级别的具体过程为:

25、s21、基于对水库野外观测的水体透明度变化数据,观察叶绿素浓度变化和各个物理指标之间的关系;其中,所述物理指标包括水体颜色和透明度;

26、s22、结合相关标准,将水华风险程度级别按总叶绿素 a浓度划分为五级:

27、ⅰ 级:叶绿素 a值 ≤ 10  μg/l,无水华,水质情况良好;

28、ⅱ 级:10  μg/l < 叶绿素 a值 ≤ 15  μg/l,预警警告,存在水华发生的潜在风险;

29、ⅲ 级:15  μg/l < 叶绿素 a值 ≤ 50  μg/l,轻度水华,水体出现明显的水华事件;

30、ⅳ 级:50  μg/l < 叶绿素 a值 ≤ 100 μg/l,重度水华,水华事件对生态系统构成严重威胁;

31、ⅴ 级:叶绿素 a值 > 100 μg/l,水华灾害,水华灾害易造成极为严重的生态、社会和经济影响。

32、优选地,步骤s3的具体过程为:

33、s31、依据步骤s2标准分级后的水华级别数据,统计每个水华级别的类别总量,确定调整前的数据不平衡比率;

34、s32、对水华级别数据应用自适应合成采样合成新的数据集,针对水华级别数据不同类别的样本数量差异,进行数据平衡计算;所述本文档来自技高网...

【技术保护点】

1.一种基于Ordinal Forests模型的水华级别早期预警方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于Ordinal Forests模型的水华级别早期预警方法,其特征在于:步骤S1中所述水质数据包括叶绿素a浓度数据、pH数据、水温数据、电导率数据、浊度数据、溶解性无机氮数据和溶解性无机磷数据。

3.如权利要求1所述的一种基于Ordinal Forests模型的水华级别早期预警方法,其特征在于:步骤S11中所述剔除类型异常数据是将非数值型数据剔除,其中,非数值型数据包括字符和空值;所述剔除重复数据是将时间戳重复的数据剔除;所述数据重采样是通过取中位数的方法将数据频率统一为天频。

4.如权利要求3所述的一种基于Ordinal Forests模型的水华级别早期预警方法,其特征在于,步骤S13的具体过程为:

5.如权利要求1所述的一种基于Ordinal Forests模型的水华级别早期预警方法,其特征在于,步骤S2中所述划分水华级别的具体过程为:

6.如权利要求1所述的一种基于Ordinal Forests模型的水华级别早期预警方法,其特征在于,步骤S3的具体过程为:

...

【技术特征摘要】

1.一种基于ordinal forests模型的水华级别早期预警方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于ordinal forests模型的水华级别早期预警方法,其特征在于:步骤s1中所述水质数据包括叶绿素a浓度数据、ph数据、水温数据、电导率数据、浊度数据、溶解性无机氮数据和溶解性无机磷数据。

3.如权利要求1所述的一种基于ordinal forests模型的水华级别早期预警方法,其特征在于:步骤s11中所述剔除类型异常数据是将非数值型数据剔除,其中,非数值型数据包括字符和空...

【专利技术属性】
技术研发人员:梁中耀赵昕叶陈能汪陈纪新瞿帆余镒琦
申请(专利权)人:厦门大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1