一种基于机器学习算法预测赤潮发生的方法及系统技术方案

技术编号:38007239 阅读:13 留言:0更新日期:2023-06-30 10:24
本发明专利技术公开了一种基于机器学习算法预测赤潮发生的方法及系统,应用于赤潮预警技术领域。其步骤为:S1、获取水质数据和赤潮数据;S2、对水质数据和赤潮数据进行预处理,通过对应的监测点位置信息和时刻点得到最终样本数据;S3、通过对未发生赤潮的样本数据进行欠采样处理,得到采样后的特征向量;S4、采用卡方统计方法进行特征选择对水质数据进行筛选,并分析特征的关联性;S5、对样本数据进行归一化处理;S6、建立SVM模型;S7、训练SVM模型;S8、采用SVM模型来预测赤潮的发生。本发明专利技术可以及时发现赤潮的发生,能够在赤潮尚未明显形成异常阶段采取消除措施,可有效提高赤潮防治的效果。可有效提高赤潮防治的效果。可有效提高赤潮防治的效果。

【技术实现步骤摘要】
一种基于机器学习算法预测赤潮发生的方法及系统


[0001]本专利技术涉及赤潮预警
,更具体的说是涉及一种基于机器学习算法预测赤潮发生的方法及系统。

技术介绍

[0002]目前,随着人工智能大数据分析计算的迅速发展,已有诸多学者利用数学模型开展赤潮预测的研究。Mohammad Rafi ee等采用人工神经网络模型对叶绿素a浓度进行预测。结果显示实际数据与预测数据保持良好的一致性。苏新红等采用BP神经网络对福建海域赤潮等级进行预测,预测准确率在70%

80%。张承慧等应IOWA算子,提出了一种赤潮预测组合模型。余璇、石绥祥等人提出基于深度学习的赤潮发生预报方法研究。
[0003]这些研究方法存在三个问题:1.采用人工神经网络模型对叶绿素a浓度进行预测,提出的单一影响因子叶绿素预测是否发生赤潮,此模型较为简单,预测精度低;2.应用IOWA算子提出了一种赤潮预测组合模型未给出多个因子与赤潮的相关性,这会导致模型存在过拟合现象,鲁棒性降低;3.基于GRU深度学习算法预测赤潮评价指标没有考虑召回率,在实际模型应用中,召回率反应的是能够预测到实际发生赤潮的概率,和准确度一样十分重要,并且针对赤潮发生,应该具有宁可误判也不可漏判的原则,基于此选择最优的模型再实际预测中实用性会更强。
[0004]因此,提出一种基于机器学习算法预测赤潮发生的方法及系统,来解决现有技术中存在的困难,是本领域技术人员亟需解决的问题。

技术实现思路

[0005]有鉴于此,本专利技术提供了一种基于机器学习算法预测赤潮发生的方法及系统,本专利技术应用中国香港海域目前已有的水质数据和时间序列内赤潮时空分布特征数据作为训练样本,构建了一种多因子赤潮预测模型。得到赤潮形成的主要影响因子,并基于此建立赤潮预警模型,旨在能够及时发现赤潮的发生,使得能够在赤潮尚未明显形成异常阶段采取消除措施,可有效提高赤潮防治的效果,同时为中国香港海域的赤潮防控提供参考。
[0006]为了实现上述目的,本专利技术提供如下技术方案:
[0007]一种基于机器学习算法预测赤潮发生的方法,包括以下步骤:
[0008]S1、获取水质数据和赤潮数据;
[0009]S2、对水质数据和赤潮数据进行预处理,通过对应的监测点位置信息和时刻点得到最终样本数据;
[0010]S3、通过对未发生赤潮的样本数据进行欠采样处理,得到采样后的特征向量;
[0011]S4、采用卡方统计方法进行特征选择对水质数据进行筛选,并分析特征的关联性;
[0012]S5、对样本数据进行归一化处理;
[0013]S6、建立SVM模型;
[0014]S7、训练SVM模型;
[0015]S8、采用SVM模型来预测赤潮的发生。
[0016]可选的,S3中欠采样方法具体为:
[0017][0018]其中N为未发生赤潮的样本总数;rand(0,1)为产生[0,1]之间的随机数;interesting为取整;p
i
第i次产生的随机序号;i为产生随机数的次数,取值范围为[0,19213];为第i次产生的随机序号对应的原始数据特征向量;Y
i
为欠采样后的第i次特征向量。
[0019]可选的,S5中的数据归一化处理,其转换表达式为:
[0020][0021]其中为特征变量的值;
[0022]min(F
i
):为对应该特征变量的所有样本最小值;
[0023]max(F
i
):为对应该特征变量所有样本最大值;
[0024]为归一化后的数值。
[0025]可选的,S6的具体内容为,将未发生赤潮的样本数据训练成一个紧凑的分类边界,构建得到一个未发生赤潮的分类器,即SVM模型,其公式为
[0026][0027]V(r)为超球体体积;C为惩罚系数;r为超球体半径;O为超球体参数为中心;ε
i
为松弛变量,x
i
为训练数据点。
[0028]一种基于机器学习算法预测赤潮发生的系统,应用上述的一种基于机器学习算法预测赤潮发生的方法,包括依次连接的获取数据模块、数据预处理模块、数据欠采样处理模块、卡方统计模块、数据归一化处理模块、模型建立模块、模型训练模块、模型预测模块;
[0029]获取数据模块:获取水质数据和赤潮数据;
[0030]数据预处理模块:对水质数据和赤潮数据进行预处理,通过对应的监测点位置信息和时刻点得到最终样本数据;
[0031]数据欠采样处理模块:通过对未发生赤潮的样本数据进行欠采样处理,得到采样后的特征向量;
[0032]卡方统计模块:采用卡方统计方法进行特征选择对水质数据进行筛选,并分析特征的关联性;
[0033]数据归一化处理模块:对样本数据进行归一化处理;
[0034]模型建立模块:建立SVM模型;
[0035]模型训练模块:训练SVM模型;
[0036]模型预测模块:采用SVM模型来预测赤潮的发生。
[0037]经由上述的技术方案可知,与现有技术相比,本专利技术公开提供了一种基于机器学习算法预测赤潮发生的方法,其有益效果是:
[0038]构建了一种多因子赤潮预测模型,得到赤潮形成的主要影响因子,并基于此建立赤潮预警模型,旨在能够及时发现赤潮的发生,使得能够在赤潮尚未明显形成异常阶段采取消除措施,可有效提高赤潮防治的效果。
附图说明
[0039]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0040]图1为本专利技术提供的一种基于机器学习算法预测赤潮发生的方法流程图;
[0041]图2为本专利技术提供的一种基于机器学习算法预测赤潮发生的系统结构示意图;
[0042]图3为本专利技术提供的数据预处理流程图;
[0043]图4为本专利技术提供的卡方统计流程图;
[0044]图5为本专利技术提供的模型计算流程图;
[0045]图6为本专利技术提供的模型推理流程图。
具体实施方式
[0046]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0047]参见图1所示,本专利技术公开了一种基于机器学习算法预测赤潮发生的方法,包括以下步骤:
[0048]S1、获取水质数据和赤潮数据;
[0049]S2、对水质数据和赤潮数据进行预处理,通过对应的监测点位置信息和时刻点得到最终样本数据;
[0050]S3、通过对未发生本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习算法预测赤潮发生的方法,其特征在于,包括以下步骤:S1、获取水质数据和赤潮数据;S2、对水质数据和赤潮数据进行预处理,通过对应的监测点位置信息和时刻点得到最终样本数据;S3、通过对未发生赤潮的样本数据进行欠采样处理,得到采样后的特征向量;S4、采用卡方统计方法进行特征选择对水质数据进行筛选,并分析特征的关联性;S5、对样本数据进行归一化处理;S6、建立SVM模型;S7、训练SVM模型;S8、采用SVM模型来预测赤潮的发生。2.根据权利要求1所述的一种基于机器学习算法预测赤潮发生的方法,其特征在于,S3中欠采样方法具体为:其中N为未发生赤潮的样本总数;rand(0,1)为产生[0,1]之间的随机数;interesting为取整;p
i
第i次产生的随机序号;i为产生随机数的次数,取值范围为[0,19213];为第i次产生的随机序号对应的原始数据特征向量;Y
i
为欠采样后的第i次特征向量。3.根据权利要求1所述的一种基于机器学习算法预测赤潮发生的方法,其特征在于,S5中的数据归一化处理,其转换表达式为:其中为特征变量的值;min(F
i
):为对应该特征变量的所有样本最小值;max(F
i
):为对应该特征变量所有样本最大值...

【专利技术属性】
技术研发人员:姚力芬康玉麟朱龙安立会
申请(专利权)人:中国环境科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1