基于机器学习的高寒流域地下水化学控制因素分析方法技术

技术编号:35485617 阅读:16 留言:0更新日期:2022-11-05 16:38
本发明专利技术公开了基于机器学习的高寒流域地下水化学控制因素分析方法,应用于高寒流域地下水环境管理技术领域,包括:基于预处理后的水化学元素数据,构建SOM自组织神经网络,得到水化学可视化拓扑图;在水化学可视化拓扑图上结合Davies

【技术实现步骤摘要】
基于机器学习的高寒流域地下水化学控制因素分析方法


[0001]本专利技术涉及高寒流域地下水环境管理
,特别涉及基于机器学习的高寒流域地下水化学控制因素分析方法。

技术介绍

[0002]地下水是中国西北部水资源的关键组成部分,绝大部分居民饮水、工业用水、农业灌溉及生态需水都依赖于地下水。由于降水少、蒸发大,西北地区干旱缺水,其地下水质量的下降甚至恶化使得该地区的用水更加严峻。开展高寒缺水地区的地下水化学控制因素研究有利于对该区域地下水水质演变的深入理解及地下水资源管理的科学指导。
[0003]地下水化学控制因素在近年来被国内外诸多学者广泛研究。目前的研究,主要集中在水文地质调查,定性分析物源,局部区域短时间段的水化学特征等方面。然而,高寒流域环境条件艰巨,地下水化学特征十分复杂,单一的方法不能系统地揭示整个流域在不同季节不同区域下地下水化学的控制因素。大量复杂的时空变化水化学数据集难以高度可视化,使得同时定性和定量分析高寒流域地下水的控制因素更加困难。
[0004]为此,如何能够描述复杂的地下水数据,识别每个聚类的水文地球化学过程及源解析,同时量化流域不同空间和季节的控制因素,定性与定量分析高寒流域地下水化学控制因素是本领域技术人员亟需解决的问题。

技术实现思路

[0005]有鉴于此,本专利技术提出了一种基于机器学习的高寒流域地下水化学控制因素分析方法。本专利技术通过应用自组织神经网络SOM将复杂的高维数据可视化到低维空间,以此确定地下水水化学组分及其潜在的控制因素;通过应用正交矩阵因子分解法PMF量化源分配,得到每个化学物质和定性分类主要因素的非负值源贡献;并通过将SOM、PMF、相关性分析与离子比值法将结合,提供了一种基于机器学习的高寒流域地下水化学控制因素分析方法,能够描述复杂的地下水数据,识别每个聚类的水文地球化学过程及源解析,同时量化流域不同空间和季节的控制因素,实现定性与定量分析高寒流域地下水化学控制因素,这对地下水水质演变的深入理解以及污染源优先治理和地下水资源管控的科学指导具有重要意义。
[0006]为了实现上述目的,本专利技术采用如下技术方案:
[0007]基于机器学习的高寒流域地下水化学控制因素分析方法,包括:
[0008]步骤(1):获取高寒流域地下水样品水化学元素数据,并进行预处理。
[0009]步骤(2):基于预处理后的水化学元素数据,构建SOM自组织神经网络,得到水化学可视化拓扑图。
[0010]步骤(3):在水化学可视化拓扑图上结合Davies

Bouldin指数和K

means算法确定最佳聚类数,对经过预处理后的水化学元素数据进行聚类,并对聚类结果进行归一化处理,绘制雷达图和离子比值图。
[0011]步骤(4):根据聚类结果,与正交矩阵因子分解法PMF相融合,并结合相关性分析和
离子比值法定性与定量分析高寒流域地下水化学控制因素。
[0012]可选的,步骤(1)中,对水化学元素数据进行预处理包括:在水化学元素数据的基础上结合季节和区域属性对样品数据进行命名与排列。
[0013]可选的,步骤(1)中,还包括:当经过预处理后的样品数据存在异常值或缺失值时,进行异常值剔除以及利用插值弥补缺失值。
[0014]可选的,步骤(2)中,构建SOM自组织神经网络,得到水化学可视化拓扑图,具体为:
[0015]将预处理后的水化学元素数据输入Matlab中SOM自组织神经网络工具箱;
[0016]步骤A:确定神经元的最佳数量其中,n为地下水样本的数量。
[0017]步骤B:初始化随机值较小的权值空间,同时,分别设置映射大小、起始赢家神经元和初始学习速率。
[0018]步骤C:找出权重向量与输入向量最相似的最佳匹配单元BMU。
[0019]步骤D:更新BMU及其近端神经元的权重向量。
[0020]步骤E:迭代搜索过程并收敛于最优自组织映射。
[0021]当达到预先设定的迭代次数或学习速率趋于0时,结束输出水化学可视化拓扑图,否则返回到步骤C。
[0022]可选的,步骤(2)中,以统一距离矩阵和分量平面的形式输出SOM自组织神经网络计算结果得到的水化学可视化拓扑图。
[0023]可选的,步骤(3)中,确定最佳聚类数DBI的公式如下:
[0024][0025]其中,N为集群数;σ
i
、σ
j
分别为第i、j聚类中所有图案到质心c
j
和c
j
的平均距离;d(c
j
,c
j
)是c
j
和c
j
之间的距离。
[0026]可选的,步骤(3)中,对预处理后的水化学元素数据进行聚类,具体为:
[0027]通过Davies

Bouldin指数的变化,将最低点一段间距放大,最小Davies

Bouldin指数值对应最佳聚类数,以此确定聚类的清晰边界;最后,将预处理后的水化学元素数据的标签投影在神经元上,确定预处理后的水化学元素数据在每个聚类中的位置。
[0028]可选的,步骤(3)中,通过对聚类结果进行归一化处理,可绘制成各聚类中水化学元素数据浓度的雷达图和离子比值图。
[0029]可选的,步骤(4)中,根据聚类结果,与正交矩阵因子分解法PMF相融合,具体为:
[0030]步骤a:将经过预处理后的水化学元素数据运用正交矩阵因子分解法PMF,将水化学X
ij
的样品含量矩阵分解为因子贡献矩阵g
ik
,因子分布矩阵f
kj
和残差矩阵e
ij
,如下:
[0031][0032]其中,X
ij
为样品浓度矩阵X,为第i个样品中第j个水化学元素的浓度;p为污染源数;g
ik
是第k个水化学元素对第i个样品的贡献;f
kj
是第k个水化学元素中第j个物种的浓度。
[0033]步骤b:计算不确定度u
ij
,u
ij
是第i个样本中第j个水化学元素的不确定度,由水化学元素含量、方法检出限MDL和测量不确定度计算得出:
[0034]如果水化学元素含量大于方法检出限MDL,u
ij
的计算公式为:
[0035][0036]其中,Errorfraction为误差系数。
[0037]如果水化学元素含量大于方法检出限MDL,关联的u
ij
的计算公式为:
[0038][0039]步骤c:通过最小化目标函数Q得出因子贡献和分布:
[0040][0041]其中,m为水化学元素数量,n为样本数量。
[0042]可选的,步骤(4)中,结合相关性分析和离子比值法定性与定量分析高寒流域地下水化学控制因素,具体为:
...

【技术保护点】

【技术特征摘要】
1.基于机器学习的高寒流域地下水化学控制因素分析方法,其特征在于,包括:步骤(1):获取高寒流域地下水样品水化学元素数据,并进行预处理;步骤(2):基于预处理后的所述水化学元素数据,构建SOM自组织神经网络,得到水化学可视化拓扑图;步骤(3):在所述水化学可视化拓扑图上结合Davies

Bouldin指数和K

means算法确定最佳聚类数,对经过预处理后的所述水化学元素数据进行聚类,并对聚类结果进行归一化处理,绘制雷达图和离子比值图;步骤(4):根据所述聚类结果,与正交矩阵因子分解法PMF相融合,并结合相关性分析和离子比值法定性与定量分析高寒流域地下水化学控制因素。2.根据权利要求1所述的基于机器学习的高寒流域地下水化学控制因素分析方法,其特征在于,步骤(1)中,对所述水化学元素数据进行预处理包括:在所述水化学元素数据的基础上结合季节和区域属性对所述样品数据进行命名与排列。3.根据权利要求1所述的基于机器学习的高寒流域地下水化学控制因素分析方法,其特征在于,步骤(1)中,还包括:当经过预处理后的所述样品数据存在异常值或缺失值时,进行异常值剔除以及利用插值弥补缺失值。4.根据权利要求1所述的基于机器学习的高寒流域地下水化学控制因素分析方法,其特征在于,步骤(2)中,构建SOM自组织神经网络,得到水化学可视化拓扑图,具体为:将预处理后的所述水化学元素数据输入Matlab中SOM自组织神经网络工具箱;步骤A:确定神经元的最佳数量其中,n为地下水样本的数量;步骤B:初始化随机值较小的权值空间,同时,分别设置映射大小、起始赢家神经元和初始学习速率;步骤C:找出权重向量与输入向量最相似的最佳匹配单元BMU;步骤D:更新BMU及其近端神经元的权重向量;步骤E:迭代搜索过程并收敛于最优自组织映射;当达到预先设定的迭代次数或学习速率趋于0时,结束输出所述水化学可视化拓扑图,否则返回到步骤C。5.根据权利要求1所述的基于机器学习的高寒流域地下水化学控制因素分析方法,其特征在于,步骤(2)中,以统一距离矩阵和分量平面的形式输出所述SOM自组织神经网络计算结果得到的所述水化学可视化拓扑图。6.根据权利要求1所述的基于机器学习的高寒流域地下水化学控制因素分析方法,其特征在于,步骤(3)中,确定最佳聚类数DBI的公式如下:其中,N为集群数;σ
i
、σ
j
分别为第i、j聚类中所有图案到质心c
j
和c
j
的平均距离;d(c
j
,c
j
)是c
j
和c
j
之间的距离。7.根据权利要求1所述的基于机器学习的高寒流域地下水化学控制因素分析方法,其特征在于,步骤(3)中,对预处理后的所述水化学元素数据进行聚类,具体为:通过Davies

Bouldin指数的变化,将最低点一段间距放大,最小Davies

Bouldin指数
值对应最佳聚类数,以此确定聚类的清晰边界;最后,将预处理后的所述水化学元素数据的标签投影在神经元上,确定预处理后的所述水化学元...

【专利技术属性】
技术研发人员:张海发王巍张旭曾祥云邵世鹏王宝强宋东东郭舟
申请(专利权)人:水利部珠江水利委员会技术咨询广州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1