当前位置: 首页 > 专利查询>中南大学专利>正文

基于机器学习的土壤矿物含量预测方法技术

技术编号:37672764 阅读:18 留言:0更新日期:2023-05-26 04:35
本发明专利技术提供了一种基于机器学习的土壤矿物含量预测方法,包括步骤:S1,从文献数据库或专业数据库中收集土壤一般信息、土壤物相及其它性质、表土理化性质以及底土理化性质的数据,并建立机器学习模型的数据集;S2,对数据集预处理,得预处理样本数据集;S3,将预处理样本数据集随机划分为训练集、测试集,并对所述训练集进行机器学习,得土壤矿物含量预测模型;S4,根据所述土壤矿物含量预测模型进行土壤矿物含量预测。相比于现有技术,建立的土壤矿物含量预测模型可实现对未知的待测土壤进行土壤矿物含量的快速预测,结果准确性高,更新简单,工作周期短,节省人力物力;此外,还不会产生化学品污染,符合绿色环保理念,具有应用价值。值。值。

【技术实现步骤摘要】
基于机器学习的土壤矿物含量预测方法


[0001]本专利技术涉及土壤基本信息预测领域,尤其涉及一种基于机器学习的土壤矿物含量预测方法。

技术介绍

[0002]土壤是陆地生态系统重要组成部分,承载人类的生产生活活动和动物栖息,是食物安全与人体健康的基本保障,在保护环境和维持生态平衡中具有重要作用。查明我国土壤类型及分布规律、土壤资源现状及变化趋势,有利于我国充分利用土地资源、优化农业生产、保障粮食安全等,为经济社会生态建设提供决策依据,为推进农业农村现代化提供有力支撑。
[0003][0004]土壤矿物是土壤组成的主体,占土壤固相总质量的95%,其对土壤理化性质演变和环境污染物吸附都有重要影响。但在现有技术中需要对待测土壤进行分解、制备成待测液,再对待测液分别测定;或将待测土壤与熔剂高温制成熔片用X射线荧光光谱分析测定。这些测定土壤矿物的流程复杂,任务繁重,获得区域数据周期长;而且会因为分解溶解不充分、矿物挥发、测量设备简陋等因素造成测定结果不准确。此外,在众多环境因素的干扰下,部分土壤矿物含量可能会受其影响而发生变化。
[0005]因此,我们可以提供一种基于现有积累数据建立土壤矿物含量预测模型。实现区域性数据的快速获取,并可随环境因素改变而实现土壤矿物含量的及时更新,有望实现环境土壤领域中的科学新发现。因此,建立一种基于机器学习的土壤矿物含量预测方法具有重要的实践意义。

技术实现思路

[0006]本专利技术的主要目的是提供一种基于机器学习的土壤矿物含量预测方法,旨在解决现有技术测定土壤矿物的流程复杂,任务繁重,获得区域数据周期长;测定结果不准确,测量结果更新速度慢等问题。
[0007]为实现上述目的,本专利技术提供一种基于机器学习的土壤矿物含量预测方法,其特征在于,包括步骤:
[0008]S1,从文献数据库或专业数据库中收集土壤一般信息、土壤物相及其它性质、表土理化性质以及底土理化性质的数据,并建立机器学习模型的数据集。
[0009]S2,对所述数据集依次进行标准化和归一化的处理,相关性分析和特征重要性分析,以及降维处理,得预处理样本数据集。
[0010]S3,将所述预处理样本数据集随机划分为训练集、测试集,并采用随机森林算法对所述训练集进行建模,得土壤矿物含量预测模型。
[0011]S4,根据所述土壤矿物含量预测模型进行土壤矿物含量预测。
[0012]进一步地,在步骤S1中,在建立所述数据集之前,还包括剔除收集到的所述数据中
的重复值及缺损数据。
[0013]进一步地,在步骤S2中,所述预处理样本数据集包括与其它土壤性质、表土层堆密度、表土层有机碳百分比、表土层酸碱度、表土层盐基饱和度、表土层碳酸钙含量、底土层黏粒含量、底土层堆密度、底土层酸碱度、底土层黏粒阳离子交换量以及底土层阳离子交换量相对应的数据。
[0014]进一步地,在步骤S2中,所述标准化的方式包括,极差标准化法、Z

score标准化法或log函数标准化法;所述相关性分析和特征重要性分析的方式为对存在相关性高的特征按照特征重要性程度排序,仅保留特征重要性高的特征。
[0015]进一步地,在步骤S2中,所述降维处理的方式包括,多维尺度变换算法、主成分分析或核化线性降维法。
[0016]进一步地,在步骤S3中,所述机器学习的方法为随机森林算法。
[0017]进一步地,在步骤S3中,还包括对得到的所述土壤矿物含量预测模型进行性能评估以验证所述土壤矿物含量预测模型的稳定性。
[0018]进一步地,所述性能评估的方式包括,求算所述土壤矿物含量预测模型的所述训练集的可释方差值、平均绝对误差、均方误差、中值绝对误差以及决定系数,并用5折交叉验证。
[0019]进一步地,所述随机森林算法的参数为:max_features=

auto

;n_estimators=400

500;max_depth=20

90。
[0020]进一步地,所述参数的调优方式包括贝叶斯优化法、基于梯度的优化法、进行寻优法或网格化寻优法。
[0021]本专利技术达到的有益效果:
[0022]本专利技术的一种基于机器学习的土壤矿物含量预测方法,通过对土壤一般信息、土壤物相及其它性质、表土理化性质以及底土理化性质,这些土壤中的基本信息建立机器学习模型的数据集。再对数据集依次进行标准化和归一化的处理,相关性分析和特征重要性分析,以及降维处理,得预处理样本数据集。把预处理样本数据集随机划分为训练集、测试集,并对训练集进行机器学习,得到稳定性强的土壤矿物含量预测模型。
[0023]根据土壤矿物含量预测模型进行土壤矿物含量预测即可得到相应的预测结果。
[0024]其中,建立数据集所需的土壤原始信息简单易获取,建立的土壤矿物含量预测模型可实现对未知的待测土壤进行土壤矿物含量的快速预测,结果准确性高,更新简单,工作周期短,节省人力物力;此外,本专利技术的基于机器学习的土壤矿物含量预测方法避免了对待测土壤进行复杂的分析实验,不会产生化学品污染,符合绿色环保理念,具有应用价值。还有望实现获得空间连续分布的土壤矿物含量数据,将点源的土壤矿物数据扩展到面源,能够获得人类难以涉足或不能涉足区域的土壤矿物含量,充分体现土壤组成的分异性。
附图说明
[0025]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
[0026]图1为本专利技术的基于机器学习的土壤矿物含量预测方法的各实施步骤流程图;
[0027]图2为实施例1的相关性分析结果图;
[0028]图3为实施例1的特征重要性分析结果图;其中,(a)为伊利石的特征重要性分析结果图,(b)为蒙脱石的特征重要性分析结果图;
[0029]图4为实施例1的建模结果分析图;其中,(a)为伊利石的建模结果分析图,(b)为蒙脱石的建模结果分析图。
[0030]本专利技术目的的实现、功能特点及优点将结合实施方式,参照附图做进一步说明。
具体实施方式
[0031]下面将结合本专利技术实施方式中的附图,对本专利技术实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本专利技术的一部分实施方式,而不是全部的实施方式。基于本专利技术中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本专利技术保护的范围。
[0032]需要说明,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。还应当理解,本专利技术实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本专利技术的保护范围。
[0033]除非另外定义,本专利技术中使用的所有技术和科学术语与本技本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的土壤矿物含量预测方法,其特征在于,包括步骤:S1,从文献数据库或专业数据库中收集土壤一般信息、土壤物相及其它性质、表土理化性质以及底土理化性质的数据,并建立机器学习模型的数据集;S2,对所述数据集依次进行标准化和归一化的处理,相关性分析和特征重要性分析,以及降维处理,得预处理样本数据集;S3,将所述预处理样本数据集随机划分为训练集、测试集,并对所述训练集进行机器学习,得土壤矿物含量预测模型;S4,根据所述土壤矿物含量预测模型进行土壤矿物含量预测。2.根据权利要求1所述的基于机器学习的土壤矿物含量预测方法,其特征在于,在步骤S1中,在建立所述数据集之前,还包括剔除收集到的所述数据中的重复值及缺损数据。3.根据权利要求1所述的基于机器学习的土壤矿物含量预测方法,其特征在于,在步骤S2中,所述预处理样本数据集包括与其它土壤性质、表土层堆密度、表土层有机碳百分比、表土层酸碱度、表土层盐基饱和度、表土层碳酸钙含量、底土层黏粒含量、底土层堆密度、底土层酸碱度、底土层黏粒阳离子交换量以及底土层阳离子交换量相对应的数据。4.根据权利要求1所述的基于机器学习的土壤矿物含量预测方法,其特征在于,在步骤S2中,所述标准化的方式包括,极差标准化法、Z

score标准化法或log函数标准化法;所述相关性分析和特征重要性分析的方式为对存在相关性高的特征按照特征重...

【专利技术属性】
技术研发人员:田晨廖钦鹏林璋齐冲冲古黄玲巢瑾
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1