System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于机器学习的土壤中碳钢腐蚀速率预测方法技术_技高网

一种基于机器学习的土壤中碳钢腐蚀速率预测方法技术

技术编号:41096495 阅读:8 留言:0更新日期:2024-04-25 13:54
一种基于机器学习的土壤中碳钢腐蚀速率预测方法,包括以下步骤:(1)根据土壤中的各环境因素,选取影响碳钢腐蚀速率的8个特征变量作为机器学习的输入值,形成8维初始数据集;(2)对初始数据集的缺失值进行剔除,并对剩余数据进行标准化处理;(3)利用网格搜索法对随机森林模型、支持向量回归模型、多层感知器模型的超参数进行选取,构建出精准度高的模型;(4)对三个模型的预测结果进行准确性定量评估并得出最佳预测模型;(5)基于皮尔逊相关系数和最佳预测模型的特征权重进行模型优化,得到最优预测模型;(6)将待预测数据集输入最优预测模型,输出对应的碳钢在土壤中的腐蚀速率预测结果。本发明专利技术对碳钢腐蚀速率进行了有效的预测。

【技术实现步骤摘要】

本专利技术属于土木工程结构性能演化与控制领域,具体涉及一种基于机器学习的土壤中碳钢腐蚀速率预测方法


技术介绍

1、碳钢作为一种常用的建筑结构材料,被广泛应用于桥梁、管道、基础等重大工程结构。桥梁基础部分及地下管道长期处于土壤环境中,在此严酷服役环境下的碳钢会发生腐蚀,导致结构性能的劣化与失效概率的上升,影响结构的正常使用甚至出现结构破坏。由包括土壤中碳钢腐蚀在内等腐蚀问题导致的年花费可达国民生产总值的1%至5%。基于上述由腐蚀引发的一系列危害以及国民经济的巨大损失,土壤中碳钢腐蚀速率的预测成为桥梁和管道等结构全寿命设计领域的重中之重。

2、土壤中碳钢腐蚀受到多种因素的相互作用,包括土壤成分、湿度、ph值、微生物等。这种多因素的相互作用增加了系统的不确定性,需要综合考虑各个因素的影响。同时,土壤中的水分和多种离子(如氯离子、硫酸根离子)的存在导致了复杂的电化学反应,涉及到阳极和阴极过程。这些反应的复杂性使得对腐蚀过程的准确建模和预测变得具有挑战性。

3、目前,描述传统的土壤中碳钢腐蚀速率预测方法主要包括经验模型和理论模型。经验模型建立在碳钢腐蚀速率(大多数情况下以腐蚀电流密度表征)与一些土壤环境相关参数(如土壤电阻率、湿度、ph值等)的直接关系。经验模型建立在大量试验或现场数据的基础上,通过统计回归得到腐蚀电流密度和众多参数的拟合关系。从应用的角度来说,经验模型方便、快速。然而,只能考虑较少参数及工况是经验模型不可避免的缺点。对碳钢腐蚀速率的求解亦可通过电化学动力学方程、欧姆定律,采用有限元和边界元等方法得到理论模型的数值求解。然而数值模型对于工程中实际结构的应用仍有难度。

4、基于现有土壤中碳钢腐蚀速率预测模型的缺陷,有必要探索新的数据处理及建模方法,能更可靠且准确地预测土壤中碳钢的腐蚀速率。机器学习(machine learning,ml)能够从数据中自动归纳出逻辑,并据此对新数据进行预测或分类。如公开号为cn117252078a的中国专利文献公开了一种基于机器学习的砂浆流变性预测方法;公开号为cn115952876a的中国专利文献公开了一种面对工程应用的机器学习模型可靠性评估方法。机器学习擅长处理多因素之间的关系,且随着试验数据的增加其精确度还会随之提升,具有传统模型所不具备的进化属性。因此,需要一种利用机器学习对土壤中碳钢腐蚀相关数据进行处理建模的方法,预测其腐蚀速率。


技术实现思路

1、为了解决传统的土壤中碳钢腐蚀速率预测模型对非线性关系的处理能力不足、对大规模数据的处理限制等问题,本专利技术提出一种基于机器学习的土壤中碳钢腐蚀速率预测方法,可综合考虑多种影响因素对土壤中碳钢腐蚀速率进行准确预测。

2、本专利技术解决上述问题的技术方案如下:

3、一种基于机器学习的土壤中碳钢腐蚀速率预测方法,包括以下步骤:

4、(1)根据土壤中的各环境因素,选取影响碳钢腐蚀速率的8个特征变量:暴露时间、水分含量、ph值、土壤电阻率、氯化物含量、硫酸盐含量、硫化物和平均总有机碳含量,将上述特征值作为机器学习的输入值,并以这8个特征变量作为最初的8维数据集,腐蚀电流密度作为输出值,与8维输入数据集一起形成初始数据集;

5、(2)对初始数据集进行数据分析,将少量的缺失值进行剔除,并对剩余的数据以标准化的方法进行特征工程处理以防止输入变量的量纲不同而导致的机器学习模型计算过于依赖量纲大的输入变量,从而避免预测精度下降;

6、(3)采用三种常用模型(随机森林(random forest)模型、支持向量回归模型(support vector regression)、多层感知机(multilayer perceptron)模型)作为预测的三种机器学习模型,利用网格搜索法对各模型的超参数进行择优选取以保证每个模型得到最佳的预测效果;

7、(4)将处理过的8维数据集作为输入变量,将碳钢腐蚀电流密度作为预测结果,基于三种评价指标(决定系数r2、均方根误差rmse、平均绝对误差mae)对各模型预测结果进行准确性评价以得出最佳预测模型;

8、(5)基于步骤(4)中最佳预测模型,通过皮尔逊(pearson)相关系数计算得出各变量之间的相关程度,以及各变量对腐蚀电流密度的权重排序,以最少变量和最佳准确性为判断标准,将权重高于权重阈值的变量定为重要变量,将皮尔逊相关系数高于相关系数阈值的两个变量定为相关变量,根据重要变量及其相关变量,分析确定影响碳钢腐蚀速率的变量组合,最终得出碳钢腐蚀速率最优预测模型;

9、(6)将待预测数据集输入步骤(5)中的碳钢腐蚀速率最优预测模型,得到碳钢在土壤中的腐蚀速率预测结果。

10、进一步,所述步骤(2)中,对数据进行标准化后将其映射到[0,1]范围内,将处理完毕的数据集进行划分,采取80%数据用来给模型训练,20%数据用于模型准确度的测试。

11、所述步骤(3)中,所用的网格搜索法通过指定一个超参数的候选值列表,对所有可能的参数组合进行穷举搜索,并对每一组参数进行模型训练和评估,最后选择具有最佳性能的参数组合作为最终模型的超参数。具体而言,网格搜索法基于一个定义了各个超参数及其可能取值的参数网格,每个超参数的可能取值都会与其他超参数的可能取值进行组合。然后,对于每一组超参数的组合,都会使用交叉验证或其他评估方法来评估模型的性能。最终,选择具有最佳性能的超参数组合作为最佳模型的超参数。

12、再进一步,所述步骤(3)中,所选用的随机森林模型以决策树为基础,即以一种类似树状图结构的算法对已有的样本根据给定的特征进行分支并最终建立一棵树,其中树的根节点是根据如下公式选择基尼系数最小的特征:

13、其中gini(d)表示数据集d的基尼系数,c表示数据集d中类别的个数,pi表示数据集d中第i个类别样本所占的比例。

14、优选地,按基尼系数由小到大的顺序从根节点(即特征)向下分支,最后树的叶子节点(树的末端)代表最终决策(即目标值)。决策树可以应用于有大量案例以及大量变量的数据集并展现出高度可解释性。随机森林则是通过自助法从原始训练样本集n中有放回地重复随机抽取n个样本生成新的训练样本集合去训练决策树,然后重复以上步骤生成m棵决策树组成的;新数据的分类结果按分类树投票多少形成的分数而定。随机森林的本质是对决策树算法的一种升级,它将多个决策树合并在一起,并且每棵树的建立依赖于独立抽取的样本,因此随机森林也是一种集成学习模型。

15、所述步骤(3)中,所选用的支持向量回归模型的基本原理是通过非线性函数将输入样本x映射到高维特征空间f,以便于更好地拟合数据,其模型函数是根据结构风险最小化的原则建立的,如下所示:

16、

17、其中w是指权重向量,w∈f,b是偏置向量,b∈r,f(x)是预测值。此外支持向量回归模型在线性函数两侧制造了一个“间隔带”,其左右两侧的宽度为ε,对于落入到“间隔带”内的样本,则不计算损失;只有落本文档来自技高网...

【技术保护点】

1.一种基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,所述步骤(2)中,对数据进行标准化后将其映射到[0,1]范围内,其公式如下:

3.根据权利要求1或2所述的基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,所述步骤(2)中,将处理完毕的数据集进行划分,采取80%数据用来给模型训练,20%数据用于模型准确度的测试。

4.根据权利要求1或2所述的基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,所述步骤(3)中,所用的网格搜索法通过指定一个超参数的候选值列表,对所有可能的参数组合进行穷举搜索,并对每一组参数进行模型训练和评估,最后选择具有最佳性能的参数组合作为最终模型的超参数,网格搜索法基于一个定义了各个超参数及其可能取值的参数网格,每个超参数的可能取值都会与其他超参数的可能取值进行组合。然后,对于每一组超参数的组合,都会使用交叉验证或其他评估方法来评估模型的性能;最终,选择具有最佳性能的超参数组合作为最佳模型的超参数。

5.根据权利要求1或2所述的基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,所述步骤(3)中,所选用的随机森林模型以决策树为基础,即以一种类似树状图结构的算法对已有的样本根据给定的特征进行分支并最终建立一棵树,其中树的根节点是根据如下公式选择基尼系数最小的特征:

6.根据权利要求1或2所述的基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,所述步骤(3)中,所选用的支持向量回归模型的基本原理是通过非线性函数将输入样本x映射到高维特征空间F,以便于更好地拟合数据,其模型函数是根据结构风险最小化的原则建立的,如下所示:

7.根据权利要求1或2所述的基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,所述步骤(3)中,所选用的多层感知器模型是基于生物学中神经网络的原理,通过充分理解人脑结构和外界刺激响应机制后,以网络拓扑知识作为基础,模拟人脑的神经系统对复杂信息处理方式的一种数学模型,该模型由输入层、隐藏层、输出层组成,对于只有一层隐藏层的多层感知器模型,从输入层开始,每一个输入变量xi与下一层,即第一隐藏层中的节点连接,并且每一个连接都会被分配一个权重wij,然后通过将xi加权求和得到结果Fi并将其输入到第一隐藏层中,最后将加权求和结果通过一个激活函数进行变换得到第一隐藏层的输出yi,sigmoid函数为:

8.根据权利要求1或2所述的基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,所述步骤(4)中,用于评价机器学习模型的指标采用决定系数R2、均方根误差RMSE、平均绝对误差MAE,每个指标的计算公式如下所示:

9.根据权利要求1或2所述的基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,所述步骤(5)中,用于相关性分析的皮尔逊系数计公式如下所示:

10.根据权利要求1或2所述的基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,步骤(5)中,所述权重阈值为0.1,所述相关系数阈值为0.8。

...

【技术特征摘要】

1.一种基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,所述步骤(2)中,对数据进行标准化后将其映射到[0,1]范围内,其公式如下:

3.根据权利要求1或2所述的基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,所述步骤(2)中,将处理完毕的数据集进行划分,采取80%数据用来给模型训练,20%数据用于模型准确度的测试。

4.根据权利要求1或2所述的基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,所述步骤(3)中,所用的网格搜索法通过指定一个超参数的候选值列表,对所有可能的参数组合进行穷举搜索,并对每一组参数进行模型训练和评估,最后选择具有最佳性能的参数组合作为最终模型的超参数,网格搜索法基于一个定义了各个超参数及其可能取值的参数网格,每个超参数的可能取值都会与其他超参数的可能取值进行组合。然后,对于每一组超参数的组合,都会使用交叉验证或其他评估方法来评估模型的性能;最终,选择具有最佳性能的超参数组合作为最佳模型的超参数。

5.根据权利要求1或2所述的基于机器学习的土壤中碳钢腐蚀速率预测方法,其特征在于,所述步骤(3)中,所选用的随机森林模型以决策树为基础,即以一种类似树状图结构的算法对已有的样本根据给定的特征进行分支并最终建立一棵树,其中树的根节点是根据如下公式选择基尼系数最小的特征:

6.根据权利要求1或2所述的基于机器学习的土壤中碳钢腐蚀速率预测方法...

【专利技术属性】
技术研发人员:董征毛永祺付传清傅林峰
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1