【技术实现步骤摘要】
基于机器学习的地下管网承载力评价方法及系统
[0001]本专利技术涉及管网承载力分析
,尤其涉及一种基于机器学习的地下管网承载力评价方法及系统。
技术介绍
[0002]随着我国城市建设的与日俱增,城市地下管网问题日渐突出。城市地下管网与人们生活和安全息息相关,被称为“城市生命线”。近年来,与地下管网相关的事故逐年攀升,造成大量财产损失和人员伤亡。因此,开展对地下管网承载力研究,对于市政辅助决策和地下管网信息化建设具有重要的实践意义。
[0003]地下管网有电力、信息、给水、排水和燃气五种类型,其中地下排水管网因为其铺设年代久远规划不足、雨污分离和产生有害气体等问题尤为复杂。目前对于地下管网承载力的研究方法模式较为相似,基本可以分为三个阶段:数据处理、指标选取和评价方法。数据处理阶段用的较为传统的方法,例如平均值法或者众数法进行数据缺失的处理;指标选取阶段主要根据相关文献和专家意见进行选取,然后也是利用传统方法进行指标权重的确定,例如层次分析法、熵值法等等;评价方法阶段也多利用模糊综合评判法等传统方法。
...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习的地下管网承载力评价方法,其特征在于:所述评价方法包括:S1、缺失数据填充步骤:通过随机森林算法对采集的数据进行预处理,完成对整个采集数据特征矩阵X缺失值的填充;S2、影响因子筛选步骤:采用梯度提升决策树进行影响因子的筛选,避免样本变化和不同属性数据对模型稳定性及评估准确性的影响;S3、模型训练选择步骤:将测试数据集分别输入逻辑回归模型、BP神经网络模型和支持向量机模型进行模型的训练学习,得到精度最高的最终评价模型;S4、承载力评价步骤:将待评价数据输入最终评价模型得到地下管网承载力的评价结果。2.根据权利要求1所述的一种基于机器学习的地下管网承载力评价方法,其特征在于:所述缺失数据填充步骤具体包括:S11、将列举的每一个影响因子作为一项特征,并将所有影响因子的数据集按缺失值由少到多的顺序组成特征矩阵;S12、将特征矩阵的第一列特征,即缺失值最少的特征作为标签Y,剩下的特征缺失值全部设为0,组成新的特征矩阵X;S13、利用python对特征矩阵进行随机森林学习,求解标签Y1,对比标签Y和Y1,将Y1中与Y中缺失值相同位置处的值填充到Y中,完成特征X1缺失值的填充;S14、重复步骤S12和S13完成特征X2缺失值的填充,并遍历所有的特征X
n
,完成整个特征矩阵X缺失值的填充。3.根据权利要求1所述的一种基于机器学习的地下管网承载力评价方法,其特征在于:所述影响因子筛选步骤具体包括:S21、将地下管网承载力的各个影响因子数据集输入到梯度提升决策树模型中,根节点选择分裂前后基尼指数最小的特征作为特征变量,子节点重复相同的分裂方式,依次选择次相对重要特征变量建立弱学习器;S22、通过损失函数评价模型的效果,当函数值未达到设定结果时,以残差为基础,误差反向传播建立新的模型,通过反复迭代建立最终的强学习器,使模型误差最小;S23、根据建立的强学习器,以特征变量在所有弱学习器中的重要度的平均值作为模型中影响因子的重要度。4.根据权利要求1所述的一种基于机器学习的地下管网承载力评价方法,其特征在于:所述模型训练选择步骤具体包括:。S31、根据筛选出的指标将相关数据集随机分成测试数据集和评价数据集,并将测试数据集分别输入逻辑回归模型、BP神经网络模型和支持向量机模型进行模型的训练学习;S32、利用R
‑
square决定系数对三种模型进行评价,选出精度最高的模型作为最终评价模型,R
‑
square决定系数评价公式为其中,Y
actual
表示原始数据集均值,Y
predict
表示预测数据集,即分子为预测数据和原始数据均值差的平方和,Y
mean
表示原始数据集,即分母为原始数据与原始数据均值差的平方和。5.根据权利要求4所述的一种基于机器学习的地下管网承载力评价方法,其特征在于:
所述利用R
‑
square决定系数对三种模型进行评价具体包括:当R
‑
square决定系数越接近1,表明特征变量对预测数据集Y的解释能力越强,这个模型对数据拟合的也较好,即模型精度较高;当R
‑
square决定系数越接近0,表明模型精度越差,从中选择三个模型的R
‑
squar...
【专利技术属性】
技术研发人员:汪宙峰,曾义龙,樊尚杰,张炎菁,
申请(专利权)人:西南石油大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。