一种基于机器学习算法的造价风险等级划分方法技术

技术编号:36543110 阅读:21 留言:0更新日期:2023-02-01 16:47
本发明专利技术提供的一种基于机器学习算法的造价风险等级划分方法,所述划分方法包括:采集输变电工程项目的历史数据;建立支持向量机分类预测模型;将搜集的历史数据输入模型进行检验,判断预测精度是否达到精度阈值,如果是,得到训练后的支持向量机模型,用于偏差预测;否则,继续对模型进行修改。在对大量输变电工程造价数据搜集整理的基础上,引入聚类理论、智能机器学习算法等创建造价偏差分析预测模型。提高了预测的精度。提高了预测的精度。提高了预测的精度。

【技术实现步骤摘要】
一种基于机器学习算法的造价风险等级划分方法


[0001]本专利技术涉及风险等级划分领域,尤其涉及一种基于机器学习算法的造价风险等级划分方法。

技术介绍

[0002]面对经济社会发展、能源低碳化转型所带来的输变电工程海量投资决策需求,以及电网企业精准投资管理要求,传统输变电工程造价管理应在面临着如下挑战。(1)输变电工程建设项目多,投资规模大,造价偏差幅度加大。(2)输变电工程造价管理存在许多不足,造价超支现象普遍。(3)计算机技术的发展为造价管理提供了新的方法和思路。在电网工程精益化、标准化管理的要求日益提高的背景下,提高工程造价的控制水平。

技术实现思路

[0003]鉴于上述问题,提出了本专利技术以便提供克服上述问题或者至少部分地解决上述问题的一种基于机器学习算法的造价风险等级划分方法。
[0004]根据本专利技术的一个方面,提供了一种基于机器学习算法的造价风险等级划分方法,所述划分方法包括:
[0005]采集输变电工程项目的历史数据;
[0006]建立支持向量机分类预测模型;
[0007]将搜集的历史数据输入模型进行检验,
[0008]判断预测精度是否达到精度阈值,如果是,得到训练后的支持向量机模型,用于偏差预测;否则,继续对模型进行修改。
[0009]可选的,所述采集输变电工程项目的历史数据之后还包括:
[0010]对所述历史数据进行绝对值处理、计算偏差比、将电压等级和建设难度引入影响因素之后列表;
[0011]并用K
‑<br/>means算法将所有预算和结算的偏差分成四类;
[0012]将处理之后的所述历史数据输入SVM算法进行学习。
[0013]可选的,所述将处理之后的所述历史数据输入SVM算法进行学习具体包括:
[0014]对所述历史数据中影响因素的数值范围进行分析,获得分布规律;
[0015]采用MCS方法随机生成两千组预测数据,并将预测样本集输入训练后的SVM算法,得到预测样本集的结算偏差等级;
[0016]对得到的结果进行分析得到不同预警等级对应的四个影响因素的数值范围。
[0017]可选的,所述划分方法还包括:
[0018]分析各个影响因素对最终造价偏差的影响;
[0019]对影响因素的概率分布进行识别;
[0020]用蒙特卡洛模拟随机生成预测样本,输入训练后的支持向量机模型进行预测,得到预测结果;
[0021]根据所述预测结果分析找出各个影响因素的数值范围与预警等级的对应关系。
[0022]可选的,所述支持向量机算法的步骤包括:
[0023]假设训练样本集为:
[0024]{(x
i
,y
i
),i=1,2,

,n,x
i
∈R
n
,y
i
∈R}
ꢀꢀꢀꢀ
(1)
[0025]支持向量机的基本原理是寻找一个非线性映射了φ(x),通过φ(x)将x映射到高维特征空间F中,并在该高维特征空间F中利用以下估计函数f(x)进行线性回归:
[0026]f(x)=[ω
·
φ(x)]+b,φ:R
m

F,ω∈F
ꢀꢀꢀꢀ
(2)
[0027]其中,ω为权值向量;b为偏置。其函数逼近问题等价于如下函数最小:
[0028][0029]其中,R
reg
[f]为期望风险,R
emp
[f]为经验风险,[f]为经验风险,λ为常数。
[0030]可选的,所述支持向量机算法还包括:支持向量机根据统计理论确定了一个最小化目标函数的回归函数具体包括:
[0031]目标函数和约束:
[0032][0033]其中:C为用来平衡模型复杂项和训练误差项的权重参数;为松弛因子;ε为不敏感损失函数;
[0034]利用拉格朗日对偶法以及KKT条件进行求解;
[0035]求解上述问题的对偶问题可得到支持向量机回归函数:
[0036][0037]其中,a
i
,为拉格朗日乘子,K(X
i
,X)称为核函数,一般选取最常用的高斯核函数
[0038]本专利技术提供的一种基于机器学习算法的造价风险等级划分方法,所述划分方法包括:采集输变电工程项目的历史数据;建立支持向量机分类预测模型;将搜集的历史数据输入模型进行检验,判断预测精度是否达到精度阈值,如果是,得到训练后的支持向量机模型,用于偏差预测;否则,继续对模型进行修改。在对大量输变电工程造价数据搜集整理的基础上,引入聚类理论、智能机器学习算法等创建造价偏差分析预测模型。提高了预测的精度。
[0039]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够
更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0040]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0041]图1为本专利技术实施例提供的造价偏差预警模型影响因素设计示意图;
[0042]图2为本专利技术实施例提供的采用K

means分类结果图;
[0043]图3为本专利技术实施例提供的预测结果图。
具体实施方式
[0044]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0045]本专利技术的说明书实施例和权利要求书及附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。
[0046]下面结合附图和实施例,对本专利技术的技术方案做进一步的详细描述。
[0047]本专利技术针对输变电工程造价偏差预测中的理论方法进行了创新应用,即在对大量输变电工程造价数据搜集整理的基础上,引入聚类理论、智能机器学习算法等创建造价偏差分析预测模型。
[0048]本专利技术首先搜集了相关的输变电工程项目的历史数据,对原始数据进行绝对值处理、计算偏差比、将电压等级和建设难度引入影响因素之后列表,并用K

means算法将其中的所有预算和结算的偏差分成四类。
[0049]将处理之后的原始数据输入SVM算法进行学习,为了进一步分析四个影响因素对项目最终结算偏差的影响,对原始数据中这四种影响因素的数值范围进行分析,找出分布规律之后本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习算法的造价风险等级划分方法,其特征在于,所述划分方法包括:采集输变电工程项目的历史数据;建立支持向量机分类预测模型;将搜集的历史数据输入模型进行检验,判断预测精度是否达到精度阈值,如果是,得到训练后的支持向量机模型,用于偏差预测;否则,继续对模型进行修改。2.根据权利要求1所述的一种基于机器学习算法的造价风险等级划分方法,其特征在于,所述采集输变电工程项目的历史数据之后还包括:对所述历史数据进行绝对值处理、计算偏差比、将电压等级和建设难度引入影响因素之后列表;并用K

means算法将所有预算和结算的偏差分成四类;将处理之后的所述历史数据输入SVM算法进行学习。3.根据权利要求2所述的一种基于机器学习算法的造价风险等级划分方法,其特征在于,所述将处理之后的所述历史数据输入SVM算法进行学习具体包括:对所述历史数据中影响因素的数值范围进行分析,获得分布规律;采用MCS方法随机生成两千组预测数据,并将预测样本集输入训练后的SVM算法,得到预测样本集的结算偏差等级;对得到的结果进行分析得到不同预警等级对应的四个影响因素的数值范围。4.根据权利要求1所述的一种基于机器学习算法的造价风险等级划分方法,其特征在于,所述划分方法还包括:分析各个影响因素对最终造价偏差的影响;对影响因素的概率分布进行识别;用蒙特卡洛模拟随机生成预测样本,输入训练后的支持向量机模型进行预测,得到预测结果;根据所述预测结果分析找出各个影响因素的数值范围与预警等级的对应关系。5.根据权利要求1所述的一种基于机器学习算法的造价风险等级划分方法,其特征在于...

【专利技术属性】
技术研发人员:沙俊强鲁延辉鄢洪林叶嘉雯凌宇辰
申请(专利权)人:国网江苏省电力有限公司建设分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1