System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于机器学习算法的煤炭公路运价预测方法技术_技高网

一种基于机器学习算法的煤炭公路运价预测方法技术

技术编号:40704624 阅读:4 留言:0更新日期:2024-03-22 11:04
本申请提供了一种基于机器学习算法的煤炭公路运价预测方法,包括S1,获取历史煤炭公路运价的数据,对数据进行异常值处理,用处理后的数据构造特征;S2,将构造的特征数据划分为训练数据和测试数据;S3,将训练数据输入XGBRegressor预测模型进行训练,通过5折交叉验证调整预测模型的各项参数;S4,通过MAE值查看预测模型性能的变化,确定预测模型参数设定是否合理,预测模型是否过拟合或欠拟合;S5,预测模型参数设定合理、不存在过拟合和欠拟合时,确认并生成XGBRegressor预测模型;S6,将测试数据传入预测模型,评估预测模型的拟合性;本发明专利技术利用XGBRegressor预测模型可以更快、更全的计算出当日煤炭公路运价,提高了下游客户了解运价的及时性、高效性和全面性。

【技术实现步骤摘要】

本专利技术涉及煤炭公路运价,特别涉及一种基于机器学习算法的煤炭公路运价预测方法


技术介绍

1、煤炭,简称煤,是远古植物遗骸,埋在地层下,经过地壳隔绝空气的压力和温度条件下作用,产生的碳化化石矿物,主要被人类开采用作燃料;煤炭对于现代化工业来说,无论是重工业,还是轻工业;无论是能源工业、冶金工业、化学工业、机械工业,还是轻纺工业、食品工业、交通运输业,都发挥着重要的作用,各种工业部门都在一定程度上要消耗一定量的煤炭,因此有人称煤炭是工业的“真正的粮食”,是十八世纪以来人类世界使用的主要能源之一。

2、综上,煤炭是众多下游行业的重要原材料,对整个工业系统有举足轻重的作用,而煤炭采购成本又是很多下游客户生产经营中最大的成本,

3、煤炭的采购成本不仅包括煤炭交易中的煤炭价格还包括煤炭的运输价格,其中煤炭价格需要根据各大交易平台的交易价格指数、期货价格指数、周边交易价格动态,以及煤炭相关的各项煤质指标属性及以质论价煤质奖罚要求,分别制定用于计算煤炭基本价格计算公式、煤质以质论价奖罚价格计算公式,并通过多个公式分别计算煤炭的市场交易定价和实际结算价格,但是因为煤炭的重量、运输的车型、出发地、目的地等不同,因此每次的运输价格都是波动的,所以快速了解煤炭公路运价的信息对于下游客户采购决策与成本控制有很大意义。

4、目前下游客户通过信息部或者司机了解公路运价,了解信息不够高效、全面,因此对于采购决策具有一定的影响。

5、申请人使用:煤炭、公路、高速、运输、运价、价格等作为关键词,进行检索,并未发现煤炭公路运输价位预测的技术方案。

6、因此,需要提供一种新的技术方案解决上述技术问题。


技术实现思路

1、本申请提供了一种基于机器学习算法的煤炭公路运价预测方法,包括如下步骤:

2、s1,获取历史煤炭公路运价的数据,对数据进行异常值处理,用处理后的数据构造特征;

3、s2,将构造的特征数据划分为训练数据和测试数据;

4、s3,将训练数据输入xgbregressor预测模型进行训练,通过5折交叉验证调整xgbregressor预测模型的各项参数,通过5折交叉验证将s2中的训练数据和测试数据重新划分,形成训练集和测试集;

5、s4,通过训练过程中每轮迭代训练集和测试集的mae值查看xgbregressor预测模型性能的变化,确定xgbregressor预测模型参数设定是否合理,xgbregressor预测模型是否过拟合或欠拟合;

6、s5,xgbregressor预测模型参数设定合理、xgbregressor预测模型不存在过拟合和欠拟合时,确认并生成xgbregressor预测模型;

7、s6,将测试数据传入上述xgbregressor预测模型,评估xgbregressor预测模型的拟合性。

8、作为一种优选方案,还包括s7,拟合性良好时,将xgbregressor预测模型布入线上使用。

9、作为一种优选方案,用训练集和测试集做的每轮迭代训练,得到的mae值趋势相同,则判定xgbregressor预测模型参数设定合理。

10、作为一种优选方案,所述步骤s1中获取的数据主要为文本数据和数值数据,所述文本数据包括出发地地址、目的地地址、目的地所在省份、目的地所在地级市、目的地所在旗县区、目的地所在乡镇;所述数值数据包括出发地经度、出发地纬度、目的地经度、目的地纬度、出发地到目的地导航距离、出发地到目的地导航路线所需的过路费、日期、油价、出发地入口车流量、出发地出口车流量、煤价、运费。

11、作为一种优选方案,基于异常值处理后的文本数据和数值数据构造的特征包括:出发地到目的地直线距离、目的地是否在内蒙古自治区、目的地是否在吉林省、目的地是否在山东省、目的地是否在辽宁省、所属季度、所属季节、所属月份、所属年份、所属日期、当年第几周、当年第几天、是否工作日、目的地为几线城市、是否中秋、是否五一、是否国庆、是否清明、是否端午、内蒙古0号柴油价格、辽宁0号柴油价格、吉林0号柴油价格、山东0号柴油价格、出发地入口车流量、出发地出口车流量、4500大卡煤价、5000大卡煤价、5500大卡煤价、神优2煤价。

12、作为一种优选方案,所述步骤s2中,按照80%和20%的比例划分训练数据和测试数据,测试数据用来校验xgbregressor预测模型准确率。

13、作为一种优选方案,所述步骤s3中,xgbregressor预测模型的各项参数包括:参数n_estimators、learning_rate和booster。

14、作为一种优选方案,所述s4中,用训练集和测试集做的每轮迭代训练,得到的mae值趋势相同,则判定xgbregressor预测模型参数设定合理。

15、作为一种优选方案,所述步骤s4中,mae值的计算公式为:

16、

17、其中,mae为平均绝对误差,为每个运费金额的预测值,yi为每个费金额的真实值,n为样本个数。

18、作为一种优选方案,所述步骤s6中,将测试数据传入xgbregressor预测模型中,利用均方误差mse和准确率两个指标评估xgbregressor预测模型的拟合程度:

19、

20、

21、其中,mse为均方误差,为每个运费金额的预测值,yi为每个运费金额的真实值,n为样本个数;accuracy为准确率,ncorrect为预测准确的样本数,ntotal代表测试集样本数。

22、作为一种优选方案,预测值与真实值的误差在20元以内的样本定义为预测准确的样本。

23、作为一种优选方案,accuracy大于等于90%,则判定拟合性良好;accuracy小于90%时,判定拟合效果不好。

24、作为一种优选方案,拟合效果不好时,增加相关特征或者网格搜索调整参数,提高xgbregressor预测模型的准确率。

25、本申请相较于现有技术的运价采集方法,本专利技术的公路运价预测方法通过历史数据训练出公路运价预测模型,利用此xgbregressor预测模型可以更快、更全的计算出当日煤炭公路运价,提高了下游客户了解运价的及时性、高效性和全面性。

本文档来自技高网...

【技术保护点】

1.一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,还包括S7,拟合性良好时,将XGBRegressor预测模型布入线上使用。

3.根据权利要求1所述的一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,用训练集和测试集做的每轮迭代训练,得到的MAE值趋势相同,则判定XGBRegressor预测模型参数设定合理。

4.根据权利要求1所述的一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,所述S1中获取的数据为文本数据和数值数据,所述文本数据包括出发地地址、目的地地址、目的地所在省份、目的地所在地级市、目的地所在旗县区、目的地所在乡镇;所述数值数据包括出发地经度、出发地纬度、目的地经度、目的地纬度、出发地到目的地导航距离、出发地到目的地导航路线所需的过路费、日期、油价、出发地入口车流量、出发地出口车流量、煤价、运费。

5.根据权利要求1所述的一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,所述S2中,按照80%和20%的比例划分训练数据和测试数据。

6.根据权利要求1所述的一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,所述S3中,XGBRegressor预测模型的各项参数包括:参数n_estimators、learning_rate和booster。

7.根据权利要求1所述的一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,所述S4中,MAE值的计算公式为:

8.根据权利要求1所述的一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,所述S6中,将测试数据传入XGBRegressor预测模型中,利用均方误差MSE和准确率两个指标评估模型拟合程度:

9.根据权利要求8所述的一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,Accuracy大于等于90%,则判定拟合性良好;Accuracy小于90%时,判定拟合效果不好。

10.根据权利要求8所述的一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,运费金额的预测值与运费金额的真实值的误差在20元以内的样本定义为预测准确的样本。

...

【技术特征摘要】

1.一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,还包括s7,拟合性良好时,将xgbregressor预测模型布入线上使用。

3.根据权利要求1所述的一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,用训练集和测试集做的每轮迭代训练,得到的mae值趋势相同,则判定xgbregressor预测模型参数设定合理。

4.根据权利要求1所述的一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,所述s1中获取的数据为文本数据和数值数据,所述文本数据包括出发地地址、目的地地址、目的地所在省份、目的地所在地级市、目的地所在旗县区、目的地所在乡镇;所述数值数据包括出发地经度、出发地纬度、目的地经度、目的地纬度、出发地到目的地导航距离、出发地到目的地导航路线所需的过路费、日期、油价、出发地入口车流量、出发地出口车流量、煤价、运费。

5.根据权利要求1所述的一种基于机器学习算法的煤炭公路运价预测方法,其特征在于,所述s2中,...

【专利技术属性】
技术研发人员:张欢周敏
申请(专利权)人:内蒙古荣通数链煤炭科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1