一种基于汽车OBD数据预测某次行程百公里油耗的方法技术

技术编号:15505286 阅读:116 留言:0更新日期:2017-06-04 00:54
本发明专利技术提供一种基于汽车OBD数据预测某次行程百公里油耗的方法,所述方法为了预测单行程的百公里油耗,需要对单行程的数据抽取特征来拟合模型。因为单行程的百公里油耗无法得知,所以使用加油周期的百公里油耗数据来抽取特征建立模型,进而将此模型应用在单行程百公里油耗的预测上,本发明专利技术所述方法能较准确地预测出车辆单次行程的百公里油耗,均方根误差RMSE=1.08升,平均绝对误差MAE=0.85升。

A method based on OBD data to predict fuel consumption in one hundred kilometers of a stroke

The invention provides a method for predicting fuel mileage of a journey based on the OBD data of a vehicle, and the method needs to extract the characteristics of a single stroke data to fit the model in order to predict the fuel consumption of a single journey of 100 kilometers. Because a single fuel consumption per hundred kilometers is not known, so using the fuel cycle fuel consumption per hundred kilometers of data model to extract the features, and then apply this model in the prediction of a single hundred kilometers on the method of the invention can accurately predict a single trip vehicle fuel consumption per hundred kilometers, the root mean square error RMSE=1.08 L, the average absolute error of MAE=0.85 L.

【技术实现步骤摘要】
一种基于汽车OBD数据预测某次行程百公里油耗的方法
本专利技术属于车联网
,具体涉及一种基于汽车OBD数据预测某次行程百公里油耗的方法。
技术介绍
影响百公里油耗的因素很多,例如:车型,车重,轮胎磨损情况,排量,路面拥堵情况,道路坡度,个人驾驶行为(急加速、急减速),气温环境(冬天开空调制热,夏天开空调制冷),由于周围环境的复杂多变,准确的单次行程的百公里油耗较难获得。通过汽车OBD盒子可以获得汽车在行驶中的车况数据,包括采集时间、剩余油量、里程、行程开始时间、行程结束时间,基于以上数据可以计算某段行程的百公里油耗=(行程开始剩余油量-行程结束剩余油量)*100/(行程结束里程–行程开始里程)。但这样在实际操作时,计算出来的百公里油耗存在较大误差。主要因为以下因素:1)通过OBD盒子采集上来的剩余油量本身存在偏差,且各车型传感器设计制式与精度不同,导致不同车型采集到的剩余油量偏差不一,并且车辆抖动,路面平整度也会造成较大干扰;2)假如行程较短,油量耗费少,油量变化很难测量;3)加满油时,部分车型出现超出油量量程而测不准的问题,这样就出现里程值增加,油量值未减少的现象,油量变化为零。4)采集到的里程是整数,精度不高。当行程较短时,会影响整体的计算精度。以上导致单次行程很难获得剩余油量数据变化趋势,计算出来的百公里油耗严重偏离实际值,有些甚至偏离数倍,所以仅通过OBD盒子采集到的油量与里程数据无法直接计算出真实的百公里油耗。
技术实现思路
为了解决上述问题,本专利技术提供一种基于汽车OBD数据预测某次行程百公里油耗的方法,所述方法通过加油周期的百公里油耗数据来抽取特征建立模型,最后将此模型应用在单行程百公里油耗的预测上,最后计算出预测的单行程的百公里油耗;进一步地,所述方法包括:S1:特征数据选取与分析;S2:建立模型,使用加油周期数据训练模型;S3:使用加油周期数据验证模型;S4:使用单行程数据验证模型;进一步地,所述S1包括:S11:选取因变量,新建一个指标为油耗指数,加工油耗指数,存放基于车型归一化处理后的百公里油耗;S12:选取自变量,定义月份地域油耗指数、车辆历史油耗指数、加油周期内平均速度、急加速指数、急减速指数、急转向指数、怠速指数、速度区间占比、转速区间占比和排量,用相关系数筛选出影响大的因素,所述相关系数是用以反映变量之间相关关系密切程度的统计指标,相关系数按积差方法计算,以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度,所述相关系数是皮尔逊相关系数;进一步地,所述S11中油耗指数加工方法具体如下:1)按品牌、车型、排量、变速箱类型、发动机型号、最大马力将车辆分组,计算得到平均百公里油耗值,2)将每一车辆每一加油周期的百公里油耗除以对应分组车型的平均百公里油耗值;进一步地,所述S12中月份地域油耗指数为按月份、城市分组的平均油耗指数,所述车辆历史油耗指数为按车辆ID分组计算得到的平均油耗指数,所述加油周期内平均速度为加油周期内总行驶里程/加油周期总行驶时长,所述急加速指数为急加速次数/加油周期内总行驶里程,其中急加速定义为车辆正加速度达到某个阈值;进一步地,所述S12中急减速指数为急减速次数/加油周期内总行驶里程,其中急减速定义为车辆负加速度达到某个阈值;所述急转向指数为急转向次数/加油周期内总行驶里程,其中急转向定义为车辆转向角达到某个阈值;所述怠速指数为怠速时长/加油周期内总行驶里程;所述速度区间占比为将采集到的速度划分到不同速度区间内,各区间的占比;所述转速区间占比为将采集到的转速划分到不同转速区间内,各区间的占比;所述排量为不同车型的排量;进一步地,对S12中的每个自变量计算与S11因变量油耗指数的相关系数,分析各个自变量因素对油耗指数的影响大小。进一步地,所述S2包括:S21:将S1中特征数据组成数据集,在数据集中随机抽样数据,选择其中的70%作为测试集,剩余30%作为训练集;S22:设置XGBoost模型参数,设置油耗指数作为因变量,其他指标作为自变量,设置objective=“reg:linear”,另外设置其他训练参数如学习率,线程数,迭代次数,L1,L2正则惩罚系数,树深度与误差函数,所述误差函数默认为RMSE,通过调整这些参数来对模型进行调优,直至最后结果误差最小;进一步地,所述S3包括:S31:将测试集数据输入进训练好的模型,计算出预测的油耗指数;S32:查看油耗指数预测值的密度分布情况;S33:通过百分位数来查看油耗指数预测值与真实值的差异的分布情况;S34:计算测试集上油耗指数均方根误差和绝对误差,根据油耗指数反求百公里油耗,计算得百公里油耗的均方根误差和绝对误差;进一步地,所述S4包括:S41:将单次行程加工出的指标数据输入进训练好的XGBoost模型,计算得到单次行程的预测百公里油耗指数,并反求出预测百公里油耗;S42:对每个加油周期下的所有单行程,将预测出的单行程百公里油耗按该行程里程加权,与其所在的加油周期的百公里油耗进行比较,计算出均方根误差和平均绝对误差;本专利技术所述方法能较准确地预测出车辆单次行程的百公里油耗,均方根误差RMSE=1.08升,平均绝对误差MAE=0.85升。附图说明图1为本专利技术所述方法整体步骤图;图2为本专利技术所述方法中月份地域油耗指数地域图;图3为本专利技术所述方法中月份地域油耗指数折线图;图4为本专利技术所述方法中各特征与油耗指数相关系数图;图5为本专利技术所述方法中速度区间与油耗指数相关系数图;图6本专利技术所述方法中转速区间与油耗指数相关系数图;图7本专利技术所述方法中油耗指数预测值密度分布图;图8本专利技术所述方法中预测集上的预测值与实际值差异分布图;图9本专利技术所述方法中预测值与实际值差异的绝对值分布图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细描述。应当理解,此处所描述的具体实施例仅仅用于解释本专利技术,并不用于限定本专利技术。相反,本专利技术涵盖任何由权利要求定义的在本专利技术的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本专利技术有更好的了解,在下文对本专利技术的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本专利技术。下面结合附图和具体实施例对本专利技术作进一步说明,但不作为对本专利技术的限定。下面为本专利技术的举出最佳实施例:如图1-图9所示,本专利技术提供一种基于汽车OBD数据预测某次行程百公里油耗的方法,所述方法使用加油周期的百公里油耗数据来抽取特征建立模型,最后将此模型应用在单行程百公里油耗的预测上,最后算出预测的单行程的百公里油耗,所述方法包括:S1:特征数据选取与分析;S2:建立模型,使用加油周期数据训练模型;S3:使用加油周期数据验证模型;S4:使用单行程数据验证模型。所述S1包括:S11:选取因变量,新建一个指标为油耗指数,加工油耗指数,存放基于车型归一化处理后的百公里油耗;S12:选取自变量,定义月份地域油耗指数、车辆历史油耗指数、加油周期内平均速度、急加速指数、急减速指数、急转向指数、怠速指数、速度区间占比、转速区间占比和排量,用相关系数筛选出影响大的因素,所述相关系数是用以反映变量之间相关关系密切本文档来自技高网...
一种基于汽车OBD数据预测某次行程百公里油耗的方法

【技术保护点】
一种基于汽车OBD数据预测某次行程百公里油耗的方法,其特征在于,所述方法使用加油周期的百公里油耗数据来抽取特征建立模型,最后将此模型应用在单行程百公里油耗的预测上,最后计算出预测的单行程的百公里油耗。

【技术特征摘要】
1.一种基于汽车OBD数据预测某次行程百公里油耗的方法,其特征在于,所述方法使用加油周期的百公里油耗数据来抽取特征建立模型,最后将此模型应用在单行程百公里油耗的预测上,最后计算出预测的单行程的百公里油耗。2.根据权利要求1所述的方法,其特征在于,所述方法包括:S1:特征数据选取与分析;S2:建立模型,使用加油周期数据训练模型;S3:使用加油周期数据验证模型;S4:使用单行程数据验证模型。3.根据权利要求1所述的方法,其特征在于,所述S1包括:S11:选取因变量,新建一个指标为油耗指数,加工油耗指数,存放基于车型归一化处理后的百公里油耗;S12:选取自变量,定义月份地域油耗指数、车辆历史油耗指数、加油周期内平均速度、急加速指数、急减速指数、急转向指数、怠速指数、速度区间占比、转速区间占比和排量,用相关系数筛选出影响大的因素,所述相关系数是用以反映变量之间相关关系密切程度的统计指标,相关系数按积差方法计算,以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度,所述相关系数是皮尔逊相关系数。4.根据权利要求1所述的方法,其特征在于,所述S11中油耗指数加工方法具体如下:1)按品牌、车型、排量、变速箱类型、发动机型号、最大马力将车辆分组,计算得到平均百公里油耗值,2)将每一车辆每一加油周期的百公里油耗除以对应分组车型的平均百公里油耗值。5.根据权利要求1所述的方法,其特征在于,所述S12中月份地域油耗指数为按月份、城市分组的平均油耗指数,所述车辆历史油耗指数为按车辆ID分组计算得到的平均油耗指数,所述加油周期内平均速度为加油周期内总行驶里程/加油周期总行驶时长,所述急加速指数为急加速次数/加油周期内总行驶里程,其中急加速定义为车辆正加速度达到某个阈值。6.根据权利要求1所述的方法,其特征在于,所述S12中急减速指数为急减速次数/加油周期内总行驶里程,其中急减速定义为车辆负...

【专利技术属性】
技术研发人员:徐超
申请(专利权)人:北京车网互联科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1