一种汽油质量指标预测及致因解析方法技术

技术编号:34408924 阅读:23 留言:0更新日期:2022-08-03 21:58
本发明专利技术公开了一种汽油质量指标预测及致因解析方法,首先利用汽油历史生产数据构建LightGBM模型,采用加入正交变异、双点变异算子及蜂王竞争机制的IGA算法对LightGBM模型的超参数进行寻优;然后在线依据成品汽油配方和质量指标数据,将GA_LightGBM模型用于配方质量预测,得到配方质量指标;最后采用SHAP对通过此模型获得的质量指标预测值进行致因分析,得到每个样本特征对预测结果的影响程度以及影响方向。通过本发明专利技术中IGA算法对LightGBM模型进行优化,能够摒弃人工经验和迭代试错选参的不便,简化模型参数的调整过程;同时SHAP能全局及局部解释模型对质量指标预测理由,增强模型预测结果可信度,同时为成品汽油配方组分优化提供依据,从而提升企业生产效能。从而提升企业生产效能。从而提升企业生产效能。

【技术实现步骤摘要】
一种汽油质量指标预测及致因解析方法


[0001]本专利技术涉及油品指标预测
,更具体的说是涉及一种汽油质量指标预测及致因解析方法。

技术介绍

[0002]成品汽油的生产过程中,油品质量是油品生产的关键,油品质量的优劣直接影响生产效益的高低,保证油品的质量达标又能实现调和效益最优化是企业不断改进成品汽油调和配方的根本原因,
[0003]但目前,在实际企业的生产过程中,由于部分不可解释性的数据驱动模型生成的油品调和配方存在生产损失的担忧,企业往往依据经验丰富的油品调和专家人工添加调和组分,再进行已调和的成品汽油质量指标的离线化验,为了防止油品质量指标不合格导致二次重调,人工经验配比调和往往质量过剩,严重影响企业的经济效益,而且油品调和质量指标的离线化验导致生产停滞。
[0004]针对以上问题,亟需对调和配方在生产之前进行可靠的成品汽油在线质量指标分析,考虑到轻量级梯度提升树(LightGBM)在实际工程应用中表现出的优良模型性能,将其用于成品汽油质量指标预测模型的建立,但由于其超参数较多,采取单一参数试错、网格搜索寻参或随机搜索寻参并不能一定寻找到全局最优参数,虽然在其他预测领域,已有应用遗传算法(GA)对轻量级梯度提升树的网络参数进行优化的先例,但传统的GA算法容易未成熟收敛而导致无法寻到最优解,以及算法不能及时利用网络中的反馈信息,而导致算法搜索速度较慢,并且即使在一定程度使得寻优参数趋于轻量级梯度提升树的最优解,但是搜索时间无疑会增加,
[0005]因此,如何对遗传算法(GA)进行改进,并基于改进的遗传算法(GA)建立优化后LightGBM网络及带有可解释性的成品汽油质量指标预测模型是本领域技术人员亟需解决的问题。

技术实现思路

[0006]有鉴于此,本专利技术提供了一种汽油质量指标预测及致因解析方法,考虑轻量级梯度提升树算法(LightGBM)在训练速度和非线性处理方面的优势,将其应用于成品汽油质量指标的预测建模,并应用可解释机器学习框架SHAP解释指标预测致因,同时,针对梯度提升树网络(GBDT)训练过程中存在的参数选取困难问题,应用改进的遗传算法(IGA)对相关参数进行优选,摒弃了人工经验和迭代试错选参的不便,极大简化了模型的参数调整过程。
[0007]为了实现上述目的,本专利技术采用如下技术方案:
[0008]一种汽油质量指标预测及致因解析方法,其特征在于,包括如下步骤:
[0009]S1、利用汽油历史生产数据离线构建LightGBM模型;
[0010]S2、通过引入正交变异、双点变异算子以及蜂王竞争机制的IGA算法对所述LightGBM模型的超参数进行优化;
[0011]S3、获取成品汽油配方组分和质量指标数据,划分为训练集和测试集,对优化后的所述LightGBM模型进行训练,得到训练后的LightGBM模型;
[0012]S4、采用SHAP学习框架对通过所述训练后LightGBM模型获得的预测结果进行分析,得到每个样本特征对所述预测结果的影响程度以及影响方向。
[0013]优选的,S2中,所述通过IGA算法对LightGBM模型的超参数进行优化的步骤包括:
[0014]S21:确定寻优参数,对其进行二进制编码,所述二进制编码随机生成个体,初始化种群;
[0015]S22:构建适应度函数,所述适应度函数为:
[0016][0017]式中,i为样本个体,n为样本总数,表示仿真预测值,y
i
表示实际值;
[0018]S23:根据所述适应度函数计算所述初始化种群的适应度,并引入蜂王竞争机制;
[0019]S24:种群进化,采用轮盘赌方式选择参数组,依交叉率进行双点交叉,利用变异率结合迭代次数选择正交变异或双点变异,迭代产生新种群,
[0020]比较当前种群参数组最优适应度值与新种群参数组最优适应度值大小,引入蜂王竞争机制使种群寻优收敛,产生新的种群,满足终止条件时结束优化。
[0021]优选的,S3中,所述划分训练集和测试集前先根据拉依达准则去除异常值,所述拉依达准则是对被测量变量的精度测量,得到X1、X2...X
n
,再计算其算数平均值X,
[0022]根据所述算术平均值X,按如下公式计算标准误差σ;
[0023][0024]判断所述被测变量是否满足如下公式,
[0025]|v
i
|=|x
i

x|>3σ
[0026]若符合,认为x
i
含有粗大误差,为不合格数据,剔除。
[0027]优选的,S3中,所述划分训练集和测试集前还包括对数据进行归一化处理,所述归一化处理采用min

max标准化方法,将S3中获取的所述成品汽油配方组分和质量指标数据转换为[0,1]区间内的数值,
[0028]所述标准化转换函数为:
[0029][0030]式中,f为实际测量值,f
min
作为样本数据最小值,f
max
为样本数据最大值。
[0031]优选的,S3中,采用自助法对获取的所述成品汽油配方组分和质量指标数据进行划分,
[0032]当样本总数为n,所述自助法为有放回地抽样n次,得到n的数据,剔除已重复数据后,得到m个数据,所述m个数据为训练集数据,其余n

m个数据为测试集数据。
[0033]优选的,S3中,采用单边采样算法和互斥特征捆绑算法对优化后的所述LightGBM模型进行训练,并使用leaf

wise叶子生长策略,限定分裂深度。
[0034]优选的,采用SHAP学习框架对通过所述训练后LightGBM模型获得的预测结果进行分析,得到SHAP概要图、特征交互SHAP图和特征SHAP依赖图,所述特征交互SHAP图按照SHAP值由大到小排序,用于衡量特征对模型预测值的贡献度和影响;
[0035]优选的,S3中对所述LightGBM模型训练完成后,采用常用性能指标对所述训练完的LightGBM模型性能进行评价,所述常用性能指标包括均方误差MSE、平均绝对误差MAE和决定系数R2,计算公式如下:
[0036][0037][0038][0039]式中N为测试集样本数量,表示参数预测值,y
i
表示实际值,表示均值。
[0040]优选的,还采用预测误差分布PED对所述训练完的LightGBM模型性能进行评价,所述预测误差分布PED通过如下公式获得:
[0041][0042]式中,num(υ≤δ)表示预测误差在误差δ范围之内的个数,num(N)表示预测数值总数,υ表示预测值与真实值误差集合,δ根据国

汽油下限标准和企业上限标准确定。
[0043]经由上述的技术方案可知,与现有技术相比,本专利技术公开提供了一种汽油质量指标预测及致因解析方法,引用正交变异及蜂王竞争机制,保证了种群本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种汽油质量指标预测及致因解析方法,其特征在于,包括如下步骤:S1、利用汽油历史生产数据离线构建LightGBM模型;S2、通过引入正交变异、双点变异算子以及蜂王竞争机制的IGA算法对所述LightGBM模型的超参数进行优化;S3、获取成品汽油配方组分和质量指标数据,划分训练集和测试集,对优化后的所述LightGBM模型进行训练,得到训练后的LightGBM模型;S4、采用SHAP学习框架对通过所述训练后LightGBM模型获得的预测结果进行分析,得到每个样本特征对所述预测结果的影响程度以及影响方向。2.根据权利要求1所述的一种汽油质量指标预测及致因解析方法,其特征在于,S2中,所述通过IGA算法对所述LightGBM模型的超参数进行优化的步骤包括:S21:确定寻优参数,对其进行二进制编码,所述二进制编码随机生成个体,初始化种群;S22:构建适应度函数,所述适应度函数为:式中,i为样本个体,n为样本总数,表示仿真预测值,y
i
表示实际值;S23:根据所述适应度函数计算所述初始化种群的适应度,并引入蜂王竞争机制;S24:种群进化,采用轮盘赌方式选择参数组,依交叉率进行双点交叉,利用变异率结合迭代次数选择正交变异或双点变异,迭代产生新种群,比较当前种群参数组最优适应度值与新种群参数组最优适应度值大小,引入蜂王竞争机制使种群寻优收敛,产生新的种群,满足终止条件时结束优化。3.根据权利要求1所述的一种汽油质量指标预测及致因解析方法,其特征在于,S3中,所述划分训练集和测试集前先根据拉依达准则去除异常值,所述拉依达准则是对被测量变量的精度测量,得到X1、X2...X
n
,再计算其算数平均值X,根据所述算术平均值X,按如下公式计算标准误差σ;判断所述被测变量是否满足如下公式,|v
i
|=|x
i

x|>3σ若符合,认为x
i
含有粗大误差,为不合格数据,剔除。4.根据权利要求3所述的一种汽油质量指标预测及致因解析方法,其特征在于,S3中,所述划分训练集和测试集前还包括对数据进行归一化处理,所述归一化处理采用min
...

【专利技术属性】
技术研发人员:李炜郑明杰李亚洁王亚丽
申请(专利权)人:兰州理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1