面向流程型工业生产数据流的回归模型选择方法及系统技术方案

技术编号:38007036 阅读:11 留言:0更新日期:2023-06-30 10:24
本发明专利技术涉及一种面向流程型工业生产数据流的回归模型选择方法及系统,其中,所述方法包括:A1、获取每一待评测回归模型以及与该待评测回归模型所对应的评测数据集;A2、将每一所述评测数据集按照预先设定规则划分为k个子数据集;A3、针对k个子数据集,获取该待评测回归模型的模型评分;该待评测回归模型的模型评分由每一子数据集的评测指标值计算得到;其中,每一子数据集的评测指标值包括:修正误差百分比指标值、拟合度相似指标值、向量相似性指标值、结构相似指标值;A4、基于每一待评测回归模型的模型评分,确定最优待评测回归模型。确定最优待评测回归模型。确定最优待评测回归模型。

【技术实现步骤摘要】
面向流程型工业生产数据流的回归模型选择方法及系统


[0001]本专利技术涉及流程型工业生产
,尤其涉及一种面向流程型工业生产数据流的回归模型选择方法及系统。

技术介绍

[0002]随着机器学习技术在流程型工业生产过程中的广泛应用,数学模型性能的好坏直接影响对生产过程的控制效果。现有技术中,回归类数学模型的建立主要依赖人为的经验进行超参数设定,通过MAE、MSE、RMSE等模型评判指标作为评判标准对超参数不断调整,最后选择最佳的模型作为输出结果。
[0003]在流程型的工业生产场景下,由于生产工况不稳定性,要求数学模型具有高效的自动更新能力以适应工况的频繁波动,而人力无法像机器一样进行大量的迭代尝试且缺少对模型持续有效性的检测。

技术实现思路

[0004](一)要解决的技术问题
[0005]鉴于现有技术的上述缺点、不足,本专利技术提供一种面向流程型工业生产数据流的回归模型选择方法及系统,其解决了现有技术中依赖人为经验确定回归模型导致效率低下以及现有技术中不能确定出一个能够综合反映出最有效的回归模型的技术问题。
[0006](二)技术方案
[0007]为了达到上述目的,本专利技术采用的主要技术方案包括:
[0008]第一方面,本专利技术实施例提供一种面向流程型工业生产数据流的回归模型选择方法,所述方法包括:
[0009]A1、获取每一待评测回归模型以及与该待评测回归模型所对应的评测数据集;
[0010]A2、将每一所述评测数据集按照预先设定规则划分为k个子数据集;
[0011]A3、针对k个子数据集,获取该待评测回归模型的模型评分;
[0012]该待评测回归模型的模型评分由每一子数据集的评测指标值计算得到;其中,每一子数据集的评测指标值包括:修正误差百分比指标值、拟合度相似指标值、向量相似性指标值、结构相似指标值;
[0013]A4、基于每一待评测回归模型的模型评分,确定最优待评测回归模型。
[0014]优选地,
[0015]其中,与该待评测回归模型所对应的评测数据集包括:N条评测数据;
[0016]每条评测数据包括:该待评测回归模型训练所使用的自变量及与该自变量对应的因变量的实际值以及与该自变量对应的待评测回归模型所得到的因变量的预测值和表示该条测评数据时间的时间戳。
[0017]优选地,所述A2具体包括:
[0018]按照时间顺序将评测数据集随机划分为k个子数据集;
[0019]其中,k为预先设定值,且k≥5;
[0020]其中,该评测数据集所对应的k个子数据集满足:
[0021]任一子数据集包含测评数据的条数大于10;
[0022]任意两个子数据集之间不相交;
[0023]最大子数据集的测评数据的条数小于等于最小子数据集的测评数据的条数的2倍。
[0024]优选地,所述A3具体包括:
[0025]A31、针对k个子数据集,分别获取每一子数据集的评测指标值;
[0026]A32、基于每一子数据集的评测指标值,获取与该k个子数据集所对应的待评测回归模型的第一评测矩阵;
[0027]A33、基于所述待评测回归模型的第一评测矩阵和预先设定的阈值,获取该待评测回归模型的第二评测矩阵;
[0028]A34、基于所述待评测回归模型的第二评测矩阵,获取所述待评测回归模型的模型评分。
[0029]优选地,
[0030]所述修正误差百分比指标值预先采用公式(1)计算得到;
[0031]所述公式(1)为:
[0032][0033]其中,S1(y_true,y_pred)为所述修正误差百分比指标值;
[0034]y_true
i
为该子数据集中的第i条测评数据中的因变量的实际值;
[0035]y_pred
i
为该子数据集中的第i条测评数据中的因变量的预测值;
[0036]n为该子数据集中测评数据的条数;
[0037]所述拟合度相似指标值预先采用公式(2)计算得到;
[0038]所述公式(2)为:
[0039]S2(y_true,y_pred)=1

|1

w|;
[0040]其中,w为针对该子数据集预先利用最小二乘法求解使得损失函数的损失值最小化时所对应的参数w;
[0041]所述损失函数为:
[0042]其中,E为损失函数的损失值;
[0043]ε
i
为该子数据集中第i条测评数据所对应的预先设定的服从标准正态分布的随机项;
[0044]S2(y_true,y_pred)为拟合度相似指标值;
[0045]所述向量相似性指标值预先采用公式(3)计算得到;
[0046]所述公式(3)为:
[0047][0048]其中,
[0049]其中,S3(y_true,y_pred)为向量相似性指标值;
[0050]所述结构相似指标值预先采用公式(4)计算得到;
[0051]所述公式(4)为:
[0052][0053]其中,μ1为该子数据集中因变量的实际值y_true的均值;
[0054]μ2为该子数据集中因变量的预测值y_pred的均值;
[0055]σ1为该子数据集中因变量的实际值y_true的方差;
[0056]σ2为该子数据集中因变量的预测值y_pred的方差;
[0057]σ
12
为该子数据集中因变量的实际值y_true与该子数据集中因变量的预测值y_pred的协方差;
[0058]C1、C2分别为预先设定的常数。
[0059]优选地,
[0060]所述第一评测矩阵为:
[0061][0062]其中矩阵元素S
1j
表示在k个子数据集中的第j个子数据集的修正误差百分比指标值;
[0063]矩阵元素S
2j
表示在k个子数据集中的第j个子数据集的拟合度相似指标值;
[0064]矩阵元素S
3j
表示在k个子数据集中的第j个子数据集的向量相似性指标值;
[0065]矩阵元素S
4j
表示在k个子数据集中的第j个子数据集的结构相似指标值。
[0066]优选地,所述A33具体包括:
[0067]针对所述第一评测矩阵的任一矩阵元素,按照公式(5)确定新的数值,并得到与所述第一评测矩阵对应的第二评测矩阵;
[0068]所述公式(5)为:
[0069][0070]其中,S
ij
为所述第一评测矩阵的第j列的第i行的元素数值,其中,i=1,2,3,4;
[0071]δ为预先设定的阈值,且0.5≥δ≥0.1;
[0072]为s
ij
的新的数值;
[0073]所述第二评测矩阵为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向流程型工业生产数据流的回归模型选择方法,其特征在于,所述方法包括:A1、获取每一待评测回归模型以及与该待评测回归模型所对应的评测数据集;A2、将每一所述评测数据集按照预先设定规则划分为k个子数据集;A3、针对k个子数据集,获取该待评测回归模型的模型评分;该待评测回归模型的模型评分由每一子数据集的评测指标值计算得到;其中,每一子数据集的评测指标值包括:修正误差百分比指标值、拟合度相似指标值、向量相似性指标值、结构相似指标值;A4、基于每一待评测回归模型的模型评分,确定最优待评测回归模型。2.根据权利要求1所述的面向流程型工业生产数据流的回归模型选择方法,其特征在于,其中,与该待评测回归模型所对应的评测数据集包括:N条评测数据;每条评测数据包括:该待评测回归模型训练所使用的自变量及与该自变量对应的因变量的实际值以及与该自变量对应的待评测回归模型所得到的因变量的预测值和表示该条测评数据时间的时间戳。3.根据权利要求2所述的面向流程型工业生产数据流的回归模型选择方法,其特征在于,所述A2具体包括:按照时间顺序将评测数据集随机划分为k个子数据集;其中,k为预先设定值,且k≥5;其中,该评测数据集所对应的k个子数据集满足:任一子数据集包含测评数据的条数大于10;任意两个子数据集之间不相交;最大子数据集的测评数据的条数小于等于最小子数据集的测评数据的条数的2倍。4.根据权利要求3所述的面向流程型工业生产数据流的回归模型选择方法,其特征在于,所述A3具体包括:A31、针对k个子数据集,分别获取每一子数据集的评测指标值;A32、基于每一子数据集的评测指标值,获取与该k个子数据集所对应的待评测回归模型的第一评测矩阵;A33、基于所述待评测回归模型的第一评测矩阵和预先设定的阈值,获取该待评测回归模型的第二评测矩阵;A34、基于所述待评测回归模型的第二评测矩阵,获取所述待评测回归模型的模型评分。5.根据权利要求4所述的面向流程型工业生产数据流的回归模型选择方法,其特征在于,所述修正误差百分比指标值预先采用公式(1)计算得到;所述公式(1)为:
其中,S1(y_true,y_pred)为所述修正误差百分比指标值;y

true
i
为该子数据集中的第i条测评数据中的因变量的实际值;y

pred
i
为该子数据集中的第i条测评数据中的因变量的预测值;n为该子数据集中测评数据的条数;所述拟合度相似指标值预先采用公式(2)计算得到;所述公式(2)为:S2(y_true,y_pred)=1

|1

w|;其中,w为针对该子数据集预先利用最小二乘法求解使得损失函数的损失值最小化时所对应的参数w;所述损失函数为:其中,E为损失函数的损失值;ε
i
为该子数据集中第i条测评数据所对应的预先设定的服从标准正态分布的随机项;S2(y_true,y

pred)为拟合度相似指标值;所述向量相似性指标值预先采用公式(3)计算得到;所述公式(3)为:其中,其中,S3(y_true,y_pred)为向量相似性指标值;所述结构相似指标值预先采用公式(4)...

【专利技术属性】
技术研发人员:南玉泽王栋薛大禹党海峰夏建涛
申请(专利权)人:北京全应科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1