一种基于随机森林的光纤生产合格指标预测方法技术

技术编号:33391326 阅读:16 留言:0更新日期:2022-05-11 23:08
本发明专利技术公开了一种基于随机森林的光纤生产合格指标预测方法,该方法包括以下步骤:获取产品特征流通图,作为随机森林算法的输入特征;构建决策树节点;判断所述决策树节点是否为叶子节点,若是,则求当前节点所有Y的平均值,若否,进行下一步;计算得到训练集合X的特征个数C和集合大小N;判断C是否大于0,若否,则构造左右两个子节点,两个子节点递归执行本步骤,直到到达叶子节点并返回,若是则进行下一步;切分训练集,计算切分后的不纯净度;判断当前切分点的不纯净度是否小于当前节点最小的不纯净度,若是则存储该切分点和切分特征,若否则执行下一步;判断是否遍历到最后一个值。本发明专利技术预测出能优化生产的参数。本发明专利技术预测出能优化生产的参数。本发明专利技术预测出能优化生产的参数。

【技术实现步骤摘要】
一种基于随机森林的光纤生产合格指标预测方法


[0001]本专利技术涉及光纤生产领域,具体来说,涉及一种基于随机森林的光纤生产合格指标预测方法。

技术介绍

[0002]在光纤生产过程中,通常会有一些指标来评价生产的合格情况,这些指标的好坏影响着产品的验收。由于产品加工过程是相对固定的,因此原料的一些特征是最终合格指标的重要影响因素。企业迫切希望能根据原料的参数特征能提前预知产品最终的合格指标,以便及时做出调整,从而减少成本,提高产品合格率。
[0003]目前大部分企业采用机理模型加人工经验的方式,但存在一些问题,一方面机理模型的准确率较低,影响着后续工作,且预测速度并不高效,这对机器生产的速度来说很难接受;另一方面人工指导受到工人工作状态所影响,容易误操作和判断不正确的情况。
[0004]针对相关技术中的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005](一)解决的技术问题
[0006]针对现有技术的不足,本专利技术提供了基于随机森林的光纤生产合格指标预测方法,具备对已有生产线的数据参数和产品剖面特征分析,从而通过模型学习来预测出能优化生产的参数的优点,进而解决了传统机理模型精度和速度较低,且整个过程受到人工状态影响的问题。
[0007](二)技术方案
[0008]为实现上述对已有生产线的数据参数和产品剖面特征分析,从而通过模型学习来预测出能优化生产的参数的优点,本专利技术采用的具体技术方案如下:
[0009]一种基于随机森林的光纤生产合格指标预测方法,该方法包括以下步骤:
[0010]S1:获取若干个产品的剖面特征,并将若干个产品的剖面特征组成产品特征流通图,作为随机森林算法的输入特征,其中,输入特征包括芯棒模场直径及折射率剖面等;
[0011]S2:输入训练集合(X,Y),构建决策树节点,其中,X为筛选出的产品输入特征,Y为要预测的合格指标;
[0012]S3:判断所述决策树节点是否为叶子节点,若是,则求当前节点所有Y的平均值,并作为该叶子节点的预测值,并接受训练,若否,进行下一步;
[0013]S4:计算得到训练集合X的特征个数C和集合大小N;
[0014]S5:判断C是否大于0,若否,则根据当前最优划分,将训练集合划分为两个集合,据此构造左右两个子节点,两个子节点递归执行本步骤,直到到达叶子节点并返回,若是则进行下一步;
[0015]S6:遍历第C个特征在训练集中的所有取值,且以每个值为切分点,计算切分后的不纯净度;
[0016]S7:判断当前切分点的不纯净度是否小于当前节点最小的不纯净度,若是则存储该切分点和切分特征,若否则执行下一步;
[0017]S8:判断是否遍历到最后一个值,若是,则执行步骤S5,若否,则执行步骤S6;
[0018]其中,使用Local Outlier Factor算法来进行原始数据的异常点检测,并在对输入数据进行随机森林算法训练前将异常点剔除,同时在随机森林算法训练过程中,采用网格搜索算法来搜寻模型的最佳参数。
[0019]进一步的,所述产品的生产过程包括芯棒生产、芯棒检测、光棒生产、光纤生产和光纤检测。
[0020]进一步的,所述随机森林算法训练后的输出特征为截止波长和光纤模场直径。
[0021]进一步的,所述将若干个产品的剖面特征组成产品特征流通图时,通过将剖面特征可视化,提取影响预测结果的特征来组成产品特征流通图。
[0022]进一步的,所述S5中据此构造左右两个子节点,两个子节点递归执行本步骤,直到到达叶子节点并返回还包括以下步骤:
[0023]选择第j个特征和它的取值s作为切分变量和切分点,并将训练集合(X,Y)划分为区域R1(j,s)和区域R2(j,s),其中:
[0024]R1(j,s)={x∣x
(j)
≤s},R2(j,s)={x∣x
(j)
>s};
[0025]利用公式:寻找最优切分变量j和切分点s,
[0026][0027]i为非零自然数,x、y为训练集,c1和c2分别表示数据集被划分成两部分后的输出值,和表示c1和c2的函数值,ave表示求平均值函数;
[0028]采用穷举找到最优的切分变量j和最优切分点s,并继续循环执行S5中的步骤,直到满足停止条件。
[0029]进一步的,所述使用Local Outlier Factor算法来进行异常点检测还包括以下步骤:
[0030]设定点p的第k距离记做d
k
(p);
[0031]点p的第k距离邻域记为N
k
(p),代表的是点p的第k距离范围以内的所有的数据点,点p的第k邻域点个数为|N
k
(p)|≥k;
[0032]点a对于点p的可达距离定义为:
[0033]d(a,p)=max(d
k
(p),d(a,p));
[0034]点p的局部可达密度为;
[0035]其中,reach

dist表示可达距离;
[0036]a
i
的局部离群因子定义如下:
[0037]局部离群因子越小,局部可达密度越大,a
i
是离群点的可能性越小,反之a
i
是异常点的可能性越大,i为非零自然数。
[0038]进一步的,所述使用Local Outlier Factor算法来进行异常点检测之后进行数据点的归一化处理。
[0039]进一步的,所述数据点的归一化处理包括以下步骤:
[0040]对数据点特征e1,e2,

,e
n
进行标准化:
[0041]并得到f1,f2,

,f
n
∈[0,1],为无量纲的数据,是所运算特征中数据的最小值,是所运算特征中数据的最大值;j及n均为非零自然数。
[0042]进一步的,所述采用网格搜索算法来搜寻模型的最佳参数时,在指定的参数范围内,按步长依次调整参数,并利用调整的参数训练学习器,从所有的参数中找到在验证集上精度最高的参数。
[0043]进一步的,所述随机森林算法训练过程中,进行10折交叉验证来训练模型,取每次测试指标的均值作为模型的评价标准。
[0044](三)有益效果
[0045]与现有技术相比,本专利技术提供了基于随机森林的光纤生产合格指标预测方法,具备以下有益效果:
[0046]本专利技术通过对已有生产线的数据参数和产品剖面特征分析,从而通过模型学习来预测出能优化生产的参数。相比传统机理模型,本专利技术具有更好的精度和速度,且整个过程无需人工干预。
[0047]通过对产品生产流程进行分析,结合给定的产品数据,先确定整个需求属于机器学习中的回归过程。通过分析各个数据间的关系,本专利技术建立了对应法则来整合数据特征,形成一对一的数据以便模型训练本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于随机森林的光纤生产合格指标预测方法,其特征在于,该方法包括以下步骤:S1:获取若干个产品的剖面特征,并将若干个产品的剖面特征组成产品特征流通图,作为随机森林算法的输入特征,其中,输入特征包括芯棒模场直径及折射率剖面;S2:输入训练集合(X,Y),构建决策树节点,其中,X为筛选出的产品输入特征,Y为要预测的合格指标;S3:判断所述决策树节点是否为叶子节点,若是,则求当前节点所有Y的平均值,并作为该叶子节点的预测值,并接受训练,若否,进行下一步;S4:计算得到训练集合X的特征个数C和集合大小N;S5:判断C是否大于0,若否,则根据当前最优划分,将训练集合划分为两个集合,据此构造左右两个子节点,两个子节点递归执行本步骤,直到到达叶子节点并返回,若是则进行下一步;其中据此构造左右两个子节点,两个子节点递归执行本步骤,直到到达叶子节点并返回,其中,还包括以下步骤:选择第j个特征和它的取值s作为切分变量和切分点,并将训练集合(X,Y)划分为区域R1(j,s)和区域R2(j,s),其中:R1(j,s)={x∣x
(j)
≤s},R2(j,s)={x∣x
(j)
>s};利用公式:寻找最优切分变量j和切分点s,i为非零自然数,x、y为训练集,c1和c2分别表示数据集被划分成两部分后的输出值,和表示c1和c2的函数值,ave表示求平均值函数;采用穷举找到最优的切分变量j和最优切分点s,并继续循环执行S5中的步骤,直到满足停止条件;S6:遍历第C个特征在训练集中的所有取值,且以每个值为切分点,计算切分后的不纯净度;S7:判断当前切分点的不纯净度是否小于当前节点最小的不纯净度,若是则存储该切分点和切分特征,若否则执行下一步;S8:判断是否遍历到最后一个值,若是,则执行步骤S5,若否,则执行步骤S6;其中,使用Local Outlier Factor算法来进行原始数据的异常点检测,并在对输入数据进行随机森林算法训练前将异常点剔除,同时在随机森林算法训练过程中,采用网格搜索算法来搜寻模型的最佳参数。2.根据权利要求1所述的一种基于随机森林的光纤生产合格指标预测方法,其特征在于,所述产品的生产过程包括芯棒生产、芯棒检测、光棒生产、光纤生产和光纤检测。3.根据权利要求1所述的一种基于随机森林的光纤生产合格指标预测方法,其特征在于,所述随机森林算法训练后的输出特征为截止波长和...

【专利技术属性】
技术研发人员:王峰薛凯
申请(专利权)人:无锡雪浪数制科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1