当前位置: 首页 > 专利查询>浙江大学专利>正文

基于哈里斯鹰算法优化随机森林的良率预测方法及系统技术方案

技术编号:38849752 阅读:16 留言:0更新日期:2023-09-17 09:58
本发明专利技术公开了一种基于哈里斯鹰算法优化随机森林的良率预测方法及系统,方法包括:获取历史晶圆允收测试数据集;对历史晶圆允收测试数据集中的允收测试数据进行预处理,得到允收测试样本集;通过哈里斯鹰算法迭代优化随机森林模型的关键框架参数并基于关键框架参数对随机森林模型进行修改,构建晶圆良率预测预训练模型;基于允收测试样本集对晶圆良率测试预训练模型进行训练,得到晶圆良率预测模型;将待测允收测试数据输入晶圆良率预测模型中,得到预测结果。本发明专利技术能够降低良率预测成本,提高良率预测准确性。提高良率预测准确性。提高良率预测准确性。

【技术实现步骤摘要】
基于哈里斯鹰算法优化随机森林的良率预测方法及系统


[0001]本专利技术涉及大数据算法
,尤其涉及一种基于哈里斯鹰算法优化随机森林的良率预测方法及系统。

技术介绍

[0002]在集成电路制造过程中,工艺参数是影响芯片表现的关键因素,工艺参数的异常会使得芯片性能下降,导致良率损失。为了全面地了解和监控制造工艺参数的影响,往往会在晶圆制造过程中进行大量的测试,以此有效地对制造过程中的工艺参数进行控制和改进,提高晶圆良率,降低芯片成本。
[0003]晶圆允收测试(WAT)又称为电性测试(E

Test),是一种重要的晶圆测试方式,其主要是在晶圆的划线槽空间制造一些特殊的测试结果,对晶圆上的芯片的电性参数进行测试,收集的晶圆电特性参数数据能间接地反映工艺参数。对于晶圆允收测试数据进行分析,能够有针对性地对IC制造过程中不好的工艺参数进行提升改进。在现有技术中,晶圆允收测试属于一种比较主流的测试方式,但是如何有效的对晶圆允收测试数据进行处理并且合理利用这些数据,一直是此
的难题。其次,现有的算法模型存在准确度不高,数据处理量偏小等各种问题亟需克服。

技术实现思路

[0004]本专利技术针对现有技术中的缺点,提供了一种基于哈里斯鹰算法优化随机森林的良率预测方法及系统。
[0005]为了解决上述技术问题,本专利技术通过下述技术方案得以解决:
[0006]一种基于哈里斯鹰算法优化随机森林的良率预测方法,包括以下步骤:
[0007]获取历史晶圆允收测试数据集
[0008]对历史晶圆允收测试数据集中的允收测试数据进行预处理,得到允收测试样本集;
[0009]通过哈里斯鹰算法迭代优化随机森林模型的关键框架参数并基于关键框架参数对随机森林模型进行修改,构建晶圆良率预测预训练模型;
[0010]基于允收测试样本集对晶圆良率测试预训练模型进行训练,得到晶圆良率预测模型;
[0011]将待测允收测试数据输入晶圆良率预测模型中,得到预测结果。
[0012]作为一种可实施方式,所述预处理至少包括异常值检测及处理、缺失值处理和数据归一化处理中的一种或多种。
[0013]作为一种可实施方式,所述缺失值处理包括缺失值删除或者缺失值填充;
[0014]所述缺失值填充包括:
[0015]基于平均值、众数、中位数对缺失值进行填充,或,建立预测模型对缺失值进行填充。
[0016]作为一种可实施方式,所述数据归一化处理包括标准归一化处理或最大最小值归一化处理。
[0017]作为一种可实施方式,所述通过哈里斯鹰算法迭代优化随机森林模型的关键框架参数并基于关键框架参数对随机森林模型进行修改,包括以下步骤:
[0018]预设哈里斯鹰算法的参数,包括种群数量、最大迭代次数、鹰群和猎物位置的变化范围及维度;
[0019]设置通过哈里斯鹰算法迭代优化随机森林算法的关键框架参数,所述关键框架参数至少包括最大弱学习器个数、决策树参数中的最大深度、最大特征数、内部节点再划分所需最小样本数和叶节点最少样本数;
[0020]分别初始化哈里斯鹰算法中鹰群与猎物的位置,选择随机森林算法的分类误差作为适应度函数,每次迭代中根据是否发现猎物、猎物的能量状态和适应度函数的大小选择不同的位置更新策略进行位置向量更新,当迭代次数达到预设的最大迭代次数时,完成优化,完成迭代后的位置向量即为优化后的关键框架参数;
[0021]其中,鹰群与猎物的位置均表示为一个1*dim大小的位置向量,dim表示维度,维度的大小代表需要优化的参数个数,在每次迭代过程中更新位置向量,所述位置向量通过所述关键框架参数构成,位置向量表示为:
[0022]X
rb
(t)=[X[0],X[1],X[2],X[3],X[4]][0023]其中,X
rb
(t)表示第t次迭代时的位置向量,t表示第t次迭代,X[0]表示最大弱学习器个数,X[1]表示决策树参数中的最大深度,X[2]表示最大特征数,X[3]表示内部节点再划分所需最小样本数,X[4]表示叶节点最少样本数。
[0024]作为一种可实施方式,所述适应度函数,表示如下:
[0025]F=1-auc score
[0026]其中,auc score表示评价指标。
[0027]作为一种可实施方式,所述哈里斯鹰算法,包括以下步骤:
[0028]在进行追逐前,根据下式确定猎物的逃逸能量:
[0029][0030]其中,E表示猎物的逃逸能量,t表示第t次迭代,T表示设置的最大迭代次数,E0表示(

1,1)之间的随机数;
[0031]当猎物的逃逸能量|E|≥1时,认为猎物逃逸能量较高,处于探索阶段,此时哈里斯鹰算法认为猎物体力充沛,鹰群在大范围内飞行寻找猎物,针对发现猎物和未发现猎物两种情况生成一个随机数q,根据q的大小选择不同策略更新下一次迭代的位置X(t+1);
[0032]当q≥0.5时,鹰群中任意一只个体都没有发现猎物的位置,根据下式随机选取鹰群中任意一只个体的飞行位置来更新自身位置:
[0033]X(t+1)=X
rd
(t)

r1|X
rd
(t)

2r2X(t)|
[0034]其中,X
rd
(t)表示第t次迭代时,从鹰群中随机挑选的一只鹰的位置,r1,r2为(0,1)之间的随机数;
[0035]当q<0.5时,鹰群发现猎物,鹰群中个体在其周围盘旋并更新位置,位置更新根据下式计算得出:
[0036]X(t+1)=(X
rb
(t)

X
m
(t))

r3[L
b
+r4(U
b

L
b
)][0037]其中,X
rb
(t)表示第t次迭代时,猎物个体的位置,X
m
(t)表示第t次迭代时,鹰群中种群的平均位置;r3,r4表示(0,1)中的随机数;L
b
和U
b
分别表示位置的上界和下界,其中,X
m
(t)根据下式计算得出:
[0038][0039]其中,N表示种群数目,X
i
(t)表示第t次迭代时种群的位置;
[0040]当猎物的逃逸能量|E|<1时,进入从探索到开发的过渡阶段中,哈里斯鹰算法根据猎物的逃逸能量大小,从探索转移到开发阶段,并将选择不同的策略进行突袭;
[0041]当进入开发阶段,鹰群有四种不同的策略对猎物进行突袭,设R是猎物成功逃脱的概率;
[0042]当|E|≥0.5和R≥0.5时,鹰群针对猎物发起软围攻,位置更新根据下式计算得出:
[0043]X(t+1)=X
rb
(t)
...

【技术保护点】

【技术特征摘要】
1.一种基于哈里斯鹰算法优化随机森林的良率预测方法,其特征在于,包括以下步骤:获取历史晶圆允收测试数据集;对历史晶圆允收测试数据集中的允收测试数据进行预处理,得到允收测试样本集;通过哈里斯鹰算法迭代优化随机森林模型的关键框架参数并基于关键框架参数对随机森林模型进行修改,构建晶圆良率预测预训练模型;基于允收测试样本集对晶圆良率测试预训练模型进行训练,得到晶圆良率预测模型;将待测允收测试数据输入晶圆良率预测模型中,得到预测结果。2.根据权利要求1所述的一种基于哈里斯鹰算法优化随机森林的良率预测方法,其特征在于,所述预处理至少包括异常值检测及处理、缺失值处理和数据归一化处理中的一种或多种。3.根据权利要求2所述的一种基于哈里斯鹰算法优化随机森林的良率预测方法,其特征在于,所述缺失值处理包括缺失值删除或者缺失值填充;所述缺失值填充包括:基于平均值、众数、中位数对缺失值进行填充,或,建立预测模型对缺失值进行填充。4.根据权利要求1所述的一种基于哈里斯鹰算法优化随机森林的良率预测方法,其特征在于,所述数据归一化处理包括标准归一化处理或最大最小值归一化处理。5.根据权利要求1所述的一种基于哈里斯鹰算法优化随机森林的良率预测方法,其特征在于,所述通过哈里斯鹰算法迭代优化随机森林模型的关键框架参数并基于关键框架参数对随机森林模型进行修改,包括以下步骤:预设哈里斯鹰算法的参数,包括种群数量、最大迭代次数、鹰群和猎物位置的变化范围及维度;设置通过哈里斯鹰算法迭代优化随机森林算法的关键框架参数,所述关键框架参数至少包括最大弱学习器个数、决策树参数中的最大深度、最大特征数、内部节点再划分所需最小样本数和叶节点最少样本数;分别初始化哈里斯鹰算法中鹰群与猎物的位置,选择随机森林算法的分类误差作为适应度函数,每次迭代中根据是否发现猎物、猎物的能量状态和适应度函数的大小选择不同的位置更新策略进行位置向量更新,当迭代次数达到预设的最大迭代次数时,完成优化,完成迭代后的位置向量即为优化后的关键框架参数;其中,鹰群与猎物的位置均表示为一个1*dim大小的位置向量,dim表示维度,维度的大小代表需要优化的参数个数,在每次迭代过程中更新位置向量,所述位置向量通过所述关键框架参数构成,位置向量表示为:X
rb
(t)=[X[0],X[1],X[2],X[3],X[4]]其中,X
rb
(t)表示第t次迭代时的位置向量,t表示第t次迭代,X[0]表示最大弱学习器个数,X[1]表示决策树参数中的最大深度,X[2]表示最大特征数,X[3]表示内部节点再划分所需最小样本数,X[4]表示叶节点最少样本数。6.根据权利要求5所述的一种基于哈里斯鹰算法优化随机森林的良率预测方法,其特征在于,所述适应度函数,表示如下:F=1-auc score其中,auc score表示评价指标。
7.根据权利要求5所述的一种基于哈里斯鹰算法优化随机森林的良率预测方法,其特征在于,所述哈里斯鹰算法,包括以下步骤:在进行追逐前,根据下式确定猎物的逃逸能量:其中,E表示猎物的逃逸能量,t表示第t次迭代,T表示设置的最大迭代次数,E0表示(

1,1)之间的随机数;当猎物的逃逸能量|E|≥1时,认为猎物逃逸能量较高,处于探索阶段,此时哈里斯鹰算法认为猎物体力充沛,鹰群在大范围内飞行寻找猎物,针对发现猎物和未发现猎物两种情况生成一个随机数q,根据q的大小选择不同策略更新下一次迭代的位置X(t+1);当q≥0.5时,鹰群中任意一只个体都没有发现猎物的位置,根据下式随机选取鹰群中任意一只个体的飞行位置来更新自身位置:X(t+1)=X
rd
(t)

r1|X
rd
(t)

2r2X(t)|其中,X
rd
(t)表示第t次迭代时,从鹰群中随机挑选的一只鹰的位置,r1,r2为(0,1)之间的随机数;当q<0.5时,鹰群发现猎物,鹰群中个体在其周围盘旋并更新位置,位置更新根据下式计算得出:X(t+1)=(X
rb
(t)

X
m
(t))

r3[L
b
+r4(U
b

L
b
)]其中,X
rb
(t)表示第t次迭代时,猎物个体的位置,X
m
(t...

【专利技术属性】
技术研发人员:陈一宁王诗琪蔡宇高大为
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1