当前位置: 首页 > 专利查询>PDF决策公司专利>正文

通过累积预测进行机器学习变量选择和根本原因发现制造技术

技术编号:33628324 阅读:25 留言:0更新日期:2022-06-02 01:23
一系列模型累加增加数量的变量的r平方值,以便量化每个变量对预测目标良率或参数响应的重要性。应的重要性。应的重要性。

【技术实现步骤摘要】
【国外来华专利技术】通过累积预测进行机器学习变量选择和根本原因发现
[0001]交叉引用
[0002]本申请要求2019年10月16日提交的名称为Machine Learning Variable Selection and Root Cause Discovery by Cumulative Prediction的美国临时申请号62/916171的优先权,所述申请全文以引用方式并入本文。


[0003]本申请涉及半导体制造过程,并且更具体地涉及一种用于由机器学习模型利用累积预测来标识关键过程变量的方案。

技术介绍

[0004]在机器学习和建模用于半导体制造过程方面的两个基本目标是准确良率(或连续参数值)预测以及根本原因发现。根本原因发现涉及量化模型中每个变量对所选择良率(或连续参数值)的重要性并且量化每个变量对每次预测观察的重要程度。
[0005]遗憾的是,这两个目标通常是相互对立的。利用简单模型,诸如线性回归,在总体上和针对每次观察确定最重要变量相对容易;然而,这些模型通常不准确。利用复杂机器学习方法,预测可准确得多;然而,仍然很难既在总体上又针对每次观察确定每个变量的重要性。
[0006]期望利用机器学习模型的固有能力来帮助量化特定过程变量的重要性。

技术实现思路

[0007]呈现了一种用于标识特定过程变量的重要性的方法。一系列模型累加增加数量的变量的r平方值,以便量化每个变量对预测目标良率或参数响应的重要性。
[0008]初始地,机器学习模型被配置来基于作为所述机器学习模型的输入提供的多个过程参数预测目标特征。选择所述处理参数中的第一处理参数并且将其用于确定用于预测所述目标特征的第一r平方值。然后选择所述过程参数中的第二过程参数并且将其用于确定用于基于所选择的第二过程参数预测所述目标特征的第二r平方值。如有需要,选择所述过程参数中的另外的过程参数并且将其用于确定用于基于所选择的另外的过程参数预测所述目标特征的对应的另外的r平方值,直到所述第一r平方值、所述第二r平方值和所述另外的r平方值的累加增加小于阈值为止。然后可根据参数的影响对所述参数进行排名并且将所述参数标识为机器学习模型的关键输入。
[0009]附图描述
[0010]图1是示出由于所选择过程参数而对良率预测的增量和累积贡献的表。
[0011]图2是示出基于图1中标识的过程参数,多个晶圆样品的预测良率与实际良率之间的晶圆级相关性的图形绘图。
[0012]图3是示出对于来自图2的晶圆样品中的两个晶圆样品,所选择过程参数对良率的相对影响的条形图。
[0013]图4是示出来自仅使用最重要的输入变量建立的模型的实际良率与预测良率之间的晶圆级相关性的图形绘图。
[0014]图5是示出所选择过程参数对来自图2的晶圆样品中的两个晶圆样品的良率的相对影响的平均值的条形图。
[0015]图6是示出在基于单个参数观察之后用于来自图2的晶圆样品中的两个晶圆样品的预测空间模式和实际空间模式的热图。
[0016]图7是示出在基于两个参数观察之后用于来自图2的晶圆样品中的两个晶圆样品的预测空间模式和实际空间模式的热图。
[0017]图8是示出用于标识过程参数的累积影响的方法的流程图。
具体实施方式
[0018]机器学习(ML)在对半导体工艺进行建模中发挥着越来越积极的作用,尤其是在预测和根本原因分析方面。逐步回归的原理中的一些可用于优化任何复杂ML方法(例如,神经网络、极限梯度提升等)并且特别地基于交叉验证r平方方法的ML模型的输入参数,以删除不会改进对训练数据的预测的变量并且仅保留对预测重要的那些变量。
[0019]然而,可通过首先构建可能的最佳单变量模型来进一步采用所述概念。接着,构建可能的最佳双变量模型,所述可能的最佳双变量模型根据定义必须包括来自最佳单变量模型的变量;并且然后构建可能的最佳三变量模型,所述最佳三变量模型根据定义必须包括来自最佳双变量模型的变量。重复此过程,直到所有变量按照“最重要”到“最不重要”完成排序为止,或者直到最佳n变量模型预测到通过逐步变量选择过程选择的所有变量的交叉验证r平方值的期望或可接受百分比为止。
[0020]因此,模型的累积序列可用于基于交叉验证r平方值的改进来量化每个变量对目标良率(或连续参数)响应的总体预测的重要性。
[0021]例如,图1示出表100,其中数个过程参数列出了条目以便通过使用r平方值作为量度来展示如何产生良率性能的累积改进。在表100中,行111、112、113列出所选择的晶圆参数,其中晶圆分组标识符列出在列121中,晶圆参数的源列出在列122中,累积交叉验证r平方百分比值列出在列123中,所述参数的增量交叉验证r平方百分比值列出在列124中,并且参数编号(例如,按增量影响的参数排名)列出在列125中。
[0022]行111中列出的第一参数是PCM

32,其源(列122)是第一物理测试结构对晶圆的连续参数测量,并且其对标识方差或偏移的增量贡献(列124)基于来自统计分析的r平方值为15.4%。添加第二参数PCM

1(行112)(第二不同测试结构对同一晶圆的连续参数测量)具有12.4%的增量影响并且将所解释累积方差增加到27.8%,而添加第三个参数PE

1(行113)(晶圆设备历史(WEH)中标识的过程工具)(其增量影响为9.9%)将累积方差总计升高到37.7%。基于此交叉验证r平方统计分析,这些参数是足以包括在机器学习模型中仅有的三个重要的变量,例如在此实例中,对方差的增量贡献大近似10%。
[0023]理解每个参数对总体模型的重要程度是有价值的,但可能不如理解每个参数对特定观察的重要程度那样有价值。例如,可能通过接触电阻变化来最佳地预测数个低良率晶圆,从而给予用户允许更快地诊断根本原因的信息。考虑这对于简单的示例性数据集是如何工作的。
[0024]图2示出对于图1中考虑的参数(即,PCM

1、PCM

2和PE

1),基于机器学习模型预测的数百个晶圆的实际良率与预测良率的相关性绘图200。来自不同批次(批次134_W06和批次143_W09)的两个随机地选择的晶圆210、220两者在最终模型中得到了很好的预测,但问题是哪些参数对每个晶圆重要。
[0025]首先,定义准确度的量度。由于此特定模型专注于预测芯片和晶圆良率,因此两个准确度量度是(i)预测晶圆良率与实际晶圆良率之间的差异,以及(ii)跨晶圆的预测良率和实际良率的芯片级相关性中的r平方值。对于芯片级相关性,通过对每个芯片与紧邻的芯片求平均值来将数据平滑处理,如由线230表示,以得到良率和良率预测的更平滑表示。对于图1中标识的三个累积预测中的每一个,考虑了晶圆预测的准确度。
[0026]每个累积模型的晶圆级预测误差在图3中以条形图300中示出。晶圆210(批次134_W06)的预测误差示出在左侧本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法,其包括:配置机器学习模型以基于作为所述机器学习模型的输入提供的多个过程参数来预测目标特征;选择所述过程参数中的第一过程参数并且确定用于基于所选择的第一过程参数预测所述目标特征的第一r平方值;选择所述过程参数中的第二过程参数并且确定用于基于所选择的第二过程参数预测所述目标特征的第二r平方值;选择所...

【专利技术属性】
技术研发人员:R
申请(专利权)人:PDF决策公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1