当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于半监督学习的晶圆图批量分析方法技术

技术编号:20004799 阅读:27 留言:0更新日期:2019-01-05 17:35
本发明专利技术公开了一种基于半监督学习的晶圆图批量分析方法,该方法包括以下步骤:对晶圆图进行预处理;对预处理后的晶圆图进行筛选;使用有标签及无标签晶圆图训练半监督模型;筛选无标签晶圆图优化半监督模型;进行晶圆图分析。本发明专利技术能够利用少量有标签晶圆图建立稳定高效的半监督模型,能在实际生产中准确地完成晶圆图分析。

A Wafer Graph Batch Analysis Method Based on Semi-supervised Learning

The invention discloses a wafer diagram batch analysis method based on semi-supervised learning, which includes the following steps: pre-processing wafer diagrams; screening wafer diagrams after pre-processing; training semi-supervised models using labeled and unlabeled wafer diagrams; screening semi-supervised models for optimization of unlabeled wafer diagrams; and wafer diagram analysis. The invention can use a small number of labeled wafer diagrams to establish a stable and efficient semi-supervised model, and can accurately complete wafer diagram analysis in actual production.

【技术实现步骤摘要】
一种基于半监督学习的晶圆图批量分析方法
本专利技术涉及半导体制造领域,特别是涉及一种基于半监督学习的晶圆图批量分析方法。
技术介绍
近几年,全球半导体市场需求逐步增大,集成电路产业快速发展。在集成电路产业中,晶圆生产是制造环节中耗时最多、工艺最为复杂的一环。晶圆的良率直接影响着生产成本和企业利润。晶圆图能将特定的晶圆测试数据根据对应的空间位置结合晶圆的形状展示出来。分析晶圆图时,工程师首先将需分类的晶圆图筛选出来,再根据晶圆图上的不同图形进行分类,晶圆图上不同的图形可以帮助工程师追溯产品生产过程中出现的异常因素,找出可能导致低良率的原因,从而采取一些预防及更正措施。上述过程非常费时且人工成本很高,因此设计一种高效自动化的晶圆图分析方法十分必须。现有的晶圆图分析算法主要分为两种:基于有监督学习的方法和基于无监督学习的方法。基于有监督学习的方法需要大量的有标签晶圆图支持模型的训练,晶圆图的标记同样费时费力,当生产过程的不断推进,晶圆图不断累积,为海量晶圆图打标签变得尤为困难。基于无监督学习的方法虽不需要任何有标签晶圆图,但由于缺乏标签的指导,预测效果必然有所削弱,难以高效准确地完成晶圆图分析。
技术实现思路
本专利技术的目的在于针对现有技术的不足,提供一种基于半监督学习的晶圆图批量分析方法,综合有监督学习和无监督学习的优势,利用有标签晶圆图和无标签晶圆图同时训练模型。本专利技术的目的是通过以下技术方案来实现的:一种基于半监督学习的晶圆图批量分析方法,所述方法包括下列步骤:S1、对所有方形晶圆图进行预处理;S2、对预处理后的晶圆图进行筛选,筛选出图中具有连通的缺陷芯片块,且连通区域面积分数大于阈值K的晶圆图。连通区域面积分数为连通区域面积占晶圆图总面积的百分数;S3、使用有标签及无标签晶圆图训练半监督模型;S301、从步骤S2筛选出的晶圆图中,挑选若干晶圆图中作为训练样本,并根据连通区域的形状类别,对部分训练样本进行标记作为有标签样本,其余的训练样本为无标签样本;利用训练样本进行半监督模型训练。S302、利用已训练完的Ladder网络对训练样本中无标签晶圆图进行预测,获得对应于不同标签的概率向量;S303、计算各晶圆图预测结果的信息熵,公式如下:其中,H(x)表示晶圆图x的对应信息熵;pi表示晶圆图x被分到形状类别i的概率;S304、按照信息熵从大到小排序,筛选出前N%个晶圆图进行人工标记,标记后作为有标签样本,按照步骤S301用于半监督模型训练优化;或筛选出倒数M%个晶圆图,使用其预测标签标记后,作为有标签样本,按照步骤S301用于半监督模型训练优化;S305、重复步骤S304,直到半监督模型的损失函数的数值小于预设值T。S4、利用步骤S305优化后半监督模型对剩余的晶圆图进行分析。进一步地,所述步骤S1的预处理包括:S101、晶圆图降噪;S102、统一晶圆图尺寸并处理成便于分析的尺寸,晶圆图尺寸包括晶圆图宽度及长度;进一步地,所述步骤S2的筛选通过以下方法实现:将无明显缺陷图形的晶圆图标记为0,存在明显缺陷图形的晶圆图标记为1,其中存在明显缺陷图形的晶圆图为:图中具有连通的缺陷芯片块,且连通区域面积大于阈值K的晶圆图;训练一个基于卷积神经网络(CNN)的二分类器。使用训练好的二分类器从大量晶圆图中挑选出需预测的晶圆图,即有明显缺陷图案的晶圆图。进一步地,阈值K在2.5%以上。进一步地,N=20,M=20。进一步地,损失函数用交叉熵描述,预设值T不大于0.1。本专利技术的有益效果是,本专利技术能在较少有标签晶圆图的指导下,充分利用无标签晶圆图的信息,高效准确地完成晶圆图分析。随着生产过程的进行,晶圆图数量逐渐增加,筛选具有较高信息量或较高预测准确度的无标签样本进行进一步的标记并用于优化模型,从而得到更优的性能。附图说明图1是本专利技术方法的流程图;图2是滤波前的晶圆图;图3是滤波后的晶圆图;图4是Ladder网络的示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图及实例,对本专利技术做出进一步详细清楚的描述,具体涉及一种基于半监督学习的晶圆图批量分析方法,如图1所示,具体实施步骤如下:S1、对所有方形晶圆图进行预处理;S101、晶圆图降噪,使用中值滤波去噪,图2所示为中值滤波前的晶圆图,图3所示为中值滤波后的晶圆图;S102、统一晶圆图尺寸并处理成便于分析的尺寸,晶圆图尺寸包括晶圆图宽度及长度;S2、对预处理后的晶圆图进行筛选,筛选出图中具有连通的缺陷芯片块,且连通区域面积分数大于阈值2.5%的晶圆图。连通区域面积分数为连通区域面积占晶圆图总面积的百分数;S201、将无明显缺陷图形的晶圆图标记为0,存在明显缺陷图形的晶圆图标记为1,其中存在明显缺陷图形的晶圆图为:图中具有连通的缺陷芯片块,且连通区域面积大于阈值2.5%的晶圆图;训练一个基于卷积神经网络(CNN)的二分类器。网络结构为输入层-卷积层-池化层-卷积层-池化层-全连接层-全连接层-Softmax输出层,网络的参数如下:第1卷积层,设置特征映射图数目为6,滤波器尺寸为5*5;第2池化层,设置下采样尺寸为2;第3卷积层,设置特征映射图数目为16,滤波器尺寸为5*5;第4池化层,设置下采样尺寸为2;第5全连接层,设置特征映射图数目为120;第6全连接层,设置特征映射图数目为2;第7Softmax层,设置特征映射图数目为2;S202、使用训练好的二分类器从大量晶圆图中挑选出需预测的晶圆图,即有明显缺陷图案的晶圆图。S3、使用有标签及无标签晶圆图训练半监督模型,如图4中所示Ladder网络;S301、从步骤S2筛选出的晶圆图中,挑选若干晶圆图中作为训练样本,并根据连通区域的形状类别,对部分训练样本进行标记作为有标签样本,其余的训练样本为无标签样本;利用训练样本进行半监督模型训练。根据半监督模型损失函数优化求解,Ladder网络总损失函数如下:Ctotal=Csupervised+Cunsupervised其中,Ctotal作为总损失函数;Csupervised表示有监督误差,由有标签晶圆图的预测误差构成;Cunsupervised表示无监督误差,由网络各层的重构特征误差组成;N表示输入晶圆图数量;tn表示输入第n个晶圆图xn的目标标签;y表示晶圆图xn的预测标签;P表示晶圆图xn被正确预测的概率;L表示网络的总层数;λl表示第l层网络无监督误差的权重;ml表示第l层网络的节点数;zn(l)和表示晶圆图xn在Ladder网络中的编码器和解码器第l层对应的隐层特征。Ladder网络包括编码器,解码器和加噪编码器三个部分。编码器和加噪编码器共享参数,编码器公式如下:z(l)=W(l)h(l-1)h(l)=φ(γ(l)(z(l)+β(l)))h(0)=xy=z(L)其中,z(l)和h(l)是编码器第l层对应的隐层特征;z(L)是编码器输出层输出的预测结果概率向量;W(l)是编码器第l层和第l-1层之间的权重矩阵;γ(l),β(l)是编码器第l层的可训练参数;编码器网络层为输出层或普通网络层时,φ(·)分别对应Softmax函数或ReLU激活函数。加噪编码器的每层网络都加入了高斯噪声n(l)~N(0,σn2),公式如下:其中,是高斯噪声分布的方差;输入晶圆本文档来自技高网...

【技术保护点】
1.一种基于半监督学习的晶圆图批量分析方法,其特征在于,所述方法包括下列步骤:S1、对所有方形晶圆图进行预处理;S2、对预处理后的晶圆图进行筛选,筛选出图中具有连通的缺陷芯片块,且连通区域面积分数大于阈值K的晶圆图。连通区域面积分数为连通区域面积占晶圆图总面积的百分数;S3、使用有标签及无标签晶圆图训练半监督模型;S301、从步骤S2筛选出的晶圆图中,挑选若干晶圆图中作为训练样本,并根据连通区域的形状类别,对部分训练样本进行标记作为有标签样本,其余的训练样本为无标签样本;利用训练样本进行半监督模型训练。S302、利用已训练完的Ladder网络对训练样本中无标签晶圆图进行预测,获得对应于不同标签的概率向量;S303、计算各晶圆图预测结果的信息熵,公式如下:

【技术特征摘要】
1.一种基于半监督学习的晶圆图批量分析方法,其特征在于,所述方法包括下列步骤:S1、对所有方形晶圆图进行预处理;S2、对预处理后的晶圆图进行筛选,筛选出图中具有连通的缺陷芯片块,且连通区域面积分数大于阈值K的晶圆图。连通区域面积分数为连通区域面积占晶圆图总面积的百分数;S3、使用有标签及无标签晶圆图训练半监督模型;S301、从步骤S2筛选出的晶圆图中,挑选若干晶圆图中作为训练样本,并根据连通区域的形状类别,对部分训练样本进行标记作为有标签样本,其余的训练样本为无标签样本;利用训练样本进行半监督模型训练。S302、利用已训练完的Ladder网络对训练样本中无标签晶圆图进行预测,获得对应于不同标签的概率向量;S303、计算各晶圆图预测结果的信息熵,公式如下:其中,H(x)表示晶圆图x的对应信息熵;pi表示晶圆图x被分到形状类别i的概率;S304、按照信息熵从大到小排序,筛选出前N%个晶圆图进行人工标记,标记后作为有标签样本,按照步骤S301用于半监督模型训练优化;或筛选出倒数M%个晶圆图,使用其预测标签标记后,作为有标签样本,按照步骤S301用于半监督模型训练优化;S305、重复步骤S304,...

【专利技术属性】
技术研发人员:倪东孔煜婷
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1