一种晶圆缺陷数据增强方法及装置制造方法及图纸

技术编号:38208313 阅读:9 留言:0更新日期:2023-07-21 16:57
本发明专利技术涉及一种晶圆缺陷数据增强方法及装置,所述方法包括:获取晶圆图数据集,所述晶圆图数据集中包含若干缺陷类型的晶圆图数据;根据所述晶圆图数据集,确定多个训练数据集,其中,任一训练数据集中包含具有相同的单一缺陷类型的晶圆图数据;对所述多个训练数据集中对应于目标缺陷类型的目标数据集,使用所述目标数据集训练变分自编码器VAE,得到该目标缺陷类型对应的VAE;使用所述目标缺陷类型对应的VAE的解码器生成结果数据集,所述结果数据集中包含具有所述目标缺陷类型作为其标注标签的晶圆图数据。签的晶圆图数据。签的晶圆图数据。

【技术实现步骤摘要】
一种晶圆缺陷数据增强方法及装置


[0001]本专利技术涉及半导体制造领域,尤其涉及一种晶圆缺陷数据增强方法及装置。

技术介绍

[0002]在晶圆图缺陷分类识别的领域内,晶圆数据的真实性和有效数据规模是非常关键的因素。由于晶圆数据与制造工艺关系密切,涉及到一系列安全问题,目前,无法直接从公开途径获取大量真实的晶圆数据。因此现有的研究中通常都是基于数量有限的真实数据集进行的,也有部分研究是基于人工构造的缺陷数据。然而,这两种数据都有各自的缺点:对于真实数据集,其中有标注的数据少,且数据分布不平衡,标签准确性低,大部分缺陷图案不够干净,无法直接用于目标检测任务;对于人工构造的晶圆数据,其与真实数据可能存在较大的差异,失真程度较高,因此基于人工数据训练的模型在面对真实数据时可能表现很差。
[0003]在以往关于晶圆缺陷模式识别的研究中,也使用过DCGAN模型生成部分样本数量较少的缺陷图案,但对于Loc、Scratch等空间对称性和图像一致性较差的缺陷类型,生成对抗网络的效果较差。

技术实现思路

[0004]本说明书一个或多个实施例描述了一种晶圆缺陷数据增强方法及装置,以现有的真实数据集为基础,从数据集中抽取少量单一特征明显、图案干净的晶圆图数据,基于这小部分数据训练变分自编码器VAE生成模型,然后使用训练好的生成模型生成一批晶圆数据,从而实现晶圆数据量的增强。
[0005]第一方面,提供了一种晶圆缺陷数据增强方法,包括:
[0006]获取晶圆图数据集,所述晶圆图数据集中包含若干缺陷类型的晶圆图数据;
[0007]根据所述晶圆图数据集,确定多个训练数据集,其中,任一训练数据集中包含具有相同的单一缺陷类型的晶圆图数据;
[0008]对所述多个训练数据集中对应于目标缺陷类型的目标数据集,使用所述目标数据集训练变分自编码器VAE,得到该目标缺陷类型对应的VAE;
[0009]使用所述目标缺陷类型对应的VAE的解码器生成结果数据集,所述结果数据集中包含具有所述目标缺陷类型作为其标注标签的晶圆图数据。
[0010]在一种可能的实施方式中,在使用所述目标数据集训练变分自编码器VAE之前,所述方法还包括:
[0011]对于所述目标数据集中的任一晶圆图数据,对其进行形态学变换操作,得到多个扩增晶圆图数据,并将所述多个扩增晶圆图数据放入所述目标数据集中。
[0012]在一种可能的实施方式中,所述形态学变换操作至少包括:反转、旋转、放大、裁剪。
[0013]在一种可能的实施方式中,使用所述目标数据集训练变分自编码器VAE,包括:
[0014]将所述目标数据集中的晶圆图数据输入到所述VAE的编码器中进行编码,得到隐空间向量;
[0015]将所述隐空间向量输入到所述VAE的解码器中进行解码,得到解码数据;
[0016]通过最小化所述解码数据与所述晶圆图数据的误差,调整所述VAE中的参数的值。
[0017]在一种可能的实施方式中,所述误差为所述解码数据与所述晶圆图数据之间的重构损失与KL散度之和。
[0018]在一种可能的实施方式中,使用所述目标缺陷类型对应的VAE的解码器生成结果数据集,包括:
[0019]获取向量数据集,所述向量数据集中的向量的维度与训练所述VAE时生成的隐空间向量的维度相同;
[0020]将所述向量数据集输入到所述目标缺陷类型对应的VAE的解码器中,得到结果数据集。
[0021]在一种可能的实施方式中,所述获取向量数据集,包括:
[0022]随机生成若干维度为所述隐空间向量的维度的向量,并将其组成向量数据集。
[0023]在一种可能的实施方式中,所述晶圆图数据集为WM

811K数据集。
[0024]第二方面,提供了一种晶圆缺陷数据增强装置,包括:
[0025]数据获取单元,配置为,获取晶圆图数据集,所述晶圆图数据集中包含若干缺陷类型的晶圆图数据;
[0026]数据确定单元,配置为,根据所述晶圆图数据集,确定多个训练数据集,其中,任一训练数据集中包含具有相同的单一缺陷类型的晶圆图数据;
[0027]模型训练单元,配置为,对所述多个训练数据集中对应于目标缺陷类型的目标数据集,使用所述目标数据集训练变分自编码器VAE,得到该目标缺陷类型对应的VAE;
[0028]结果生成单元,配置为,使用所述目标缺陷类型对应的VAE的解码器生成结果数据集,所述结果数据集中包含具有所述目标缺陷类型作为其标注标签的晶圆图数据。
[0029]在一种可能的实施方式中,所述装置还包括:
[0030]数据扩增单元,配置为,对于所述目标数据集中的任一晶圆图数据,对其进行形态学变换操作,得到多个扩增晶圆图数据,并将所述多个扩增晶圆图数据放入所述目标数据集中。
[0031]本说明书一个或多个实施例描述了一种晶圆缺陷数据增强方法及装置,选用VAE生成模型,由于晶圆图实际上是一种二维数据,VAE在生成这类数据时更具优势,它会同时学习输入数据的生成过程和数据分布,从而能够更好地生成多样性较丰富的样本。
附图说明
[0032]为了更清楚地说明本说明书披露的多个实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书披露的多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0033]图1为本专利技术实施例公开的一种晶圆缺陷数据增强方法的框架图;
[0034]图2为本专利技术实施例公开的一种晶圆缺陷数据增强方法的流程图;
[0035]图3为本专利技术实施例公开的一种晶圆缺陷数据增强装置的示意性框图。
具体实施方式
[0036]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0037]根据一个实施例,图1示出一种晶圆缺陷数据增强方法的框架。如图1所示,所述方法所使用的框架主要包含两个部分:模型训练和缺陷晶圆图生成。模型训练部分用于根据现有的真实晶圆图数据集训练VAE生成模型,具体地,将晶圆图数据集中的数据按照缺陷类型进行分类和选取,生成多个单一缺陷类型数据集,然后对每个数据集中的晶圆图做数据扩增,得到多个扩增数据集。使用多个扩增数据集依次训练多个VAE,得到多个可以生成单一缺陷类型的VAE。缺陷晶圆图生成部分用于使用多个训练完成的VAE的解码器生成多种单一缺陷类型的晶圆图数据集。
[0038]以下将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本专利技术实施例的限定。
[0039]图2为本专利技术实施例公开的一种晶圆缺陷数据增强方法的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种晶圆缺陷数据增强方法,包括:获取晶圆图数据集,所述晶圆图数据集中包含若干缺陷类型的晶圆图数据;根据所述晶圆图数据集,确定多个训练数据集,其中,任一训练数据集中包含具有相同的单一缺陷类型的晶圆图数据;对所述多个训练数据集中对应于目标缺陷类型的目标数据集,使用所述目标数据集训练变分自编码器VAE,得到该目标缺陷类型对应的VAE;使用所述目标缺陷类型对应的VAE的解码器生成结果数据集,所述结果数据集中包含具有所述目标缺陷类型作为其标注标签的晶圆图数据。2.根据权利要求1所述的方法,其特征在于,在使用所述目标数据集训练变分自编码器VAE之前,所述方法还包括:对于所述目标数据集中的任一晶圆图数据,对其进行形态学变换操作,得到多个扩增晶圆图数据,并将所述多个扩增晶圆图数据放入所述目标数据集中。3.根据权利要求2所述的方法,其特征在于,所述形态学变换操作至少包括:反转、旋转、放大、裁剪。4.根据权利要求1所述的方法,其特征在于,使用所述目标数据集训练变分自编码器VAE,包括:将所述目标数据集中的晶圆图数据输入到所述VAE的编码器中进行编码,得到隐空间向量;将所述隐空间向量输入到所述VAE的解码器中进行解码,得到解码数据;通过最小化所述解码数据与所述晶圆图数据的误差,调整所述VAE中的参数的值。5.根据权利要求4所述的方法,其特征在于,所述误差为所述解码数据与所述晶圆图数据之间的重构损失与KL散度之和。6.根据权利要求1所述的方法,其特征在于,使用...

【专利技术属性】
技术研发人员:穆晓宝易丛文夏敏
申请(专利权)人:深圳智现未来工业软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1