一种晶圆缺陷数据增强方法及装置制造方法及图纸

技术编号：38208313 阅读：9 留言：0更新日期：2023-07-21 16:57

本发明专利技术涉及一种晶圆缺陷数据增强方法及装置，所述方法包括：获取晶圆图数据集，所述晶圆图数据集中包含若干缺陷类型的晶圆图数据；根据所述晶圆图数据集，确定多个训练数据集，其中，任一训练数据集中包含具有相同的单一缺陷类型的晶圆图数据；对所述多个训练数据集中对应于目标缺陷类型的目标数据集，使用所述目标数据集训练变分自编码器VAE，得到该目标缺陷类型对应的VAE；使用所述目标缺陷类型对应的VAE的解码器生成结果数据集，所述结果数据集中包含具有所述目标缺陷类型作为其标注标签的晶圆图数据。签的晶圆图数据。签的晶圆图数据。

全部详细技术资料下载

【技术实现步骤摘要】
一种晶圆缺陷数据增强方法及装置

[0001]本专利技术涉及半导体制造领域，尤其涉及一种晶圆缺陷数据增强方法及装置。

技术介绍

[0002]在晶圆图缺陷分类识别的领域内，晶圆数据的真实性和有效数据规模是非常关键的因素。由于晶圆数据与制造工艺关系密切，涉及到一系列安全问题，目前，无法直接从公开途径获取大量真实的晶圆数据。因此现有的研究中通常都是基于数量有限的真实数据集进行的，也有部分研究是基于人工构造的缺陷数据。然而，这两种数据都有各自的缺点：对于真实数据集，其中有标注的数据少，且数据分布不平衡，标签准确性低，大部分缺陷图案不够干净，无法直接用于目标检测任务；对于人工构造的晶圆数据，其与真实数据可能存在较大的差异，失真程度较高，因此基于人工数据训练的模型在面对真实数据时可能表现很差。
[0003]在以往关于晶圆缺陷模式识别的研究中，也使用过DCGAN模型生成部分样本数量较少的缺陷图案，但对于Loc、Scratch等空间对称性和图像一致性较差的缺陷类型，生成对抗网络的效果较差。

技术实现思路

[0004]本说明书一个或多个实施例描述了一种晶圆缺陷数据增强方法及装置，以现有的真实数据集为基础，从数据集中抽取少量单一特征明显、图案干净的晶圆图数据，基于这小部分数据训练变分自编码器VAE生成模型，然后使用训练好的生成模型生成一批晶圆数据，从而实现晶圆数据量的增强。
[0005]第一方面，提供了一种晶圆缺陷数据增强方法，包括：
[0006]获取晶圆图数据集，所述晶圆图数据集中包含若干缺陷类型...

【技术保护点】

【技术特征摘要】
1.一种晶圆缺陷数据增强方法，包括：获取晶圆图数据集，所述晶圆图数据集中包含若干缺陷类型的晶圆图数据；根据所述晶圆图数据集，确定多个训练数据集，其中，任一训练数据集中包含具有相同的单一缺陷类型的晶圆图数据；对所述多个训练数据集中对应于目标缺陷类型的目标数据集，使用所述目标数据集训练变分自编码器VAE，得到该目标缺陷类型对应的VAE；使用所述目标缺陷类型对应的VAE的解码器生成结果数据集，所述结果数据集中包含具有所述目标缺陷类型作为其标注标签的晶圆图数据。2.根据权利要求1所述的方法，其特征在于，在使用所述目标数据集训练变分自编码器VAE之前，所述方法还包括：对于所述目标数据集中的任一晶圆图数据，对其进行形态学变换操作，得到多个扩增晶圆图数据，并将所述多个扩增晶圆图数据放入所述目标数据集中。3.根据权利要求2所述的方法，其特征在于，所述形态学变换操作至少包括：反转、旋转、放大、裁剪。4.根据权利要求1所述的方法，其特征在于，使用所述目标数据集训练变分自编码器VAE，包括：将所述目标数据集中的晶圆图数据输入到所述VAE的编码器中进行编码，得到隐空间向量；将所述隐空间向量输入到所述VAE的解码器中进行解码，得到解码数据；通过最小化所述解码数据与所述晶圆图数据的误差，调整所述VAE中的参数的值。5.根据权利要求4所述的方法，其特征在于，所述误差为所述解码数据与所述晶圆图数据之间的重构损失与KL散度之和。6.根据权利要求1所述的方法，其特征在于，使用...

【专利技术属性】
技术研发人员：穆晓宝，易丛文，夏敏，
申请(专利权)人：深圳智现未来工业软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人