晶圆图的分类方法及装置制造方法及图纸

技术编号:38577490 阅读:15 留言:0更新日期:2023-08-26 23:24
本申请提供一种晶圆图的分类方法及装置,涉及计算机技术领域,该方法包括:利用第一数据集中的第一数据对初始预训练模型进行训练,以得到预训练模型;基于所述预训练模型,对第二数据集中的第二数据进行筛选,以确定伪标签数据;基于至少包含所述伪标签数据的训练集对晶圆图分类模型进行训练,以得到训练后的晶圆图分类模型;基于所述训练后的晶圆图分类模型,对所述预训练模型进行更新;基于所述第二数据集中除伪标签数据外的其余第二数据,返回执行基于所述预训练模型,对第二数据集中的第二数据进行筛选,以确定伪标签数据的步骤,直至确定所述第二数据集中的全部第二数据分类完成,由此可以基于小样本数据对晶圆图进行分类,降低了成本。降低了成本。降低了成本。

【技术实现步骤摘要】
晶圆图的分类方法及装置


[0001]本申请涉及计算机
,尤其涉及一种晶圆图的分类方法及装置。

技术介绍

[0002]在集成电路生产过程中,可以通过对生产过程和良率的监测,快速地发现生产中存在的问题,进而达到节约成本的目的。晶圆图是在集成电路制造过程中,将电性数据或者缺陷数据等检测结果,记录在晶圆对应的空间位置上形成的图像,是晶圆良率管理过程中重要的数据参考来源。
[0003]相关技术中,可以根据晶圆图的图案样式判断生产过程中可能存在的问题,因此对晶圆图的图案样式的分类判断,是晶圆良率管理过程中重要的一环。通常,在根据晶圆图的图案样式对晶圆图进行分类判断的过程中,可以采用人工方式对晶圆图进行分类判断,但该种方式通常需要耗费大量时间和精力,效率也不高。或者,也可以通过使用卷积神经网络模型来对晶圆图进行分类,但此种方法需要人工标注大量数据,而随着生产过程的不断推进,产生的晶圆图数据也会越来越多,若使用人工标记的方式成本较高,效率也不高。由此,如何降低晶圆图分类的成本,显得至关重要。

技术实现思路

[0004]本申请提供一种晶圆图的分类方法及装置,用以解决现有技术中对晶圆图分类时,需要人工标注大量数据,成本较高的技术问题。
[0005]根据本申请的第一方面,提供一种晶圆图的分类方法,该方法包括:利用第一数据集中的第一数据对初始预训练模型进行训练,以得到预训练模型;基于所述预训练模型,对第二数据集中的第二数据进行筛选,以确定伪标签数据;基于至少包含所述伪标签数据的训练集对晶圆图分类模型进行训练,以得到训练后的晶圆图分类模型;基于所述训练后的晶圆图分类模型,对所述预训练模型进行更新;基于所述第二数据集中除伪标签数据外的其余第二数据,返回执行基于所述预训练模型,对第二数据集中的第二数据进行筛选,以确定伪标签数据的步骤,直至确定所述第二数据集中的全部第二数据分类完成。
[0006]在一些实施方式中,所述基于所述预训练模型,对第二数据集中的第二数据进行筛选,以确定伪标签数据,包括:将所述第二数据集中的第二数据输入至所述预训练模型中,得到每个所述第二数据的预测概率向量;将每个所述第二数据对应的预测概率向量中大于第一阈值的最大预测概率对应的标签类别,确定为每个所述第二数据对应的第一预测标签;根据具有第一预测标签的第二数据,确定伪标签数据。
[0007]在一些实施方式中,所述根据具有第一预测标签的第二数据,确定伪标签数据,包括:将具有第一预测标签的第二数据进行降维处理,以确定每个聚类中心对应的聚类标签;剔除第一预测标签与所属的聚类标签不一致的第二数据,以得到伪标签数据。
[0008]在一些实施方式中,所述确定所述第二数据集中的全部第二数据分类完成,包括:将所述第二数据集中除伪标签数据外的每个其余第二数据输入至所述预训练模型,以得到
每个所述其余第二数据的预测概率向量;在每个所述其余第二数据的预测概率向量均小于所述第一阈值的情况下,确定所述第二数据集中的全部第二数据分类完成。
[0009]在一些实施方式中,所述在每个所述其余第二数据的预测概率向量均小于所述第一阈值的情况下,确定所述第二数据集中的全部第二数据分类完成,包括:将每个所述其余第二数据对应的预测概率向量中的最大预测概率对应的标签类别,确定为每个所述其余第二数据对应的伪标签。
[0010]在一些实施方式中,所述第一数据集中包含具有标注标签的第一数据,所述训练集包含伪标签数据和具有标注标签的所述第一数据。
[0011]在一些实施方式中,所述基于至少包含所述伪标签数据的训练集对晶圆图分类模型进行训练,以得到训练后的晶圆图分类模型,包括:将所述伪标签数据和具有标注标签的第一数据分别输入至晶圆图分类模型中,得到各自对应的第二预测标签;基于所述第一数据对应的标注标签与第二预测标签间的差异,确定第一损失值;基于所述伪标签数据对应的第一预测标签与第二预测标签间的差异,确定第二损失值;基于所述第一损失值及所述第二损失值对所述晶圆图分类模型进行反向修正,以得到训练后的晶圆图分类模型。
[0012]在一些实施方式中,所述基于所述第一损失值及所述第二损失值对所述晶圆图分类模型进行反向修正,以得到训练后的晶圆图分类模型,包括:确定所述第一损失值对应的第一权重系数;确定所述第二损失值对应的第二权重系数;将所述第一损失值及所述第一权重系数、所述第二损失值及所述第二权重系数进行融合,以得到总损失值;基于所述总损失值对所述晶圆图分类模型进行反向修正,以得到训练后的晶圆图分类模型。
[0013]在一些实施方式中,所述确定所述第二损失值对应的第二权重系数,包括:基于训练轮次确定每轮次训练对应的权重值;将所述权重值、预设参数及第二阈值的乘积确定为每轮次训练中第二损失值对应的第二权重系数。
[0014]根据本申请的第二方面,提供一种晶圆图的分类装置,其包括:第一训练模块,用于利用第一数据集中的第一数据对初始预训练模型进行训练,以得到预训练模型;筛选模块,用于基于所述预训练模型,对第二数据集中的第二数据进行筛选,以确定伪标签数据;第二训练模块,用于基于至少包含所述伪标签数据的训练集对晶圆图分类模型进行训练,以得到训练后的晶圆图分类模型;更新模块,用于基于所述训练后的晶圆图分类模型,对所述预训练模型进行更新;确定模块,用于基于所述第二数据集中除伪标签数据外的其余第二数据,返回执行基于所述预训练模型,对第二数据集中的第二数据进行筛选,以确定伪标签数据的步骤,直至确定所述第二数据集中的全部第二数据分类完成。
[0015]在一些实施方式中,所述筛选模块包括:第一输入单元,用于将所述第二数据集中的第二数据输入至所述预训练模型中,得到每个所述第二数据的预测概率向量;第一确定单元,用于将每个所述第二数据对应的预测概率向量中大于第一阈值的最大预测概率对应的标签类别,确定为每个所述第二数据对应的第一预测标签;第二确定单元,用于根据具有第一预测标签的第二数据,确定伪标签数据。
[0016]在一些实施方式中,所述第一确定单元,具体用于:将具有第一预测标签的第二数据进行降维处理,以确定每个聚类中心对应的聚类标签;剔除第一预测标签与所属的聚类标签不一致的第二数据,以得到伪标签数据。
[0017]在一些实施方式中,所述确定模块,包括:输入单元,用于将所述第二数据集中除
伪标签数据外的每个其余第二数据输入至所述预训练模型,以得到每个所述其余第二数据的预测概率向量;完成单元,用于在每个所述其余第二数据的预测概率向量均小于所述第一阈值的情况下,确定所述第二数据集中的全部第二数据分类完成。
[0018]在一些实施方式中,所述完成单元,具体用于:将每个所述其余第二数据对应的预测概率向量中的最大预测概率对应的标签类别,确定为每个所述其余第二数据对应的伪标签。
[0019]在一些实施方式中,所述第一数据集中包含具有标注标签的第一数据,所述训练集包含伪标签数据和具有标注标签的所述第一数据。
[0020]在一些实施方式中,所述第二训本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种晶圆图的分类方法,其特征在于,包括:利用第一数据集中的第一数据对初始预训练模型进行训练,以得到预训练模型;基于所述预训练模型,对第二数据集中的第二数据进行筛选,以确定伪标签数据;基于至少包含所述伪标签数据的训练集对晶圆图分类模型进行训练,以得到训练后的晶圆图分类模型;基于所述训练后的晶圆图分类模型,对所述预训练模型进行更新;基于所述第二数据集中除伪标签数据外的其余第二数据,返回执行基于所述预训练模型,对第二数据集中的第二数据进行筛选,以确定伪标签数据的步骤,直至确定所述第二数据集中的全部第二数据分类完成。2.如权利要求1所述的晶圆图的分类方法,其特征在于,所述基于所述预训练模型,对第二数据集中的第二数据进行筛选,以确定伪标签数据,包括:将所述第二数据集中的第二数据输入至所述预训练模型中,得到每个所述第二数据的预测概率向量;将每个所述第二数据对应的预测概率向量中大于第一阈值的最大预测概率对应的标签类别,确定为每个所述第二数据对应的第一预测标签;根据具有第一预测标签的第二数据,确定伪标签数据。3.如权利要求2所述的晶圆图的分类方法,其特征在于,所述根据具有第一预测标签的第二数据,确定伪标签数据,包括:将具有第一预测标签的第二数据进行降维处理,以确定每个聚类中心对应的聚类标签;剔除第一预测标签与所属的聚类标签不一致的第二数据,以得到伪标签数据。4.如权利要求1所述的晶圆图的分类方法,其特征在于,所述确定所述第二数据集中的全部第二数据分类完成,包括:将所述第二数据集中除伪标签数据外的每个其余第二数据输入至所述预训练模型,以得到每个所述其余第二数据的预测概率向量;在每个所述其余第二数据的预测概率向量均小于所述第一阈值的情况下,确定所述第二数据集中的全部第二数据分类完成。5.如权利要求4所述的晶圆图的分类方法,其特征在于,所述在每个所述其余第二数据的预测概率向量均小于所述第一阈值的情况下,确定所述第二数据集中的全部第二数据分类完成,包括:将每个所述其余第二数据对应的预测概率向量中的最大预测概率对应的标签类别,确定为每个所述其余第二数据对应的伪标签。6.如权利要求1所述的晶圆图的分类方法,其特征在于,所述第一数据集中包...

【专利技术属性】
技术研发人员:包达文李东红鄢昌莲宋红敏张岩韩春营
申请(专利权)人:东方晶源微电子科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1