基于现场数据的半导体生产质量预测方法及系统技术方案

技术编号:23150449 阅读:20 留言:0更新日期:2020-01-18 13:59
本发明专利技术提供基于现场数据的半导体生产质量预测方法及系统,包括以下步骤:S100、获取半导体生产设备生产过程中的现场数据,并存储;数据至少包括机台字段、时间字符串值、多种工况参数及产品质量数据;S200、对获取的现场数据进行处理;S300、回归建模,使用不同算法建立两个模型,然后对两个模型进行融合;使用融合后的模型对测试集预测质量,利用预测结果与实际质检结果的偏差,反馈优化回归模型,直至得到目标模型;S400、预测质量,利用目标模型预测实时生产数据的质量。与现有技术相比,该方法能适应半导体生产工艺复杂的特点;利用生产过程中数据对产品质量进行预测,预测结果较准确,能快速发现不良问题,协助调整生产工艺,并有效节约检测资源。

Semiconductor production quality prediction method and system based on field data

【技术实现步骤摘要】
基于现场数据的半导体生产质量预测方法及系统
本专利技术涉及半导体的生产与质检
,具体来说是一种基于现场数据的半导体生产质量预测方法及系统。
技术介绍
半导体生产过程复杂,包含上千道工序,每道工序都有可能对产品品质产生影响。传统的质检方式是:生产完成后,对产品质量做非全面的抽测,这样有两个缺点:1、存在漏检风险;2、不能及时得知质量好坏,当发现残次品时,修正工艺参数为时已晚。因此,基于生产过程参数,建立质量预测模型,可以快速发现不良问题,协助调整生产工艺,并有效节约检测资源。现有技术中并没有针对半导体的生产质量预测的相关技术。经过检索,关于“生产质量预测”的专利公开文件有:申请号为:CN201610373992.1的专利(有权),基于现场数据的产品工艺质量预测模型的建立方法及系统,公开了基于现场数据的产品工艺质量预测模型的建立方法及系统,包括以下步骤:获取卷烟设备的现场数据并将获取的数据存储至数据库中;对卷烟设备的现场数据进行处理,卷烟设备的现场数据包括卷烟机停机数据、剔除数据、产量数据及产品质量数据;建立产品工艺质量神经网络预测模型;建立设备故障树;输入卷烟设备实时数据至产品工艺质量神经网络预测模型得到预测产品质量数据,结合设备故障树对卷烟设备进行控制。该本专利技术能够避免数据统计分析方法的单一性,将卷烟设备数据有效结合,建立数据综合分析模型,预测下一时间段内的产品质量情况,防止问题产品的产出,做到以产品质量为导向指导设备管理。申请号为:CN201811418409.X的专利(审中),基于随机森林的化工产品的质量预测方法及系统,公开了一种基于随机森林的化工产品的质量预测方法及系统,该方法包括:目标化工产品反应过程中,每间隔预设的时长获取与所述目标化工产品质量存在关联的各个影响因子的生产数据;依据各个生产数据,确定所述目标化工厂品从开始反应到当前时刻的目标有效数据;将所述目标有效数据传递给采用预设的训练方法训练得到的目标质量预测模型中,得到所述目标化工产品的目标质量预测结果。上述的方法,可以在生产过程中获取生产数据,依据生产数据直接对当前时刻产品的质量进行预测,避免了由于无法实时预测当前生产过程的产品质量,会造成良率不高等负面影响的问题。但是由于半导体生产工艺复杂,工序达上千道,基于现有技术难以适用。
技术实现思路
本专利技术要解决的技术问题是利用半导体生产过程数据,预测产品质量。本专利技术通过以下技术方案来解决上述技术问题:基于现场数据的半导体生产质量预测方法,包括以下步骤:S100、获取半导体生产设备生产过程中的现场数据,并存储;数据至少包括机台字段、时间字符串值、多种工况参数及产品质量数据;S200、对获取的现场数据进行处理,具体包括:先将数据分为测试集和训练集;201)参数异常值处理:当测试集和训练集中的工况参数为缺失值0值时,对测试集和训练集该工况参数分别进行排序,排序后最小值为min,最大值为mix,若min≤0≤max,认为此0值正常,否则,认为其为缺失值,用缺失值NaN替换,等待下一步填充;当同一道工序中,测试集出现了训练集未出现的机台字段,将未出现的机台字段替换为NaN,等待下一步填充;202)降维:删除单值列、重复列,删除NaN值超过设定量的行或列;203)字符属性处理:类别值编码:对机台字段编码;时间字符串转换为时间戳:匹配测试集和训练集中的时间字符串格式,将其转化为时间戳,相邻工序的时间戳相减,得到该工序所用时间;204)缺失值填充:对缺失的机台字段:将该机台的工况参数作为特征,机台字段作为类别,用训练集建模,预测并填充测试数据的机台字段;对缺失的工况参数:对该缺失的工况参数,先按相同机台字段分组,计算各组扣除缺失值的中位数,然后用此中位数填充训练集与预测集的缺失值。205)数据规范化处理:对训练集与预测集的所有数据列缩放到0、1区间;S300、回归建模,使用不同算法建立两个模型,然后对两个模型进行融合;使用融合后的模型对测试集预测质量,利用预测结果与实际质检结果的偏差,反馈优化回归模型,直至得到目标模型;S400、预测质量,利用目标模型预测实时生产数据的质量。优选的,所述步骤S200中,数据预处理的顺序为:参数异常处理、降维、时间字符串转化为时间戳、缺失值填充、相邻工序的时间戳相减、机台字段编码、降维、数据规范化。优选的,所述步骤203)中,采用独热编码对机台字段编码。优选的,所述步骤S300中,使用Lasso回归和GBDT两种算法分别建模。本专利技术还提供一种基于现场数据的半导体生产质量预测系统,包括数据获取模块,获取半导体生产设备生产过程中的现场数据,并存储;数据至少包括机台字段、时间字符串值、多种工况参数及产品质量数据;数据预处理模块,对获取的现场数据进行处理,具体包括:先将数据分为测试集和训练集;201)参数异常值处理:当测试集和训练集中的工况参数为缺失值0值时,对测试集和训练集该工况参数分别进行排序,排序后最小值为min,最大值为mix,若min≤0≤max,认为此0值正常,否则,认为其为缺失值,用缺失值NaN替换,等待下一步填充;当同一道工序中,测试集出现了训练集未出现的机台字段,将未出现的机台字段替换为NaN,等待下一步填充;202)降维:删除单值列、重复列,删除NaN值超过设定量的行或列;203)字符属性处理:类别值编码:对机台字段编码;时间字符串转换为时间戳:匹配测试集和训练集中的时间字符串格式,将其转化为时间戳,相邻工序的时间戳相减,得到该工序所用时间;204)缺失值填充:对缺失的机台字段:将该机台的工况参数作为特征,机台字段作为类别,用训练集建模,预测并填充测试数据的机台字段;对缺失的工况参数:对该缺失的工况参数,先按相同机台字段分组,计算各组扣除缺失值的中位数,然后用此中位数填充训练集与预测集的缺失值。205)数据规范化处理:对训练集与预测集的所有数据列缩放到0、1区间;回归建模模块,使用不同算法建立两个模型,然后对两个模型进行融合;使用融合后的模型对测试集预测质量,利用预测结果与实际质检结果的偏差,反馈优化回归模型,直至得到目标模型;预测质量模块,利用目标模型预测实时生产数据的质量。优选的,所述数据预处理模块中,数据预处理的顺序为:参数异常处理、降维、时间字符串转化为时间戳、缺失值填充、相邻工序的时间戳相减、机台字段编码、降维、数据规范化。优选的,所述;203)中,采用独热编码对机台字段编码。优选的,所述回归建模模块中,使用Lasso回归和GBDT两种算法分别建模。本专利技术的优点在于:该方法能适应半导体生产工艺复杂的特点;利用生产过程中数据对产品质量进行预测,预测结果较准确,能快速发现不良问题,协助调整生产工艺,并有效节约检测资源。<本文档来自技高网
...

【技术保护点】
1.基于现场数据的半导体生产质量预测方法,其特征在于,包括以下步骤:/nS100、获取半导体生产设备生产过程中的现场数据,并存储;数据至少包括机台字段、时间字符串值、多种工况参数、及产品质量数据;/nS200、对获取的现场数据进行处理,具体包括:先将数据分为测试集和训练集;/n201)参数异常值处理:/n当测试集和训练集中的工况参数为缺失值0值时,对测试集和训练集该工况参数分别进行排序,排序后最小值为min,最大值为mix,若min≤0≤max,认为此0值正常,否则,认为其为缺失值,用缺失值NaN替换,等待下一步填充;/n当同一道工序中,测试集出现了训练集未出现的机台字段,将未出现的机台字段替换为NaN,等待下一步填充;/n202)降维:删除单值列、重复列,删除NaN值超过设定量的行或列;/n203)字符属性处理:/n类别值编码:对机台字段编码;/n时间字符串转换为时间戳:匹配测试集和训练集中的时间字符串格式,将其转化为时间戳,相邻工序的时间戳相减,得到该工序所用时间;/n204)缺失值填充:/n对缺失的机台字段:将该机台的工况参数作为特征,机台字段作为类别,用训练集建模,预测并填充测试数据的机台字段;/n对缺失的工况参数:对该缺失的工况参数,先按相同机台字段分组,计算各组扣除缺失值的中位数,然后用此中位数填充训练集与预测集的缺失值。/n205)数据规范化处理:对训练集与预测集的所有数据列缩放到0、1区间;/nS300、回归建模,使用不同算法建立两个模型,然后对两个模型进行融合;使用融合后的模型对测试集预测质量,利用预测结果与实际质检结果的偏差,反馈优化回归模型,直至得到目标模型;/nS400、预测质量,利用目标模型预测实时生产数据的质量。/n...

【技术特征摘要】
1.基于现场数据的半导体生产质量预测方法,其特征在于,包括以下步骤:
S100、获取半导体生产设备生产过程中的现场数据,并存储;数据至少包括机台字段、时间字符串值、多种工况参数、及产品质量数据;
S200、对获取的现场数据进行处理,具体包括:先将数据分为测试集和训练集;
201)参数异常值处理:
当测试集和训练集中的工况参数为缺失值0值时,对测试集和训练集该工况参数分别进行排序,排序后最小值为min,最大值为mix,若min≤0≤max,认为此0值正常,否则,认为其为缺失值,用缺失值NaN替换,等待下一步填充;
当同一道工序中,测试集出现了训练集未出现的机台字段,将未出现的机台字段替换为NaN,等待下一步填充;
202)降维:删除单值列、重复列,删除NaN值超过设定量的行或列;
203)字符属性处理:
类别值编码:对机台字段编码;
时间字符串转换为时间戳:匹配测试集和训练集中的时间字符串格式,将其转化为时间戳,相邻工序的时间戳相减,得到该工序所用时间;
204)缺失值填充:
对缺失的机台字段:将该机台的工况参数作为特征,机台字段作为类别,用训练集建模,预测并填充测试数据的机台字段;
对缺失的工况参数:对该缺失的工况参数,先按相同机台字段分组,计算各组扣除缺失值的中位数,然后用此中位数填充训练集与预测集的缺失值。
205)数据规范化处理:对训练集与预测集的所有数据列缩放到0、1区间;
S300、回归建模,使用不同算法建立两个模型,然后对两个模型进行融合;使用融合后的模型对测试集预测质量,利用预测结果与实际质检结果的偏差,反馈优化回归模型,直至得到目标模型;
S400、预测质量,利用目标模型预测实时生产数据的质量。


2.根据权利要求1所述的基于现场数据的半导体生产质量预测方法,其特征在于,所述步骤S200中,数据预处理的顺序为:参数异常处理、降维、时间字符串转化为时间戳、缺失值填充、相邻工序的时间戳相减、机台字段编码、降维、数据规范化。


3.根据权利要求1所述的基于现场数据的半导体生产质量预测方法,其特征在于,所述步骤203)中,采用独热编码对机台字段编码。


4.根据权利要求1所述的基于现场数据的半导体生产质量预测方法,其特征在于,所述步骤S300中,使用Lasso回归和GBDT两种算法分别建模。

【专利技术属性】
技术研发人员:徐国徐斌于振中李文兴江瀚澄叶俊成虞小湖苏丹
申请(专利权)人:哈工大机器人合肥国际创新研究院
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1