基于机器学习的过程周期图像的根本原因分析制造技术

技术编号:34794016 阅读:15 留言:0更新日期:2022-09-03 19:58
本发明专利技术公开了一种技术,该技术涉及对过程周期图像进行分类以预测过程周期的成功或失败。所公开的技术包括在基因分型过程中捕获和处理布置在图像生成芯片上的区段的图像。创建生产周期图像的图像描述特征,并将其作为输入提供给分类器。受过训练的分类器将成功的生产图像与不成功的或失败的生产图像分开。通过受过训练的根本原因分类器将这些失败的生产图像进一步分类为各种类别的失败。像进一步分类为各种类别的失败。像进一步分类为各种类别的失败。

【技术实现步骤摘要】
【国外来华专利技术】基于机器学习的过程周期图像的根本原因分析
[0001]优先权申请
[0002]本申请要求2021年1月28日提交的名称为“MACHINE LEARNING

BASED ROOT CAUSE ANALYSIS OF PROCESS CYCLE IMAGES”的美国非临时专利申请号17/161,595(代理人案卷号ILLM 1026

2/IP

1911

US)的权益,该专利申请要求2020年1月31日提交的名称为“MACHINE LEARNING

BASED ROOT CAUSE ANALYSIS OF PROCESS CYCLE IMAGES”的美国临时专利申请号62/968,950(代理人案卷号ILLM 1026

1/IP

1911

PRV)的权益。优先权申请以引用方式并入本文中用于所有目的。


[0003]所公开的技术涉及图像的分类以用于评估,以及生产过程的根本原因失败分析。

技术介绍

[0004]本部分中讨论的主题不应仅因为在本部分中有提及就被认为是现有技术。类似地,在本部分中提及的或与作为
技术介绍
提供的主题相关联的问题不应被认为先前在现有技术中已被认识到。本部分中的主题仅表示不同的方法,这些方法本身也可对应于受权利要求书保护的技术的具体实施。
[0005]基因分型是需要多日才能完成的过程。该过程易受机械及化学处理错误的影响。所收集的用于基因分型的样品被提取并且分布在图像生成芯片的区段和区域中。然后通过多个步骤对样品进行化学处理以生成荧光图像。该过程为所分析的每个区段生成质量评分。该质量无法洞察低质量过程的失败的根本原因。在一些情况下,失败的区段图像仍然产生可接受的质量评分。
[0006]因此,有机会引入新的方法和系统来评估区段图像,并且确定生产基因分型期间的失败的根本原因分析。
附图说明
[0007]在附图中,在所有不同视图中,类似的参考符号通常是指类似的部件。另外,附图未必按比例绘制,而是重点说明所公开的技术的原理。在以下描述中,参考以下附图描述了所公开的技术的各种具体实施,其中:
[0008]图1示出了系统的体系结构级示意图,其中对来自基因分型仪器的过程周期图像进行分类并且确定不良图像的根本原因。
[0009]图2例示了图1的特征生成器的子系统部件。
[0010]图3呈现了示例性基因分型过程的过程步骤。
[0011]图4呈现了在成功的处理完成之后在图像生成中布置的区段的图像。
[0012]图5A和图5B呈现了由于基因分型过程中的杂交失败而导致的失败的区段图像的示例。
[0013]图5C和图5D呈现了由于间隔区移位失败而导致的失败的区段图像的示例。
[0014]图5E呈现了由于偏移失败而导致的失败的区段图像的示例。
[0015]图5F呈现了由于表面磨蚀失败而导致的失败的区段图像的示例。
[0016]图5G和图5H呈现了由试剂流动失败而导致的失败的区段图像的示例。
[0017]图5I呈现了失败源未知的失败的或不健康的区段图像的示例。
[0018]图6A和图6B是通过使用主成分分析(PCA)生成的排序的主成分而选择的96个本征图像分量的基的示例。
[0019]图6C和图6D是从图6A和图6B中的96个图像中选择的前40个本征图像分量的放大图。
[0020]图7A例示了用于输入到主成分分析的区段图像的图像缩放和展平。
[0021]图7B例示了使用主成分分析来创建本征图像的基。
[0022]图8A例示了使用区段的区域的强度的特征生成的示例。
[0023]图8B例示了使用区段的区域的强度的特征生成的另一示例。
[0024]图9是一对多(OvR)分类器的图解说明。
[0025]图10A例示了使用包括过程周期图像的标记的训练数据来训练二值(良好与不良)分类器和多类(根本原因)分类器。
[0026]图10B例示了两步骤过程,其中生产过程周期图像被分类为良好与不良,并且进一步确定不良图像的失败类别。
[0027]图11是可用于实施所公开的技术的计算机系统的简化框图。
具体实施方式
[0028]呈现以下讨论以使得本领域的任何技术人员能够实现和使用所公开的技术,并且在特定应用及其要求的上下文中提供以下讨论。对所公开的具体实施的各种修改对于本领域的技术人员而言将是显而易见的,并且在不脱离所公开的技术的实质和范围的情况下,本文所定义的一般原理可应用于其他具体实施和应用。因此,所公开的技术并非旨在限于所示的具体实施,而是要符合与本文所公开的原理和特征一致的最广范围。
[0029]简介
[0030]所公开的技术将视觉系统和图像分类应用于生产基因分型的评估和根本原因失败分析。描述了两种不同的方法,一种方法涉及本征图像,并且另一种方法基于按区域阈值化。主成分分析(PCA)和非负矩阵因式分解(NMF)属于所公开的技术。可以应用于图像的其他降维技术包括独立成分分析、字典学习、稀疏主成分分析、因子分析、小批量K均值。可以使用图像分解和降维技术的变型形式。例如,PCA可以使用奇异值分解(SVD)或作为内核PCA来实施。这些技术的输出作为输入提供给分类器。所应用的分类器可包括随机森林、K最近邻(KNN)、多项式逻辑回归、支持向量机(SVM)、梯度增强树、朴素贝叶斯等。随着标记的图像的更大主体变得可用,还可以使用卷积神经网络,诸如ImageNet。
[0031]该生产过程易受机械和化学处理错误的影响。所收集的样品被提取,分布在BeadChip的区段和区域中,然后通过多个步骤进行化学处理以生成荧光图像。可以分析最终的荧光图像,甚至中间的荧光图像,以监测生产并且进行失败分析。
[0032]绝大多数生产分析是成功的。失败的分析目前被理解为符合五个类别加上剩余的失效类别。五个失败类别是杂交或混合失败、间隔区移位失败、偏移失败、表面磨蚀失败以
及试剂流动失败。由于混合效应、未识别的原因和弱信号,剩余的类别是不健康的模式。随着时间的推移,尤其是当根本原因分析导致改进的生产时,可识别出更多不同的原因。
[0033]应用于质量控制和失败分析的第一图像处理技术从通过本征面部分析进行的面部识别发展而来。从数以万计的标记的图像中,识别出40至100或更多的图像分量的线性基。形成特征基的一种方法是进行主成分分析(PCA),随后根据可解释的变异性的量度对成分进行排序。观察到40个分量解释了大部分变异性。超过100个部件,附加分量似乎反映了样品处理中的噪声模式或自然变异性。预期相关分量的数量受图像分辨率的影响。在此,应用了分辨率降低,使得以180
×
80像素的分辨率分析图像生成芯片的区段。这足以解决对成功和不成功的生产的区分,然后在六个失败类别中对失败的根本原因进行分类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种训练用于基因分型过程周期图像的随机森林分类器的方法,所述方法包括:访问来自属于成功类别和多个失败类别的过程周期的图像的标记的训练示例;基于本征图像的线性组合来创建每个标记的训练示例的图像描述特征;使用所述标记的训练示例的所述图像描述特征来训练所述随机森林分类器;以及存储所训练的随机森林分类器的参数。2.根据权利要求1所述的方法,所述方法还包括:访问本征图像的基;根据解释的变异性的量度对所述本征图像的基进行排序;以及选择累积地解释高于阈值的变异性的本征图像的最高排序的基;以及使用所选择的本征图像的基来分析所述过程周期图像。3.根据权利要求1所述的方法,所述方法还包括使用所述图像描述特征来训练所述随机森林分类器,以用于所述成功类别和所述多个失败类别的一对多确定。4.根据权利要求1所述的方法,其中所述随机森林分类器包括100至400棵决策树。5.根据权利要求1所述的方法,其中所述随机森林分类器具有10至40的深度。6.根据权利要求2所述的方法,所述方法还包括:在确定所述图像描述特征不属于所述成功类别时访问第二随机森林分类器,其中所述第二随机森林分类器被训练为区分来自属于所述多个失败类别中的一者的过程周期的图像;以及将所述第二随机森林分类器应用于所述图像描述特征,包括对所述多个失败类别中的每一者与其余类别进行评分,并且使用所得评分来在所述多个失败类别中选择失败的过程周期的可能的根本原因。7.一种印有训练用于基因分型过程周期图像的随机森林分类器的计算机程序指令的非暂态计算机可读存储介质,所述指令在处理器上执行时实施一种方法,所述方法包括:访问来自属于成功类别和多个失败类别的过程周期的图像的标记的训练示例;基于本征图像的线性组合来创建每个标记的训练示例的图像描述特征;使用所述标记的训练示例的所述图像描述特征来训练所述随机森林分类器;以及存储所训练的随机森林分类器的参数。8.根据权利要求7所述的非暂态计算机可读存储介质,实施所述方法还包括:使用所述图像描述特征来训练所述随机森林分类器,以用于所述成功类别和所述多个失败类别的一对多确定。9.根据权利要求7所述的非暂态计算机可读存储介质,实施所述方法还包括:访问本征图像的基;根据解释的变异性的量度对所述本征图像的基进行排序;选择累积地解释高于阈值的变异性的本征图像的最高排序的基;以及使用所选择的本征图像的基来分析所述过程周期图像。10.根据权利要求7所述的非暂态计算机可读存储介质,其中所述随机森林分类器包括100至400棵决策树。11.根据权利要求7所述的非暂态计算机可读存储介质,其中所述随机森林分类器具有10至40的深度。
12.根据权利要求9所述的非暂态计算机可读存储介质,实施所述方法还包括:在确定所述图像描述特征不属于所述成功...

【专利技术属性】
技术研发人员:N
申请(专利权)人:因美纳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1