缺陷检测系统技术方案

技术编号:35092694 阅读:17 留言:0更新日期:2022-10-01 16:52
计算系统生成用于训练预测模型以检测目标样本的目标表面中存在的缺陷的训练数据集,以及基于训练数据集训练预测模型以检测目标样本的目标表面中存在的缺陷。计算系统通过识别用于训练预测模型的图像集来生成训练数据集,图像集包括第一图像子集。深度学习网络基于包括第一图像子集的图像集,生成用于后续标记的第二图像子集。深度学习网络基于包括第一图像子集和所标记的第二图像子集的图像集,生成用于标记的第三图像子集。计算系统继续该过程,直到生成阈值数量的标记图像。直到生成阈值数量的标记图像。直到生成阈值数量的标记图像。

【技术实现步骤摘要】
【国外来华专利技术】缺陷检测系统
[0001]相关申请的交叉引用
[0002]本申请要求于2020年3月9日提交的美国临时申请序列No.62/987,002的优先权,该申请的全部内容通过引用并入本文。


[0003]本公开总体上涉及一种缺陷检测系统。

技术介绍

[0004]深度学习模型已经在对象检测任务中变得流行。这些模型需要有效地训练大量的标记数据。在许多情况下,收集大量数据并不困难,但手动标记数据可能是非常繁琐且耗时的过程。数据集的自动标记正在增加其适用性,但是仍然缺乏替代人工操作者所必需的进动,并且在没有先前历史示例的情况下通常表现不佳。

技术实现思路

[0005]在一些实施例中,本文公开了一种计算系统。计算系统包括处理器和存储器。存储器上存储有编程指令,该编程指令在由处理器执行时执行操作。该操作包括:生成用于训练预测模型以检测目标样本的目标表面中存在的缺陷的训练数据集,以及基于训练数据集训练预测模型以检测目标样本的目标表面中存在的缺陷。该计算系统通过识别用于训练预测模型的图像集来生成训练数据集,图像集包括第一图像子集,其中第一图像子集中的每个图像均被标记有识别相应样本上的缺陷的标签;由深度学习网络基于包括第一图像子集的图像集,生成用于后续标记的第二图像子集;提示操作者标记第二图像子集中的每个图像;由深度学习网络基于包括第一图像子集和所标记的第二图像子集的图像集,生成用于标记的第三图像子集;提示操作者标记第三图像子集中的每个图像;以及聚合第一图像子集、第二图像子集和第三图像子集,其中第一图像子集、第二图像子集和第三图像子集中的每个图像均被标记。
[0006]在一些实施例中,本文公开了一种方法。计算系统识别用于训练预测模型以检测样本表面中的缺陷的图像集。图像集包括第一图像子集。第一图像子集中的每个图像均被标记有识别相应样本上的缺陷的标签。计算系统的深度学习网络基于包括第一图像子集的图像集,生成用于后续标记的第二图像子集。计算系统提示操作者标记第二图像子集中的每个图像。深度学习网络基于包括第一图像子集和所标记的第二图像子集的图像集,生成用于标记的第三图像子集。计算系统提示操作者标记第三图像子集中的每个图像。计算系统聚合第一图像子集、第二图像子集和第三图像子集。第一图像子集、第二图像子集和第三图像子集中的每个图像均被标记以形成用于训练预测模型的训练数据集。
[0007]在一些实施例中,本文公开了一种计算系统。计算系统包括处理器和存储器。存储器上存储有编程指令,该编程指令在由处理器执行时执行操作。该操作包括:识别用于训练预测模型以检测样本表面中的缺陷的图像集。该图像集包括第一图像子集。第一图像子集
中的每个图像均被标记有识别相应样本上的缺陷的标签。该操作进一步包括:由计算系统的深度学习网络基于包括第一图像子集的图像集,生成用于后续标记的第二图像子集。该操作进一步包括:提示操作者标记第二图像子集中的每个图像。该操作还包括:由深度学习网络基于包括第一图像子集和所标记的第二图像子集的图像集,生成用于标记的第三图像子集。该操作还包括:提示操作者标记第三图像子集中的每个图像。操作还包括:聚合第一图像子集、第二图像子集和第三图像子集。第一图像子集、第二图像子集和第三图像子集中的每个图像均被标记以形成用于训练预测模型的训练数据集。
附图说明
[0008]为了能够详细地理解本公开的上述特征的方式,可以参考实施例(在附图中展示了这些实施例中的一些实施例)对以上简要概述的本公开进行更具体的描述。然而,应注意,附图仅示出了本公开的典型实施例,因此不应视为对本公开范围的限制,因为本公开可允许其他等效实施例。
[0009]图1是示出了根据示例实施例的成像系统的框图。
[0010]图2示出了根据示例实施例的深度学习模型的架构。
[0011]图3是示出了根据示例实施例的生成用于训练预测模型的训练数据集的方法的流程图。
[0012]图4是示出了根据示例实施例的识别样本中的缺陷的方法的流程图。
[0013]图5示出了根据示例实施例的由预测模型生成的示例性图形输出。
[0014]图6A示出了根据示例实施例的系统总线计算系统架构。
[0015]图6B示出了根据示例实施例的具有芯片组架构的计算机系统。
[0016]为了便于理解,在可能的情况下,使用相同的附图标记来指代附图共有的相同元件。可以预期,在一个实施例中公开的元件可以有益地用于其他实施例而无需具体叙述。
具体实施方式
[0017]训练用于良好概括的对象检测和分类的机器学习模型可以受益于多样化的训练数据集。该训练数据集通常涉及人工注释,其中人顺序地遍历图像列表,在每个图像中标记足够高数量的示例,直到达到施加的阈值。这种传统过程既耗时又不必要,特别是当许多类似示例可以重复时。对于大型的数据集,由于成本和时间的固有约束标记每个示例可能是不可行的。对于最佳处理,底层任务是基于对深度学习算法的训练的贡献来对人工标记的图像划分优先级。
[0018]固有地,大多数操作者可以按照图像可能被保存的顺序或者软管目录中的编号来以字母数字方式分类和标记图像。这可能随着收集和文件系统而变化,并且可能很少与所获取的数据相关。在对底层类别的简要全局检查和确定之后,操作者可以在所分配的时间内顺序地遍历目录对每个图像进行标记。大部分数据可能是过量重复、缺乏所需的灵敏度、包含背景不规则性、以及可能使标记的数据不适合最佳训练的其他迭代。最终训练模型和标记之间的反馈通常可以是非正式的。通常,贴标器与数据处理之间的分隔如此大,以致于贴标器不接收关于标记数据的有用性的反馈,或者接收关于如何正式优化标记过程的知识。通常报告总体误差,但是这些误差容易从数据中分类并且不会对总体训练模型产生负
面影响。虽然可以指示操作者忽略或通过某些示例,但是合规性可能变成未解决的问题并且难以跟踪或有效地强制执行,尤其是在非常大的组和许多贴标器上。
[0019]操作者还可以形成习惯模式和标记,在检测某些类别(即,具有大量示例的那些类别)时变得非常熟练。这可能会产生效率错觉,但反而会传播远离稀有类别以及难以识别和分类的对象的偏差。当许多图像经受重复曝光于共同类别时,操作者可能更可能忽略作为背景的稀有示例而非将稀有示例标记为缺陷。对于某些架构(诸如深度学习架构),这会带来极大的问题,因为未被分类到标记类的区域被视为背景,并且导致模型无法检测到这些类型的缺陷。可以通过若干贴标器或投票过程来解决这个问题,但是成本高并且不能保证在结果上产生巨大的改进。
[0020]本文提供的一种或更多种技术呈现了一种多阶段方法,该方法可以用于通过连续不断地更新数据集中要被手动标记的图像的顺序来改进传统过程,以便使标签的唯一性和多样性最大化。在一些实施例中,多阶段方法可以采用深度学习分割模型,该深度学习分割模型被配置为预测先前未见数据的图像中的区域。在一些实施例中,多阶段方法可以集中于数据集,其中对象可以随机分布、可以在类内的形态上变化、以及可以在每个类中少量或大量出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算系统,包括:处理器;以及存储器,所述存储器上存储有编程指令,所述编程指令在由所述处理器执行时执行操作,所述操作包括:通过以下操作生成用于训练预测模型以检测目标样本的目标表面中存在的缺陷的训练数据集:识别用于训练所述预测模型的图像集,所述图像集包括第一图像子集,其中所述第一图像子集中的每个图像均被标记有识别相应样本上的缺陷的标签;由深度学习网络基于包括所述第一图像子集的所述图像集,生成用于后续标记的第二图像子集;提示操作者标记所述第二图像子集中的每个图像;由所述深度学习网络基于包括所述第一图像子集和所标记的第二图像子集的所述图像集,生成用于标记的第三图像子集;提示所述操作者标记所述第三图像子集中的每个图像;以及聚合所述第一图像子集、所述第二图像子集和所述第三图像子集,其中所述第一图像子集、所述第二图像子集和所述第三图像子集中的每个图像均被标记;以及基于所述训练数据集训练所述预测模型,以检测所述目标样本的目标表面中存在的缺陷。2.根据权利要求1所述的计算系统,其中,由所述深度学习网络基于包括所述第一图像子集的所述图像集,生成用于后续标记的所述第二图像子集包括:为所述图像集中的每个图像,生成对应于所述图像中的每个像素属于第一类别的第一概率的第一概率图;以及为所述图像集中的每个图像,生成对应于所述图像中的每个像素属于第二类别的第二概率的第二概率图。3.根据权利要求2所述的计算系统,还包括:基于所述第一概率图和所述第二概率图为所述图像集中的每个图像生成未见度量,其中所述未见度量对应于所述图像包括所述深度学习网络未见的像素的可能性。4.根据权利要求3所述的计算系统,其中,所述图像的所述未见度量基于所述图像中的每个像素的未见度量的聚合。5.根据权利要求4所述的计算系统,还包括:基于对应的未见度量为所述图像生成阿尔法度量。6.根据权利要求4所述的计算系统,还包括:基于所述图像中具有超过阈值的未见分数的像素的数量,为所述图像生成阈值度量。7.根据权利要求1所述的计算系统,还包括:由所述计算系统从成像装置接收所述目标样本的目标表面的目标图像;由所述预测模型检测所述目标样本的目标表面中存在的一个或更多个缺陷;以及基于所述检测,由所述计算系统生成示出所述一个或更多个缺陷的图形输出。8.一种方法,包括:由计算系统识别图像集,所述图像集用于训练预测模型以检测样本表面中的缺陷,所
述图像集包括第一图像子集,其中所述第一图像子集中的每个图像均被标记有识别相应样本上的缺陷的标签;由所述计算系统的深度学习网络基于包括所述第一图像子集的所述图像集,生成用于后续标记的第二图像子集;由所述计算系统提示操作者标记所述第二图像子集中的每个图像;由所述深度学习网络基于包括所述第一图像子集和所标记的第二图像子集的所述图像集,生成用于标记的第三图像子集;由所述计算系统提示所述操作者标记所述第三图像子集中的每个图像;以及由所述计算系统聚合所述第一图像子集、所述第二图像子集和所述第三图像子集,其中所述第一图像子集、所述第二图像子集和所述第三图像子集中的每个图像均被标...

【专利技术属性】
技术研发人员:托尼斯拉夫
申请(专利权)人:纳米电子成像有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1