【技术实现步骤摘要】
用于训练用于测量技术中的质量检查的分类器的工作流程
本专利技术涉及用于对训练数据集进行注释的工作流程,并且具体地涉及用于扩展用于机器学习的训练数据集的计算机实施的方法,并且涉及相应的工作流程系统。
技术介绍
工业生产过程需要不断的质量控制,以便持续满足消费者(工业公司和个人)的要求。对于持续高质量,市场上甚至不能容忍轻微的不足。为了满足所制造产品的持续高质量的要求,经常使用自动化质量保证系统。其中一些系统基于纯光学的方法,而另一些系统则依靠对产品参数的机械/机电测量。另一类质量测量方法依靠通过电子显微镜、荧光显微镜、光显微镜、光学相干断层扫描系统、干涉仪、光谱仪或其他计算机断层扫描系统进行的数据评估。可以使用人工智能技术、特别是机器学习系统来评定测量的值。为了使这些系统按要求运行,通常需要具有大量的训练数据,以便使用随后进行训练的机器学习系统来检测所生产工件中的异常。所有的训练数据都必须手动注释,这需要专业人员投入大量的时间。在这种情况下,注释应理解为是指将待分类的每个异常分配给期望的预定异常类别的过程。这可能是孔隙 ...
【技术保护点】
1.一种用于扩展用于机器学习的训练数据集的计算机实施的方法(100),该方法包括:/n- 提供待研究对象的数据集,其中,该数据集具有坐标值和每个坐标的测量值,并且其中,/n该数据集是使用计算机断层扫描系统由图像记录方法推导而得,/n- 识别该数据集中的与该待研究对象的子区域相对应的分区中的异常,/n- 通过用第一训练数据集训练的第一机器学习模型将该异常分类到多个预定义的分类类中,/n- 确定该异常与经训练的第一机器学习模型相比的差值,其中,确定该差值包括/n通过用第二训练数据集训练的第二机器学习模型来确定新颖性程度的组合,/n- 当该差值高于第一预定义阈值时,将与所识别的异 ...
【技术特征摘要】
20190425 DE 102019110721.01.一种用于扩展用于机器学习的训练数据集的计算机实施的方法(100),该方法包括:
-提供待研究对象的数据集,其中,该数据集具有坐标值和每个坐标的测量值,并且其中,
该数据集是使用计算机断层扫描系统由图像记录方法推导而得,
-识别该数据集中的与该待研究对象的子区域相对应的分区中的异常,
-通过用第一训练数据集训练的第一机器学习模型将该异常分类到多个预定义的分类类中,
-确定该异常与经训练的第一机器学习模型相比的差值,其中,确定该差值包括
通过用第二训练数据集训练的第二机器学习模型来确定新颖性程度的组合,
-当该差值高于第一预定义阈值时,将与所识别的异常有关的数据添加到该第一训练数据集,以及
-通过从整体训练数据集中分别随机选择数据集来创建该第一训练数据集和该第二训练数据集。
2.根据权利要求1所述的方法,其中,该异常是大量异常,并且该添加包括:-当该差值高于第二预定义阈值时,将选定的所识别异常的数据添加到该训练数据集。
3.根据权利要求1或2所述的方法,其中,该差值是通过从由以下各项组成的组中选择的针对选定异常的新颖性程度方法确定的:新颖性检测、估计错误减少、估计熵最小化、预期模型输出变化(EMOC)、MC-dropout、OpenMAX、SVM余量、神经网络、最高分类概率与次高分类概率之比、分类概率熵、GP方差、来自聚合分类器的各个分类概率的方差、在输入信号的干扰情况下分类概率的方差。
4.根据权利要求3所述的方法,其中,这些新颖性程度方法的组合是使用从由以下各项组成的组中选择的方法确定的:多臂老虎机公式化、多个标准中的成功驱动选择、基于奖励函数的线...
【专利技术属性】
技术研发人员:C沃耶克,A施里坎塔,W阿尔卡尔迪,A弗雷塔格,
申请(专利权)人:卡尔蔡司工业测量技术有限公司,
类型:发明
国别省市:德国;DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。