显微镜系统和生成处理显微镜数据的机器学习模型的方法技术方案

技术编号：40559471 阅读：7 留言：0更新日期：2024-03-05 19:21

在计算机实现的方法中，使用包含显微镜数据(F、G)的数据集(D)来训练用于处理显微镜数据的机器学习的模型(M)。计算数据集(D)在特征空间(Z)中的嵌入(E)。分析嵌入(E)以便为模型(M)的训练(25)确定训练设计规范(50)。训练(25)被定义为训练设计规范(50)的函数，并且随后被实施，由此模型(M)被配置为从待处理的显微镜数据(J)计算处理结果(60)。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及一种显微镜系统和一种生成用于处理显微镜数据的机器学习模型的计算机实现的方法。

技术介绍

1、在现代显微镜系统中，机器学习模型的作用的重要性持续增加，特别是在图像处理和数据评估领域。机器学习模型被用于例如自动定位样品或用于自动样品分析，例如以便通过分割测量生物细胞覆盖的面积或自动对细胞的数量进行计数。学习模型还被用于虚拟染色样品结构或用于图像增强，例如用于降噪、分辨率增强或伪影去除。

2、在许多情况下，显微镜用户用他们自己的数据来训练这样的模型。由申请人开发的显微镜软件允许用户使用他们自己的数据来进行训练过程，而无需机器学习领域的专业知识。这很重要，因为它有助于确保模型适合于用户处理的图像类型。也有人努力使包含新显微镜数据的训练过程最大可能程度地自动化。

3、模型训练的实施对模型的最终质量具有决定性的影响。质量明显受到例如所选择的模型架构或复杂度、训练的超参数、用于训练的数据集的准备以及将数据集划分为训练和验证数据的影响。如果训练以很大程度上自动化的方式执行，则有必要在最大可能的程度上自动地适当定义这些因素。然而，迄今为止，为了获得高质量的模型，有经验的专家必须进行大量的工作。

4、例如，将数据集手动划分为训练和验证数据需要相当多的经验，但与基于简单标准定义的自动划分相比，能够获得更高质量的结果，例如，使用数据集的每第十个图像作为验证图像。这种简单划分的使用可以容易地导致模型中的偏差和过度拟合，当使用验证数据测试模型时，这种偏差和过度拟合不一定被识别。例如，机器学习模型旨在区分不同类型

5、模型复杂度通常由专家手动定义。尽管用于定义复杂度和其他训练参数的自动方法是已知的，例如automl，但是这些方法需要高成本和长时间的测试训练运行，以便能够将不同训练的模型变量相互比较，从而定义训练参数。有关automl方法的更多信息，请参见：xin he et al,,arxiv:1908.00709v6[cs.lg]16apr.2021,"automl:a survey of thestate-of-the-art"。

6、训练数据中的异常值也会损害模型质量。例如，在分类任务中，异常值可以是具有不正确类别名称的显微镜图像。训练数据中的异常值通常根本无法被识别。原则上，可以在训练之后通过将预测与基本事实注释进行比较来识别异常值。然而，为了通过这种比较来识别异常值，模型必须还没有记住错误注释的数据，以便基于该数据做出预测。因此，异常值的识别通常需要相当大的努力并且可靠性有限。

7、参考x.glorot等人的“(2010):understanding the difficulty of trainingdeep feedforward neural networks”作为背景信息。本文描述了训练和验证神经网络的典型步骤。它还解释了可如何确定例如学习率以及模型的激活函数的设计和参数的适用值。

8、在减少要学习的模型参数的数量方面和在模型参数相互独立方面的显著改进描述于：haase,daniel；amthor,manuel“的“rethinking depthwise separableconvolutions:how intra-kernel correlations lead to improved mobilenets",arxiv:2003.13549v3[cs.cv]13jul 2020”。

9、作为进一步的背景，还可以参考laurens van der maaten,geoffrey hinton的“visualizing data using t-sne"in journal of machine learning research 9(2008)2579-2605”,以及laurens van der maaten“的“accelerating t-sne using tree-basedalgorithms，journal of machine learning research 15(2014)1-21”,以及等人的“current projection methods-induced biases at subgroupdetection for machine-learning based data-analysis of biomedical data，int.j.mol.sci.2020,21,79；doi:10.3390/ijms21010079”。这些文章描述了可如何以更容易解释的方式表示数据集。为此，采用了t分布随机邻居嵌入。

10、在ekin d.cubuk，，等人的“autoaugment:learning augmentation strategiesfrom data,arxiv:1805.09501v3[cs.cv]11apr.2019”中描述了自动数据增强的方法。通过增强，训练数据集的图像或其他数据被略微地修改，以便从中生成进一步的训练数据。在自动增强中，增强策略使用可用的数据来推导。用可用的数据训练已知的模型，以便用基于随机验证样品的强化学习方法来学习最优策略。因此，在将数据集划分为训练和验证数据时会遇到相同的缺点，因为验证数据在这里可能有偏差。也不可能直接地从数据推导出策略，因此数据增强所涉及的工作量可能很大。

技术实现思路

1、可以认为本专利技术的目的是提供一种显微镜系统和方法，该方法基于给定的数据集为模型确定适用的训练，从而以尽可能高的质量和尽可能低的错误率来进行捕获的显微镜数据的处理。

2、这个目的通过具有独立权利要求的特征的显微镜系统和方法来实现。

3、在根据本专利技术的用于生成用于处理显微镜数据的机器学习模型的计算机实现的方法中，获得包含显微镜数据的数据集用于训练模型。计算数据集在特征空间中的嵌入，即显微镜数据或从显微镜数据推导的数据在低维特征空间中的嵌入。分析嵌入，以便为模型的训练确定训练设计规范。随后根据训练设计规范来定义模型的训练。然后实施训练，由此模型被配置为能够从待处理的显微镜数据计算处理结果。

4、根据本专利技术的显微镜系统包括用于图像捕获的显微镜和被配置为执行根据本专利技术的计算机实现的方法的计算设备。显微镜特别地可以被配置为捕获显微镜数据或从中获得显微镜数据的原始数据。

5、根据本专利技术的计算机程序包括命令，当程序由计算机执行时，导致根据本专利技术的方法的执行。...

【技术保护点】

1.一种计算机实现的方法，用于生成机器学习的模型(M)，所述机器学习的模型(M)用于处理显微镜数据，所述方法包括：

2.根据权利要求1所述的方法，

3.根据权利要求1所述的方法，

4.根据权利要求1所述的方法，

5.根据权利要求4所述的方法，

6.根据权利要求4所述的方法，

7.根据权利要求1所述的方法，

8.根据权利要求7所述的方法，

9.根据权利要求7所述的方法，

10.根据权利要求1所述的方法，

11.根据权利要求10所述的方法，

12.根据权利要求1所述的方法，

13.根据权利要求12所述的方法，

14.根据权利要求13所述的方法，

15.根据权利要求1至14中任一项所述的方法，

16.根据权利要求1至14中任一项所述的方法，

17.根据权利要求1至14中任一项所述的方法，

18.根据权利要求1至14中任一项所述的方法，

19.根据权利要求1至14中任一项所述的方法，

20.根据权利要求1至14中任一项所述的方法，

21.根据权利要求1至14中任一项所述的方法，

22.根据权利要求1至14中任一项所述的方法，

23.根据权利要求1至14中任一项所述的方法，

24.根据权利要求1至14中任一项所述的方法，进一步包括：

25.一种显微镜系统，包括

26.一种计算机程序，包括命令，当所述程序由计算机执行时，导致执行根据权利要求1至14中任一项所述的方法。

...

【技术特征摘要】

1.一种计算机实现的方法，用于生成机器学习的模型(m)，所述机器学习的模型(m)用于处理显微镜数据，所述方法包括：