弱监督的图像分类器制造技术

技术编号：41228221 阅读：2 留言：0更新日期：2024-05-09 23:45

提供了用于训练和使用图像分类器的系统和方法。可以从被注释为第一类型或第二类型的图像的相应块中生成多个点。可以将与所述第二类型的图像相对应的所述点聚类为两个聚类。可以将所述两个聚类中的第一聚类标识为更靠近与被注释为所述第一类型的图像相对应的点。可以将所述第一聚类中的点分配给正类，可以将所述第二聚类中的点分配给负类，并且可以将与被注释为所述第一类型的图像相对应的点分配给锚类。可以基于各种类中的点生成多个三元组。可以基于所述三元组的损失函数来调整图像分类器的参数。

全部详细技术资料下载

【技术实现步骤摘要】

本公开文本总体上涉及用于训练和使用图像分类器的系统和方法。更具体地，本公开文本涉及用于通过将机器学习技术应用于多个被注释的图像来训练和使用弱监督图像分类器的系统和方法。

技术介绍

1、图像分类可能是一个昂贵且冗长的过程。对于一些图像分类应用，诸如与军事领域或医学领域有关的那些应用，对图像进行准确且可靠的分类可能是非常重要的，并且通常可以由经过专门培训的人来执行。很难以自动化方式准确且可靠地对某些类型的图像进行分类。

技术实现思路

1、提供了与训练图像分类器有关的方法、系统和装置。计算图像分类器模型可以具有极大减少用于自动图像分类的工作和资源的潜力。通常，术语“图像分类”可以包括确定未分类的输入图像是第一类型还是第二类型，其中所述第一类型和所述第二类型是已知的。在一些实施方式中，本公开文本的所述系统和方法可以接收具有可以在多维空间中表示的复杂特征集的未分类的输入图像。例如，图像可以具有大量的像素(例如，以106或以上的数量级)，并且每个像素可以具有针对诸如红色、绿色和蓝色的多种颜色中的每一种颜色相关联的值。下面进一步描述的系统和方法可以从弱监督中学习输入图像的低维嵌入。在一些实施方式中，图像可以被划分为多个块，并且所述块可以被自动地划分为代表第一类型和第二类型的聚类。这种学习的嵌入允许使用简单的分类器来解决针对输入图像的整体分类任务，诸如关于组成所述输入图像的块的k个最近邻。一般地，弱监督可以指在仅已知整体切片类型(例如，所述第一类型或者所述第二类型)的数据集中的切片的情况。可能没有

2、在一些实施方式中，可以基于类型(例如，分类)已知的一组图像来训练图像分类模型。可以将所述图像划分为块，并且可以生成块的库。例如，一个库可以包括与第一类型的图像相对应的块，并且第二库可以包括与第二类型的图像相对应的块。可以利用迭代训练过程来完成对图像分类模型的训练，并且可以从针对每个训练回合的每个库中采样块的子集。对于给定的训练回合，可以使用图像分类模型将每个块转换为低维嵌入空间中的点，所述图像分类模型可以是例如卷积神经网络。

3、在一些实施方式中，可以使用聚类算法将来自一个库的点聚类为两个聚类。在所述两个聚类中，与来自第二库中的点具有最小距离的聚类中所包括的点可被分配给正类，而另一个聚类所包括的点可被分配给负类。来自第二库的点可以被视为锚类。可以对来自锚类、正类和负类的点进行采样以生成三元组，其中每个三元组包括一个锚点、一个正点和一个负点。然后可以计算损失函数，诸如三元组边际损失。在一些实施方式中，梯度下降优化可被用于调整图像分类模型的参数以最小化所述损失函数。

4、一旦训练了分类器，新图像就可以被接收并且被并划分为多个块。分类器可以对所述块进行预测和分类。可以聚集对图像的所有块的预测(例如，分类)以将整个图像分类为第一类型或第二类型。另外地，下面进一步描述的系统和方法可以提供整个图像的按块分割以用于界定负责将所述图像分类为第一类型或第二类型的特征。

5、本公开文本中描述的技术可以具有多种有用的应用。在一些实施方式中，如本文所描述的图像分类系统可被用于医学诊断。例如，每个图像可以是代表从患者处获取的组织样品的病理切片的图像，并且每个切片可以被分类为良性的或肿瘤性的。所述切片可被用于训练图像分类模型，所述图像分类模型可以确定未分类的输入图像代表良性组织还是肿瘤组织。因为肿瘤通常仅代表被分类为肿瘤性切片的一小部分，所以即使对于受过训练的人也难以准确地对此类切片进行分类。本公开文本的所述系统和方法可以帮助自动化这样的分类，并且还可以分割与肿瘤切片相对应的图像，使得清楚地界定出被分类为肿瘤性的每个切片的肿瘤部分。在一些其他实施方式中，本公开文本的技术可被应用于其他类型的图像。例如，本文所述的系统和方法可被用于基于一组训练图像(例如，其可以是卫星图像)来自动确定输入图像中是否存在特定的对象或人。

6、本公开文本的一个方面涉及一种训练图像分类器的方法。所述方法可以包括：由包括一个或多个处理器的设备从相应的块中生成多个点，所述相应的块是从被注释为第一类型或第二类型的图像中生成的。所述方法可以包括由所述设备使用聚类算法的将与被注释为所述第二类型的图像相对应的点聚类为两个聚类。所述方法可以包括由所述设备标识所述两个聚类中的第一聚类，所述第一聚类比所述两个聚类中的第二聚类更靠近与被注释为所述第一类型的图像相对应的点。所述方法可以包括由所述设备将所述第一聚类中的点分配给正类、将所述第二聚类中的点分配给负类、并且将与被注释为所述第一类型的图像相对应的点分配给锚类。所述方法可以包括由所述设备生成多个三元组。每个三元组可以包括来自所述锚类的相应点、来自所述正类的相应点、和来自所述负类的相应点。所述方法可以包括由所述设备计算所述多个三元组的损失函数。所述方法可以包括由所述设备基于所述损失函数来调整图像分类器的参数。

7、在一些实施方式中，每个块可以由多维空间中的图像数据来表示。所述方法可以进一步包括由所述设备通过使用所述图像分类器将针对所述块中的每个块的图像数据转换为低维空间来生成所述多个点。在一些实施方式中，所述图像分类器可以被实施为卷积神经网络。

8、在一些实施方式中，每个图像可以对应于相应的病理切片，被注释为所述第一类型的图像被标识为良性的，被注释为所述第二类型的图像被标识为肿瘤性的。在一些其他实施方式中，每个图像可以对应于卫星照片。

9、在一些实施方式中，所述方法可以包括由所述设备接收与所述多个图像相对应的图像数据。可以仅针对所述多个图像的子集执行从所述图像的相应块中生成所述多个点的步骤。在一些实施方式中，计算所述多个三元组的所述损失函数可以包括由所述设备计算针对所述多个三元组的三元组边际误差。

10、在一些实施方式中，所述方法可以进一步包括由所述设备确定针对所述块中的每个块的模糊度度量或光水平度量中的至少一个。所述方法还可以包括在生成所述多个点之前，由所述设备丢弃块子集，所述丢弃是基于所述被丢弃的块子集中的每个块的所述模糊度度量或所述光水平度量中的至少一个。在一些实施方案中，所述方法可以进一步包括在生成所述多个点之前，由所述设备执行数据增强，所述数据增强包括对所述块中的至少一个块的旋转或颜色归一化中的至少一项。

11、在一些实施方式中，标识所述两个聚类中的、比所述两个聚类中的所述第二聚类更靠近与被注释为所述第一类型的图像相对应的点的所述第一聚类可以进一步包括：由所述设备确定第一平均欧几里得距离小于第二平均欧几里得距离，所述第一平均欧几里得距离是所述第一聚类中的点与同被注释为所述第一类型的图像相对应的点之间的距离，所述第二平均欧几里得距离是所述第二聚类中的点与同被注释为所述第一类型的图像相对应的点之间的距离。

12、在一些实施方式中，所述方法可以进一步包括本文档来自技高网...

【技术保护点】

1.一种训练图像分类器的方法，所述方法包括：

2.如权利要求1所述的方法，其中，每个块由多维空间中的图像数据表示，所述方法进一步包括由所述设备通过使用所述图像分类器将针对所述块中的每个块的所述图像数据转换为低维空间来生成所述多个点。

3.如权利要求2所述的方法，其中，所述图像分类器被实施为卷积神经网络。

4.如权利要求1所述的方法，其中：

5.如权利要求1所述的方法，其中，每个图像对应于卫星照片。

6.如权利要求1所述的方法，进一步包括由所述设备接收与所述多个图像相对应的图像数据，其中，仅针对所述多个图像的子集执行从所述图像的相应块中生成所述多个点的步骤。

7.如权利要求1所述的方法，其中，计算所述多个三元组的所述损失函数进一步包括由所述设备计算针对所述多个三元组的三元组边际误差。

8.如权利要求1所述的方法，进一步包括：

9.如权利要求1所述的方法，进一步包括在生成所述多个点之前，由所述设备执行数据增强，所述数据增强包括对所述块中的至少一个块的旋转或颜色归一化中的至少一项。

<...

【技术特征摘要】

1.一种训练图像分类器的方法，所述方法包括：

3.如权利要求2所述的方法，其中，所述图像分类器被实施为卷积神经网络。

4.如权利要求1所述的方法，其中：

5.如权利要求1所述的方法，其中，每个图像对应于卫星照片。

6.如权利要求1所述的方法，进一步包括由所述设备接收与所述多个图像相对应的图像数据，其中，仅针对所述多个图像的子集执...

【专利技术属性】
技术研发人员：T·福克斯，
申请(专利权)人：纪念斯隆凯特林癌症中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人