细胞核的分类制造技术

技术编号:24854918 阅读:42 留言:0更新日期:2020-07-10 19:08
本发明专利技术涉及一种可用于生物样本中的对象精确分类的系统。用户首先手动分类一初始图像集,其用于训练一分类器。然后,该分类器在一组完整的图像集上运行,并且不仅输出分类,还输出每个图像在各种类别中的概率。然后显示图像,不仅按照建议的类别进行分类,而且还对图像实际上属于建议的替代类别的可能性进行排序。然后,用户可以根据需要重新分类图像。

【技术实现步骤摘要】
细胞核的分类
本专利技术涉及细胞核的自动分类。
技术介绍
细胞核的数字图像分析是从组织获得定量信息的有用方法。通常需要多个细胞核来进行有意义的分析,因此存在着开发能够从原始培养基捕获这些细胞核并收集大量合适的细胞核用于分析的自动系统的动机。从制备的样品拍摄的图像中提取对象的过程称为分割。分割通常除了会产生目标对象以外,还会产生伪像。这种伪像可能包括非核或不正确分割的核的对象,这两者都需要被排除。通过分割过程也可以正确地提取不同类型的细胞,例如上皮细胞、淋巴细胞、成纤维细胞和浆细胞。在完成分析之前,必须将不同的细胞类型分组在一起,因为根据细胞的功能和所考虑的分析类型,它们可能是或可能不是所涉及的分析操作所关注的。手动分类受到观察者间和观察者内部变化的影响,并且需要花费很多时间才能完成。在小样本中可以有高达5,000个对象,在较大的样本中可以有100,000个对象。因此,需要创建一种允许在用于细胞核分析的系统内精确自动分类对象的系统。应当注意的是,这些系统中的对象分类可能不是最终结果,而只是允许完成对象后续分析的一个步骤。有许多方法可用于在监督训练系统中生成分类器,其中预定义数据集用于训练系统。有些特别不适合包含在这种类型中的系统。例如,使用整个图像的自动确定要在分类中使用的度量的基于神经网络的系统是不合适的,因为它们可以包括分类方案中的特征,其与用于完成分析任务的后续计算的度量具有强相关性。生成分类方案的其他方法包括区分分析和生成决策树,例如OC1和C45。GB2486398描述了这样一种对象分类方案,其通过使用第一二元增强分类器将个体核分为多种类型的核,以将个体核分类入第一类,并且通过使用第二二元增强分类器对那些未被第一类二元增强分类器分类为第一类的个体核分入第二类。通过级联算法,改进了对象分类。GB2486398提出的方法涉及在训练过程中的大量用户输入,用以对对象进行分类,从而对分类器进行训练。这更常应用于任何对象分类系统,因为它们都需要训练输入。对于少量对象,为创建训练数据库而手动分类对象相对简单,但是在大量对象是训练数据库的一部分的情况下产生困难。因此,需要一种对象分类方案,该方案可以在处理具有大量对象的训练数据库时提供对GB2486398的分类方案的改进。
技术实现思路
本专利技术提供了一种对象分类器,并提供了一种将细胞核图像集分类为多个类别的方法,包括:接受将从所述图像集中取得的一初始训练集中的每一幅分类为所述多个类别中的用户选择的类别的输入;计算表征所述初始训练集的各个细胞核的图像和/或形状的多个分类参数;使用所述初始训练集的所述用户选择的类别和所述多个分类参数训练一分类算法;在所述图像集中的每一幅上运行已训练的所述分类算法,以输出所述图像集中的每一幅在所述多个类别中的每一类中的概率的集合;在用户界面上输出所述图像集的细胞核图像,根据所述概率的集合的指示,所述图像处于所述多个类别中的一可能的类别中,并且还具有与所述多个类别中的所述可能的类别不同的潜在替代类别;接受用户输入以从输出的图像中选择应该被重新分类到所述潜在替代类别中的图像,以获得所述图像集中每一幅的最终类别;以及使用全部所述图像集中每一幅的所述最终类别和所述多个分类参数来重新训练所述分类算法。通过仅在初始图像集中的一部分图像上实施训练第一分类器的步骤,然后对完整图像集进行分类,显示完整图像集,该图像集以图像可能属于一潜在替代类别的可能性排序显示,然后允许用户进行进一步的输入以改进所述分类,该方法可以处理比GB2486398中提出的方法的相同用户输入量更多数量的输入图像。通过使用所述完整图像集中每一幅图像的所述最终类别和所述多个分类参数重新训练所述分类算法,得到了在大的输入图像集上训练过的分类算法。可选地,分类后的图像可以被另外做进一步的直接处理,因而该方法可以进一步包括对具有一个或多个最终类别的所述图像集的图像进行进一步分析。因此,该方法可以进一步包括为处于所选择的一个或多个最终类别中的所述图像集的图像计算至少一个另外的光学参数。作为计算另一光学参数的替代或补充,该方法可以进一步包括进行病例分层,例如通过分析已分类的细胞核以获得与癌症或其他疾病的不同阶段相关的特征。本专利技术人已经发现,使用所提出的图像分类方法可改进病例分层。病例分层的输出可以被医学实践者使用,例如用以改善诊断或确定预后。所述分类算法可以是适于输出一组一幅图像代表每个相应类别的一个示例的相应概率的算法。所述分类算法可以是用于分类或回归的集成学习方法,其通过在训练时构建多个决策树并输出各个树的类别来运行,所述类别在分类的情况下是类别模式,或者在回归的情况下是平均预测模式。所述多个分类参数可包括选自以下的多个参数:面积、光密度、主轴长度、次轴长度、形式因子、形状因子、偏心率、凸面积、凹度、等效直径、周长、周长偏差、对称性、形状的Hu矩(Humomentsoftheshape)、形状内图像的Hu矩(Humomentsoftheimagewithintheshape)、整个图像的Hu矩(Humomentsofthewholeimage)、形状内的平均强度(Meanintensitywithintheshape)、形状内的强度的标准偏差(standarddeviationofintensitywithintheshape)、形状内的强度的方差(varianceofintensitywithintheshape)、形状内的强度的偏度(skewnessofintensitywithintheshape)、掩模内强度的峰度(kurtosisofintensitywithinthemask)、形状内强度的变异系数(coefficientofvariationofintensitywithintheshape)、整个区域的平均强度(meanintensityofwholearea)、整个区域的强度标准偏差(standarddeviationofintensityofwholearea)、整个区域的强度方差(varianceofintensityinthewholearea)、整个区域的强度偏度(skewnessofintensitywithinwholearea)、整个区域的强度峰度(kurtosisofintensitywithinwholearea)、形状边界均值(bordermeanofshape)、正好在掩模边界外的五个像素宽的条带强度均值、正好在掩模边界外的五个像素宽的条带强度标准偏差、正好在掩模边界外的五个像素宽的条带强度方差、正好在掩模边界外的五个像素宽的条带强度的偏度、正好在掩模边界外的五个像素宽的条带强度的峰度;正好在掩模边界外的五个像素宽的条带强度的变异系数、锯齿度、半径方差、最小直径、最大直径、对象中的灰度级数、角度变化,以及应用Gabor滤波器后图像强度的标准偏差。本专利技术人已经发现,当与合适的分类算法(如基于树的分类器)组合时,这些参数给出了本文档来自技高网
...

【技术保护点】
1.一种将细胞核图像集分类为多个类别的方法,包括:/n接受将从所述图像集中取得的一初始训练集中的每一幅分类为所述多个类别中的用户选择的类别的输入;/n计算表征所述初始训练集的各个细胞核的图像和/或形状的多个分类参数;/n使用所述初始训练集的所述用户选择的类别和所述多个分类参数训练一分类算法;/n在所述图像集中的每一幅上运行已训练的所述分类算法,以输出所述图像集中的每一幅在所述多个类别中的每一类中的概率的集合;/n在用户界面上输出所述图像集的细胞核图像,根据所述概率的集合的指示,所述图像处于所述多个类别中的一可能的类别中,并且还具有与所述多个类别中的所述可能的类别不同的潜在替代类别;/n接受用户输入以从输出的图像中选择应该被重新分类到所述潜在替代类别中的图像,以获得所述图像集中每一幅的最终类别;以及/n使用全部所述图像集中每一幅的所述最终类别和所述多个分类参数来重新训练所述分类算法。/n

【技术特征摘要】
20181213 GB 1820361.21.一种将细胞核图像集分类为多个类别的方法,包括:
接受将从所述图像集中取得的一初始训练集中的每一幅分类为所述多个类别中的用户选择的类别的输入;
计算表征所述初始训练集的各个细胞核的图像和/或形状的多个分类参数;
使用所述初始训练集的所述用户选择的类别和所述多个分类参数训练一分类算法;
在所述图像集中的每一幅上运行已训练的所述分类算法,以输出所述图像集中的每一幅在所述多个类别中的每一类中的概率的集合;
在用户界面上输出所述图像集的细胞核图像,根据所述概率的集合的指示,所述图像处于所述多个类别中的一可能的类别中,并且还具有与所述多个类别中的所述可能的类别不同的潜在替代类别;
接受用户输入以从输出的图像中选择应该被重新分类到所述潜在替代类别中的图像,以获得所述图像集中每一幅的最终类别;以及
使用全部所述图像集中每一幅的所述最终类别和所述多个分类参数来重新训练所述分类算法。


2.根据权利要求1所述的方法,还包括:
为处于所选择的一个或多个最终类别中的所述图像集的图像计算至少一个另外的光学参数。


3.根据前述权利要求中任一项所述的方法,还包括对处于所选择的一个或多个最终类别中的所述图像集的图像进行病例分层。


4.根据前述权利要求中任一项所述的方法,其中,所述分类算法是用于分类或回归的集成学习方法,其通过在训练时构建多个决策树并输出各个树的类别来运行,所述类别在分类的情况下是类别模式,或者在回归的情况下是平均预测模式。


5.根据前述权利要求中任一项所述的方法,其中,所述多个分类参数包括选自以下的多个参数:面积、光密度、主轴长度、次轴长度、形式因子、形状因子、偏心率、凸面积、凹度、等效直径、周长、周长偏差、对称性、形状的Hu矩、形状内图像的Hu矩、整个图像的Hu矩、形状内的平均强度、形状内的强度的标准偏差、形状内的强度的方差、形状内的强度的偏度、掩模内强度的峰度、形状内强度的变异系数、整个区域的平均强度、整个区域的强度标准偏差、整个区域的强度方差、整个区域的强度偏度、整个区域的强度峰度、形状边界均值、正好在掩模边界外的五个像素宽的条带强度均值、正好在掩模边界外的五个像素宽的条带强度标准偏差、正好在掩模边界外的五个像素宽的条带强度方差、正好在掩模边界外的五个像素宽的条带强度的偏度、正好在掩模边界外的五个像素宽的条带强度的峰度;正好在掩模边界外的五个像...

【专利技术属性】
技术研发人员:约翰·罗伯特·麦迪森赫华德·丹尼尔森
申请(专利权)人:梅傲科技广州有限公司庐肆集团有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1