当前位置: 首页 > 专利查询>闽江学院专利>正文

基于深度自监督变换学习的白细胞分类方法技术

技术编号:36209485 阅读:28 留言:0更新日期:2023-01-04 12:05
本发明专利技术涉及一种基于深度自监督变换学习的白细胞分类方法。首先通过k种数据增强方法对白细胞数据集进行增强,通过让神经网络去预测白细胞图像所使用的数据增强方法来训练网络,获得具有白细胞图像的先验知识。本发明专利技术提升了对白细胞分类的精度。升了对白细胞分类的精度。升了对白细胞分类的精度。

【技术实现步骤摘要】
基于深度自监督变换学习的白细胞分类方法


[0001]本专利技术属于图像处理
,具体涉及一种基于深度自监督变换学习的白细胞分类方法。

技术介绍

[0002]白细胞,又称白血球(WBCs),是免疫细胞的主要组成部分,在通过视觉检查白细胞图像诊断和预后方面发挥着重要作用。通过对白细胞图像的视觉检查,对血液病的诊断和预后起到重要作用。大多数的早期检测和分类,不仅工作量大、耗时长,而且分类结果可能会受到血液学专家主观偏差的影响。因此,白细胞的自动分类在过去的20年里来一直是人们关注的研究领域。
[0003]在过去的几十年里,白细胞自动诊断系统的发展在图像分析方面取得了相当大的成功。比人工分析更成功。传统的机器学习算法首先被应用于这一领域。然而,这些方法取决于细胞分割的预处理,该过程中的错误将对细胞的分类产生负面影响。最近,研究人员转向了深度学习方法,使用称为神经网络的模型来学习。特别是卷积神经网络(CNN),作为一种快速发展的深度学习模型,已被广泛地应用于白细胞分类。CNN模型取得的高成功率但它需要大量的注释和计算资源的问题变得十分突出。在大多数情况下,由于医学细胞数据集的数量有限和图像分辨率低,很难从头开始训练CNN。因此,自监督学习被用来减少建立深度学习模型训练所需的训练数据和计算成本。最初,该模型在大型和不同的通用图像数据集上进行预训练,然后应用于分类任务。
[0004]在白细胞自动分类模型的开发过程中,现有方法仍然需要大量的数据注释和处理。大量的数据注释和处理,无法缓解工作量大的窘境。因此,如何从无标记数据中学习有用的表征成为减少对昂贵的人工标注的依赖的关键。一个解决方案是定义一个无标签的任务,将输入数据本身的视觉信息作为监督信号。因此,在这个领域出现了不同的机制来解决表征学习问题,在多个视觉任务上取得了令人鼓舞的结果任务,如补丁位置预测[4],解决拼图[5]和旋转预测[6]。他们的基本目标是在不同的失真或图像变换下学习不变的表示。或图像转换,其中不同的借口任务是由模型以自我监督的方式进行的,以学习直接在未标记的数据上学习有用的表征。然而,很少有方法探索白细胞图像的自监督视觉表征探讨白细胞图像的自监督视觉表征学习,因为白细胞图像与自然场景中的图像有很大不同。
[0005]自监督学习是无监督学习的一个分支,它期望学习无标签数据的有效表征。尤其是基于对比学习的方法[1,2],由于其良好的可解释性,已经成为主要的分支。对比学习的目的是增加负面样本的距离,同时减少正面样本的距离。然而,对比性学习需要考虑均匀性特征和正例特征的排列之间的权衡。此外,基于聚类的方法在自监督学习中也发挥了重要作用。这些方法要求样本向聚类的中心靠近,以学习视觉表征。例如,DeepCluster[3]使用k

means手段聚类算法对特征进行迭代分组,然后作为伪标签,根据聚类结果更新权重结果进行更新。最近,研究证明,伪标签经常使用退化的解决方案来分配相同的标签,并不具有在同一领域具有竞争力。与上述方法不同,自监督学习的一个独特类型是构建一个有效的
借口任务,为下游任务引入一些有益的先验信息。有效借口任务的例子有预测相对补丁的偏移[4],完成拼图[5],和预测图像旋转[6]。本专利技术算法所提出的自监督方法属于基于辅助任务分支。与我们最相关的是RotationNet[6]。它通过预测图像旋转角度来学习图像中的物体类别及其语义信息。然而,对于白细胞数据集,单一的旋转图像错过了细胞的形态学特征和纹理。为了解决这个问题。我们设计了一个更广泛的任务,预测数据增强的类型。

技术实现思路

[0006]本专利技术的目的在于提供一种基于深度自监督变换学习的白细胞分类方法,该方法改善了白细胞分类的精度。
[0007]为实现上述目的,本专利技术的技术方案是:一种基于深度自监督变换学习的白细胞分类方法,包括:
[0008]图像增强阶段:
[0009]建立一个基于图像变换的分类任务,定义k个应用于输入图像X的图像变换图像变换后带着标签y产生的图像为X
y
=g(X|y);
[0010]特征提取阶段:
[0011]给定一个未标记的无标签数据集和一个被一组可学习的权重向量参数化的非线性函数f
θ
(
·
)即卷积神经网络作为模型;使用预定义k个图像变换G(X
n
)是用来表示每一个应用图像变换的图像X
n
所产生的概率分布,其中代表第i个数据增强的样本分布即输入实例的特定增强版本;数据增强后的图像前向传播到模型中产生一个特征向量收集在一个集合
[0012]分类阶段:
[0013]选择k个分类头取代原有的单一分类头来输出对于数据增强后的图像所产生的概率分布;对于每一个特征向量输入到k个分类头中,然后将输出的概率值拼接在一起作为当前图像增强的概率分布;拼接的概率分布描述为:
[0014][0015][0016]其中a
cat
(
·
)表示拼接操作,代表第n张图像从第i个分类头输出的概率值,k为分类头的个数,θ为网络模型的参数。
[0017]相较于现有技术,本专利技术具有以下有益效果:本专利技术使用自监督算法来进行学习无标签的白细胞图像。因为白细胞图像之间十分相近,使用常规的自监督算法很难分辨白细胞的类别,本专利技术算法首先通过k种数据增强方法对白细胞数据集进行增强,通过让神经网络去预测白细胞图像所使用的数据增强方法来训练网络,获得具有白细胞图像的先验知识。我们在两种白细胞数据集上进行了线性评估、领域迁移和微调的测试,结果证实了本专利技术算法均提升了对两种白细胞数据集的分类精度。
附图说明
[0018]图1为本专利技术方法网络模型架构图。
[0019]图2为t

SNE的可视化结果。
具体实施方式
[0020]下面结合附图,对本专利技术的技术方案进行具体说明。
[0021]本专利技术一种基于深度自监督变换学习的白细胞分类方法,包括:
[0022]图像增强阶段:
[0023]建立一个基于图像变换的分类任务,定义k个应用于输入图像X的图像变换图像变换后带着标签y产生的图像为X
y
=g(X|y);
[0024]特征提取阶段:
[0025]给定一个未标记的无标签数据集和一个被一组可学习的权重向量参数化的非线性函数f
θ
(
·
)即卷积神经网络作为模型;使用预定义k个图像变换G(X
n
)是用来表示每一个应用图像变换的图像X
n
所产生的概率分布,其中代表第i个数据增强的样本分布即输入实例的特定增强版本;数据增强后的图像前向传播到模型中产生一个特征向量收集在一个集合
[0026]分类阶段:
[0027]选择k个分类头取代原有的单一分类头来输出对于数据增强后的图像所产生的概率分布;对于每一个特征向量输入到k个分类头中,然后将输出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度自监督变换学习的白细胞分类方法,其特征在于,包括:图像增强阶段:建立一个基于图像变换的分类任务,定义k个应用于输入图像X的图像变换图像变换后带着标签y产生的图像为X
y
=g(X|y);特征提取阶段:给定一个未标记的无标签数据集和一个被一组可学习的权重向量参数化的非线性函数f
θ
(
·
)即卷积神经网络作为模型;使用预定义k个图像变换G(X
n
)是用来表示每一个应用图像变换的图像X
n
所产生的概率分布,其中代表第i个数据增强的样本分布即输入实例的特定增强版本;数据增强后的图像前向传播到模型中产生一个特征向量收集在一个集合分类阶段:选择k个分类头取代原有的单一分类头来输出对于数据增强后的图像所产生的概率分布;对于每一个特征向量输入到k个分类头中,然后将输出的概率值拼接在一起作为当前图像增强的概率分布;拼接的概率分布描述为:布;拼接的概率分布描述为:其中a
cat
(
·
)表示拼接操作,代表第n张图像从第i个分类头输出的概率值,k为分类头的个数,θ为网络模型的参数。2.根据权利要求1所述的一种基于深度自监督变换学习的白细胞分类方法,其特征在于...

【专利技术属性】
技术研发人员:李佐勇樊好义陈新伟郑国粦周力为
申请(专利权)人:闽江学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1