当前位置: 首页 > 专利查询>闽江学院专利>正文

基于类解耦分布对齐的半监督医学图像分类方法技术

技术编号:35369070 阅读:37 留言:0更新日期:2022-10-29 18:10
本发明专利技术涉及一种基于类解耦分布对齐的半监督医学图像分类方法。提出了一种新的类解耦分布对齐方法。该方法根据矩阵基的变化,利用监督信息和非监督信息之间的内在关系,更准确地预测未标记样本的伪标签。同时,提出了一种新的可变条件队列来存储具有较高置信度的样本。队列长度将随标签置信度的变化而变化,以避免少数类别的过采样和多数类别的欠采样。本发明专利技术的方法在半监督医学图像分类方面优于现有的方法。有的方法。有的方法。

【技术实现步骤摘要】
基于类解耦分布对齐的半监督医学图像分类方法


[0001]本专利技术属于图像处理
,具体涉及一种基于类解耦分布对齐的半监督医学图像分类方法。

技术介绍

[0002]医学影像的临床诊断需要综合多种因素。为了提高某些疾病患者的存活率,医务人员可以选择计算机辅助诊断来帮助他们判断病变程度。由于在收集医学图像数据集的过程中存在个人隐私和专业设备问题,普通研究机构很难收集大规模的医学图像数据。一些疾病的罕见性也导致相应的数据收集较少,导致数据集分布不均。尽管近年来深度学习的发展在医学图像分类任务中取得了良好的成绩,但数据的缺乏、数据分布的不平衡以及获取病变区域的困难等问题仍然容易导致模型训练信息不足和过度拟合。
[0003]为了缓解上述问题产生的不利影响,半监督学习被广泛应用于基于深度神经网络的医学图像分类中。例如,[1]使用MaskR

CNN获得准确的病变分割结果,然后使用自定步调学习策略来加强训练数据。受同伴学习的启发,[2]构造了一种方法,鼓励未标记的数据向他人学习,从而在皮肤疾病分类上生成相应的伪标签。[3]提出了一种在一致性正则化策略下基于类激活图掩码的数据增强方法,以提高识别间质性肺疾病的性能。[4]根据Mean

Teacher[5]框架,根据类别概率设计置信度模块,以提高性能。然而,所有这些方法都没有考虑到在产生伪标记的过程中类失衡的影响。类别不平衡会误导模型使用同一标签标注不同类别的医学图像,并在传播错误标签时造成错误积累问题,导致性能下降。
[0004]分布对齐最早由[6]提出,用于对齐标记和未标记样本的分布,并在[7]中显示其对不平衡数据的有效性。然而,据本专利技术所知,DA的理论基础并不充分,它在不平衡数据中的作用是可以探索的。在数学中,有限维度向量空间中的元素可以唯一地用坐标向量表示。如果考虑两个不同的基,一个基上的向量的坐标向量通常不同于另一个基上的向量。基的变化包括将每个以相对于一个基的坐标表示的向量转换为以相对于另一个基的坐标表示的向量。受此启发,本专利技术提出了一种在类不平衡情况下基于医学图像分类的类解耦分布对齐(CDDA)。与以往的方法不同,本专利技术充分利用了现有数据中的标签信息,帮助模型感知更准确的数据分布,避免了训练过程中大量的伪标签误判。具体地说,本专利技术通过指数移动平均将每个类别的标记/未标记集分布和置信度存储为向量。随着每个向量的更新,本专利技术将使用带标签和不带标签的置信度比值来约束更新频率,从而解决置信度更新滞后的副作用。为了充分利用CDDA中包含的监督信息,本专利技术对其进行了温度标度扩展。与仅使用常数的普通温度控制方法不同,本专利技术设计了一个特定的线性函数进行调节。考虑到某些疾病类别可能不会出现在随机抽样的批次中,且不平衡数据导致的模型偏差会影响当前批次的预测,本专利技术提出了一个称为可变条件队列的模块,该模块根据预设阈值入队/出队,以替换原始的未标记数据,其长度将根据置信度变化,使未标记样品在批次中的分布更加合理。

技术实现思路

[0005]本专利技术的目的在于解决半监督医学图像分类中的数据缺乏、数据分布不平衡以及获取病变样本困难而导致模型训练信息不足和过度拟合问题,提供一种基于类解耦分布对齐的半监督医学图像分类方法,该方法根据矩阵基的变化,利用监督信息和非监督信息之间的内在关系,更准确地预测未标记样本的伪标签。同时,为了进一步减少不平衡分布的不利影响,本专利技术使用转换后的样本分布来呈现基于阈值筛选样本的可变条件队列。队列长度将使用特定参数进行更改,以更好地适应真实的样本分布。
[0006]为实现上述目的,本专利技术的技术方案是:一种基于类解耦分布对齐的半监督医学图像分类方法,其特征在于,提出一种新的类解耦分布对齐方法,该方法根据矩阵基的变化,利用监督信息和非监督信息之间的内在关系,预测未标记样本的伪标签;同时,提出了一种新的可变条件队列来存储具有较高置信度的样本,可变条件队列的队列长度随标签置信度的变化而变化。
[0007]相较于现有技术,本专利技术具有以下有益效果:本专利技术提出了一种新的类解耦分布对齐方法,该方法根据矩阵基的变化,利用监督信息和非监督信息之间的内在关系,更准确地预测未标记样本的伪标签。同时,提出了一种新的可变条件队列来存储具有较高置信度的样本。队列长度将随标签置信度的变化而变化,以避免少数类别的过采样和多数类别的欠采样。本专利技术在开放的皮肤病数据集HAM10000和胸部X光数据集CheXpert上进行了充分的实验,结果表明本专利技术的方法在半监督医学图像分类方面优于现有的方法。
附图说明
[0008]图1为本专利技术方法流程图。
[0009]图2为本专利技术网络模型框架。
[0010]图3为本专利技术提出的方法在不同医学图像数据集的定性结果。
具体实施方式
[0011]下面结合附图,对本专利技术的技术方案进行具体说明。
[0012]本专利技术提出了一种新颖的基于类解耦分布对齐(CDDA)的医学图像分类算法,该算法适用于类不平衡情况下的医学图像分类。类解耦分布对齐通过指数移动平均(EMA)计算每个类的中心,然后用它规范化未标记的样本。此外,本专利技术将一种新的改进队列称为可变条件队列,并将其与CDDA合并,以进一步提高基于自训练框架的模型识别能力。详细说明如下。
[0013]1、类别解耦分布对齐
[0014]本专利技术构造了i个独立分布,每个分布都与原始分布对齐结构一致,以便更广泛、更准确地指示向量空间中有标签和无标签数据的分布,即类解耦分布对齐。首先,本专利技术通过EMA保留每个类别的有标签集分布和置信度c
i
(X)(i=1,2,

,n),n等于数据集中的类别数,这使得每个类别具有更丰富的特征表示。在类分布偏置的情况下,不仅模型的预测会有更大的偏差,而且无标签集置信度的更新也会滞后,导致模型无法对少数类进行准确分类。基于这个假设,本专利技术建议在更新无标签集分布和置信度c
i
(U)时,充分利用标记样
本对模型训练的内在影响,避免少数类陷入过度拟合:
[0015][0016]其中,X和U分别表示有标签样本和无标签样本。在生成c
i
(U)和时,c
i
(X)和c
i
(U)之间的G
i
可以被视为两个分布在降维后的定量差异,这促进了模型缩短两个数据分布之间的距离,并通过转换基使模型对局部扰动具有鲁棒性,其表示为:
[0017][0018]其中ω是一个超参数,表示决定更新速度的动量。无标签集分布同样使用这种方法计算,它强调了在不同批次下对每个样本进行更优化的预测。本专利技术的类解耦分布对齐将通过以下公式表示:
[0019][0020]其中,q是未标记数据的预测,是DA之后的改进伪标签,Normalize(x)
i
=x
i

j
x
j
。受数据稀缺性和数据不平衡性的影响,迭代后的神经网络输出倾向于大多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于类解耦分布对齐的半监督医学图像分类方法,其特征在于,提出一种新的类解耦分布对齐方法,该方法根据矩阵基的变化,利用监督信息和非监督信息之间的内在关系,预测未标记样本的伪标签;同时,提出了一种新的可变条件队列来存储具有较高置信度的样本,可变条件队列的队列长度随标签置信度的变化而变化。2.根据权利要求1所述的基于类解耦分布对齐的半监督医学图像分类方法,其特征在于,所述类解耦分布对齐方法实现如下:构造i个独立分布,每个分布都与原始分布对齐结构一致,以便指示向量空间中有标签样本和无标签样本的分布,即类解耦分布对齐;首先,通过EMA保留每个类别的有标签集分布和置信度c
i
(X)(i=1,2,

,n),n等于整个数据集中的类别数;在更新无标签集分布和置信度c
i
(U)时,利用有标签样本对模型训练的内在影响,避免少数类陷入过度拟合:其中,X和U分别表示有标签集和无标签集,在生成c
i
(U)和时,c
i
(X)和c
i
(U)之间的G
i
被视为两个分布在降维后的定量差异,这促进了模型缩短两个分布之间的距离,并通过转换基使模型对局部扰动具有鲁棒性,其表示为:其中ω是一个超参数,表示决定更新速度的动量,无标签集分布同样使用这种方法计算;类解耦分布对齐将通过以下公式表示:其中,q是无标签样本的预测,是DA之后的改进伪标签,Normalize(x)
i
=x
i

j
x
j
;受数据稀缺性和数据不平衡性的影响,迭代后的神经网络输出倾向于大多数类,这导致有偏的产生;因此使用作为有标签集分布,T为温度,分别控制每个类根据温度参数缩放后的输出;EMA获得的置信度c
i
(X)与有标签样本的数量有关,因此通过一个基本线性函数专门设置T:如果一个类别中有标签样本的数量较少,其T将变得更高;当T
i

1时,第i类的将被转换以满足有标签集分布,从而缓解数据不平衡;通过置信度可以合理地控制温度的变化,以避免大多数样本的伪标签被错误地预测为多数类;当T
i

0时,变化非常微小...

【专利技术属性】
技术研发人员:李佐勇汪涛黄中政林滨曹新容
申请(专利权)人:闽江学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1