基于类解耦分布对齐的半监督医学图像分类方法技术

技术编号：35369070 阅读：37 留言：0更新日期：2022-10-29 18:10

本发明专利技术涉及一种基于类解耦分布对齐的半监督医学图像分类方法。提出了一种新的类解耦分布对齐方法。该方法根据矩阵基的变化，利用监督信息和非监督信息之间的内在关系，更准确地预测未标记样本的伪标签。同时，提出了一种新的可变条件队列来存储具有较高置信度的样本。队列长度将随标签置信度的变化而变化，以避免少数类别的过采样和多数类别的欠采样。本发明专利技术的方法在半监督医学图像分类方面优于现有的方法。有的方法。有的方法。

全部详细技术资料下载

【技术实现步骤摘要】
基于类解耦分布对齐的半监督医学图像分类方法

[0001]本专利技术属于图像处理
，具体涉及一种基于类解耦分布对齐的半监督医学图像分类方法。

技术介绍

[0002]医学影像的临床诊断需要综合多种因素。为了提高某些疾病患者的存活率，医务人员可以选择计算机辅助诊断来帮助他们判断病变程度。由于在收集医学图像数据集的过程中存在个人隐私和专业设备问题，普通研究机构很难收集大规模的医学图像数据。一些疾病的罕见性也导致相应的数据收集较少，导致数据集分布不均。尽管近年来深度学习的发展在医学图像分类任务中取得了良好的成绩，但数据的缺乏、数据分布的不平衡以及获取病变区域的困难等问题仍然容易导致模型训练信息不足和过度拟合。
[0003]为了缓解上述问题产生的不利影响，半监督学习被广泛应用于基于深度神经网络的医学图像分类中。例如，[1]使用MaskR
‑
CNN获得准确的病变分割结果，然后使用自定步调学习策略来加强训练数据。受同伴学习的启发，[2]构造了一种方法，鼓励未标记的数据向他人学习，从而在皮肤疾病分类上生成相应的伪标签。[3]提出了一种在一致性正则化策略下基于类激活图掩码的数据增强方法，以提高识别间质性肺疾病的性能。[4]根据Mean
‑
Teacher[5]框架，根据类别概率设计置信度模块，以提高性能。然而，所有这些方法都没有考虑到在产生伪标记的过程中类失衡的影响。类别不平衡会误导模型使用同一标签标注不同类别的医学图像，并在传播错误标签时造成错误积累问题，导致性能下降。
[000...

【技术保护点】

【技术特征摘要】
1.一种基于类解耦分布对齐的半监督医学图像分类方法，其特征在于，提出一种新的类解耦分布对齐方法，该方法根据矩阵基的变化，利用监督信息和非监督信息之间的内在关系，预测未标记样本的伪标签；同时，提出了一种新的可变条件队列来存储具有较高置信度的样本，可变条件队列的队列长度随标签置信度的变化而变化。2.根据权利要求1所述的基于类解耦分布对齐的半监督医学图像分类方法，其特征在于，所述类解耦分布对齐方法实现如下：构造i个独立分布，每个分布都与原始分布对齐结构一致，以便指示向量空间中有标签样本和无标签样本的分布，即类解耦分布对齐；首先，通过EMA保留每个类别的有标签集分布和置信度c
i
(X)(i＝1,2,
…
,n)，n等于整个数据集中的类别数；在更新无标签集分布和置信度c
i
(U)时，利用有标签样本对模型训练的内在影响，避免少数类陷入过度拟合：其中，X和U分别表示有标签集和无标签集，在生成c
i
(U)和时，c
i
(X)和c
i
(U)之间的G
i
被视为两个分布在降维后的定量差异，这促进了模型缩短两个分布之间的距离，并通过转换基使模型对局部扰动具有鲁棒性，其表示为：其中ω是一个超参数，表示决定更新速度的动量，无标签集分布同样使用这种方法计算；类解耦分布对齐将通过以下公式表示：其中，q是无标签样本的预测，是DA之后的改进伪标签，Normalize(x)
i
＝x
i
/Σ
j
x
j
；受数据稀缺性和数据不平衡性的影响，迭代后的神经网络输出倾向于大多数类，这导致有偏的产生；因此使用作为有标签集分布，T为温度，分别控制每个类根据温度参数缩放后的输出；EMA获得的置信度c
i
(X)与有标签样本的数量有关，因此通过一个基本线性函数专门设置T：如果一个类别中有标签样本的数量较少，其T将变得更高；当T
i
→
1时，第i类的将被转换以满足有标签集分布，从而缓解数据不平衡；通过置信度可以合理地控制温度的变化，以避免大多数样本的伪标签被错误地预测为多数类；当T
i
→
0时，变化非常微小...

【专利技术属性】
技术研发人员：李佐勇，汪涛，黄中政，林滨，曹新容，
申请(专利权)人：闽江学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人