一种适用于医学影像目标分类的样本选择偏差缓解方法技术

技术编号：38905589 阅读：16 留言：0更新日期：2023-09-22 14:24

本发明专利技术公开了一种适用于医学影像目标分类的样本选择偏差缓解方法，在小样本图像分类基础上，研究通过特征变换解决小样本任务中新类数据偏移问题，构建新集样本特征变换网络模型。新类和基类共享特征提取方式，利用新类样本特征向特定的方向偏斜、接近于特定基类样本特征方向的特点，以特定基类特征的平均作为任务质心，新类移除它们在任务质心方向的投影，从而增加新类样本特征的数据差异，提高新类特征的辨识度。本发明专利技术对小样本学习样本选择偏差问题的理论研究、小样本学习在医学影像目标分类的广泛应用具有重要的意义。同时，对我国突破小样本学习实现跨域理论瓶颈起到重要推动作用。作用。作用。

全部详细技术资料下载

【技术实现步骤摘要】
一种适用于医学影像目标分类的样本选择偏差缓解方法

[0001]本专利技术涉及计算机图像分类领域，具体为一种适用于医学影像目标分类的样本选择偏差缓解方法。

技术介绍

[0002]医学影像分类是计算机辅助诊断中的一个重要课题，其目的是利用计算机进行计算，以帮助提高诊断的正确性。医学影像的分类因其专业领域的特殊性，面临着如下两大难题。首先，收集真正有价值的医学影像数据集是一项非常昂贵的工作,如何在样本量稀少的情况下能够快速地泛化到没有见过的分类任务当中，这是困扰医学影像目标分类任务的瓶颈问题。其次，医学影像中含有大量的病理信息和模态信息，要了解这些专业的信息必须要有领域知识，单凭视觉的相似度判别无法准确地进行分类，从而产生了类内差异性和类间相似性问题。
[0003]小样本学习是在训练集样本很少的条件下，完成相应的学习任务，期望在学习大量的基类后，只需少量样本就可以迅速学习掌握新类。通常小样本学习可以使用少量样本进行学习。
[0004]在计算机视觉和人工智能领域，小样本图像分类是一个迫切需要解决的问题。目前已有的大量样本数据的分类方法是依靠样本数量，而实际的样本量不够，例如军事、医疗、工业、天文行业，这些数据的收集往往会耗费大量的人力、物力代价，难以进行大量的数据采集。因此，对小样本图像分类进行研究是一项非常有意义的工作。
[0005]在目前的技术中，基于深度度量的分类方法主要是通过对样本和类原型之间的距离进行比较来判别类别。通常将数据增强和迁移学习相结合，以弥补数据量不够和模型过拟合，这些方法对许多...

【技术保护点】

【技术特征摘要】
1.一种适用于医学影像目标分类的样本选择偏差缓解方法，其特征在于，包括以下步骤：S1，准备数据集，预训练图像得到特征提取器，用于提取图像特征，此处采用ResNet
‑
18作为特征提取器，借助迁移学习的思想，利用基集训练特征提取器，用Baseline++等方法进行分类，再将新集送进特征提取器，得到新集的样本特征；S2，对新集样本特征进行变换，构建新集样本特征变换网络模型；S3，利用新集样本特征变换网络模型对查询集图像进行分类。2.根据权利要求1所述的一种适用于医学影像目标分类的样本选择偏差缓解方法，其特征在于，步骤S1包括：S11，基集为D
b
，将基集样本分为和这两个数据集类别互斥，将D
train
作为基集的训练模型，D
test
作为新集对模型测试；S12，对于N
‑
way K
‑
shot分类任务，分别对特定的医学影像数据集D
train
随机选出N个类别，每个类别里随机挑出A个样本，其中K个样本作为支持样本S
i
，其余的A
‑
K个样本用作查询集Q
i
，S
i
和Q
i
组成一个任务T
i
，并且对于D
test
有任务目的是划分出训练和测试所需支持集和查询集；S13，利用基集预训练特征提取器f
θ
，f
θ
采用ResNet
‑
18结构，将所有的支持样本输入参数固定的特征提取器f
θ
中，得到对应的支持样本特征f
θ
(S
ck
)。3.根据权利要求1所述的一种适用于医学影像目标分类的样本选择偏差缓解方法，其特征在于，步骤S2构建新集样本特征变换网络模型，这个网络模型包括，基集样本选择模块，任务质心计算模块，投影特征移除模块。4.根据权利要求1所述的一种适用于医学影像目标分类的样本选择偏差缓解方法，其特征在于，步骤S3构建的新集样本特征变换网络模型包括：S31，取所有支持集样本特征的平均S32，依据与的余弦相似度在基类样本中寻找k个最合适的样本,D
cosine
即余弦相似度，D
topK
即包含基类中余弦相似度最接近的前k个样本。S33，基于余弦相似度，加权聚合来近似任务质心；...

【专利技术属性】
技术研发人员：张云飞，蔡占毅，钱靖，陆峦华，于新桃，
申请(专利权)人：江苏济远医疗科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人