基于小样本增量学习的分类模型构建方法及图像分类方法技术

技术编号：40777479 阅读：3 留言：0更新日期：2024-03-25 20:23

本发明专利技术提供了一种基于小样本增量学习的分类模型构建方法及图像分类方法，通过采用训练初始分类模型的初始训练样本以及新增疾病类型对应的新增特征集合，对增量分类模型进行训练并优化预设的偏置矩阵，在增量分类模型的增量损失函数收敛时，根据偏置矩阵将每一新增疾病类别与一基向量一一绑定，来得到增量分类模型。因此，本发明专利技术通过采用等角基向量矩阵代替现有技术的有线性分类器构建医疗图像分类模型，以此来克服在小样本增量学习过程中模型识别准确度下降的问题，以及医疗图像数据获取困难，只有少量数据样本难以训练的问题，不仅避免了分类器参数增加所带来的额外计算量，而且固定基向量还能有效避免灾难性遗忘问题，更好的提高分类精确度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及医疗图像分类，尤其涉及一种基于小样本增量学习的分类模型构建方法及图像分类方法。

技术介绍

1、近年来，深度学习在医学图像分析领域取得较好的成绩，而当前的研究人员希望模型能够像人类一样，能够进行持续的学习，即能够持续新增识别的类型，并且不会遗忘之前学习到的识别类型。但是目前的深度学习方法都需要大量的标记数据，训练模型才能取得好的效果，在缺少数据时模型效果就会变差。然而，在医疗影像分析中，由于一些疾病过于罕见，只能收集到极少的罕见病的医疗图像。即并不具备获得大量可训练数据的条件。这样容易使得模型产生过拟合和灾难性遗忘的问题。小样本增量学习的研究由此产生。目前，模型小样本增量学习的主流方法是使用多样本的均值作为原型以增加鲁棒性，减小过拟合，即：在初始模型训练完毕后，将已经训练好的模型中的特征提取器进行冻结，使用softmax作为分类器，并在之后的小样本增量学习阶段中更新模型的分类器，达到分类的效果。但在这过程中随着类别的增加，分类器的参数不断增加，会引发大量的消耗。因此，亟需一种小样本增量学习方法，来克服医学图像分类模型在小样本增量学习中分类器参数不断增加，进而导致模型识别准确度下降的问题。

技术实现思路

1、本专利技术实施例提供一种基于小样本增量学习的分类模型构建方法及图像分类方法，能有效解决现有技术在对医疗图像分类模型进行小样本增量学习时，分类器参数不断增加，进而导致模型识别准确度下降的问题。有效地提高了进行增量学习后的医疗图像分类模型的分类精确度。

2、本

3、获取初始分类模型中第一特征提取网络的网络参数；

4、其中，所述初始分类模型为用于根据医疗图像识别疾病类别的神经网络模型，且神经网络模型内的分类器采用等角基向量矩阵进行构建；所述等角基向量矩阵由若干基向量构成，且所述初始分类模型识别的每一个初始疾病类别分别与所述等角基向量矩阵中的一个基向量一一绑定；

5、构建待训练的增量分类模型，并根据所述网络参数，初始化所述增量分类模型的第二特征提取网络；

6、其中，所述增量分类模型为，与所述初始分类模型结构一致的神经网络模型，且在初始分类模型的基础上，增加识别若干新增疾病类别；

7、获取每一新增疾病类别的若干训练数据，构建增量训练样本；

8、采用第二特征提取网络提取所述增量训练样本中的每一新增疾病类别的训练数据的特征向量，生成每一新增疾病类别的新增特征集合；

9、采用训练所述初始分类模型的初始训练样本以及所述新增特征集合，对所述增量分类模型进行训练并优化预设的偏置矩阵，以使每一新增疾病类别分别与所述等角基向量矩阵中一未绑定的基向量之间的距离缩小；

10、在所述增量分类模型的增量损失函数收敛时，生成最佳偏置矩阵，并根据所述最佳偏置矩阵将每一新增疾病类别分别与一基向量一一绑定，得到训练完成的增量分类模型。

11、进一步的，在所述获取初始分类模型的第一特征提取网络的网络参数之前，还包括：

12、构建所述等角基向量矩阵；

13、构建一采用线性分类器作为全连接层的神经网络模型；

14、采用预构建的初始训练样本对所述神经网络模型进行训练，得到原分类模型；其中，所述初始训练样本由若干初始疾病类别的若干训练数据所构成；

15、将所述原分类模型中的线性分类器替换为所述等角基向量矩阵；

16、采用原分类模型中的第一特征提取网络提取所述初始训练样本中的每一初始疾病类别的训练数据的特征向量，生成每一初始疾病类别的初始特征集合；

17、根据每一所述初始特征集合中的特征向量与所述等角基向量矩阵中的基向量的余弦相似度构建第一分类损失函数；

18、根据所述第一分类损失函数调整所述第一特征提取网络的网络参数，以使每一所述初始特征集合与一基向量进行一一绑定；

19、在所述第一分类损失函数收敛时，得到初始分类模型。

20、进一步的，所述构建所述等角基向量矩阵，包括：

21、根据预设的识别疾病类别数量，以及待构建的初始分类模型的第一特征提取网络所提取的特征通道维度，初始化一等角基向量矩阵，以及所述等角基向量矩阵所包含的基向量；

22、根据所述识别疾病类别数量，生成余弦相似度阈值，并根据所述余弦相似度阈值构建以下等角损失函数：

23、

24、

25、

26、其中，为第i个基向量的单位向量，为第j个基向量的单位向量，α为所述余弦相似度阈值；

27、通过等角损失函数，调整各基向量的角度，以使任意相邻的两个基向量之间的夹角均相等；

28、在所述等角损失函数收敛时，得到构建完成的等角基向量矩阵。

29、并在后续训练过程中，固定等角基向量矩阵的参数不再改变，使用等角基向量矩阵代替传统线性分类器的意义在于：固定的基向量可有效缓解采用参数化权重向量时，因模型训练而引起的类别原型移动问题，进而可有效保障分类器的分类识别性能。

30、进一步的，所述采用训练所述初始分类模型的初始训练样本以及所述新增特征集合，对所述增量分类模型进行训练并优化预设的偏置矩阵，包括：

31、计算每一初始疾病类别的初始特征集合中各特征向量与所绑定的基向量之间的余弦相似度；

32、根据各初始特征集合中余弦相似度最大的代表特征向量，从所述初始训练样本中获取所述代表特征向量所对应的训练样本作为所属的初始疾病类别的代表训练样本；

33、根据每一初始疾病类别的代表训练样本，构建记忆保留集合；

34、在后续训练中重复利用构建的记忆保留集合，可显著减轻模型对历史信息的灾难性遗忘。

35、采用所述记忆保留集合以及所述新增特征集合，对所述增量分类模型进行训练并通过以下公式优化预设的偏置矩阵：

36、

37、其中，vi为所述增量分类模型的根据输入训练样本提取的特征向量，v'i为通过偏置矩阵调整后的特征向量，γ为所述偏置矩阵。

38、在增量阶段特征提取器固定以及分类器固定的情况下，使用偏置矩阵改变样本特征位置，使样本特征向基向量靠近，一定程度缓解由样本数量受限所引起的过拟合问题。

39、进一步的，所述增量损失函数，由第二分类损失函数以及概率分布损失函数构成：

40、loss＝αlosscls+losskl；

41、其中，loss为所述增量损失函数，losscls为所述第二分类损失函数，losskl为所述概率分布损失函数，α为所述分类损失函数的权重；

42、所述第二分类损失函数为：

43、

44、其中，vi为所述增量分类模型的根据输入训练样本提取的特征向量，wi为输入的训练样本所对应的疾病类别所绑定的基向量；

45、通过最小化lossc本文档来自技高网...

【技术保护点】

1.一种基于小样本增量学习的分类模型构建方法，其特征在于，包括：

2.如权利要求1所述的一种基于小样本增量学习的分类模型构建方法，其特征在于，在所述获取初始分类模型的第一特征提取网络的网络参数之前，还包括：

3.如权利要求2所述的一种基于小样本增量学习的分类模型构建方法，其特征在于，所述构建所述等角基向量矩阵，包括：

4.如权利要求3所述的一种基于小样本增量学习的分类模型构建方法，其特征在于，所述采用训练所述初始分类模型的初始训练样本以及所述新增特征集合，对所述增量分类模型进行训练并优化预设的偏置矩阵，包括：

5.如权利要求4所述的一种基于小样本增量学习的分类模型构建方法，其特征在于，所述增量损失函数，由第二分类损失函数以及概率分布损失函数构成：

6.如权利要求5所述的一种基于小样本增量学习的分类模型构建方法，其特征在于，所述获取每一新增疾病类别的若干训练数据，构建增量训练样本，包括：

7.如权利要求6所述的一种基于小样本增量学习的分类模型构建方法，其特征在于，在得到训练完成的增量分类模型之后，还包括：>

8.如权利要求7所述的一种基于小样本增量学习的分类模型构建方法，其特征在于，在得到训练完成的增量分类模型之后，还包括：

9.一种图像分类方法，其特征在于，包括：

10.一种图像分类方法装置，其特征在于，包括：

...

【技术特征摘要】

1.一种基于小样本增量学习的分类模型构建方法，其特征在于，包括：

3.如权利要求2所述的一种基于小样本增量学习的分类模型构建方法，其特征在于，所述构建所述等角基向量矩阵，包括：

5.如权利要求4所述的一种基于小样本增量学习的分类模型...

【专利技术属性】
技术研发人员：骆威，陈棋峰，何文炼，杜若兰，邓金，
申请(专利权)人：华南农业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人