【技术实现步骤摘要】
一种分类模型的训练方法和眼底图像分类方法
[0001]本专利技术涉及增量学习领域,具体来说,涉及应用增量学习的医学成像领域,更具体地说,涉及一种分类模型的训练方法和一种眼底图像分类方法。
技术介绍
[0002]深度神经网络(DNNs)在许多机器学习分类任务中表现出色,例如,深度神经网络在医学成像应用中显示出的性能达到了人类水平,以及,最近的研究表明,基于深度学习的模型能够成功应用于视网膜疾病(如糖尿病视网膜病变DR和青光眼)筛查。其中,视网膜疾病筛查中应用的模型是假设在训练前所有类别都是已知的条件下才可实现的。然而,这一假设在医学领域经常被违背。在实际训练过程中,预先准备所有类别的数据是极难实现的,例如,由于一些疾病在不同的发病阶段,疾病的病变程度也会发生细微的变化,因此,疾病的病变程度发生变化的数据进行预先准备是很难实现的。此外,如果一个模型只学会了识别输入样本(例如疾病对应的样本)所属的泛化类别,而不能对所属的具化类别(例如,发病阶段和发病程度不同时的类别)进行准确识别,这会产生极其严重的后果。因为训练后模型的针对输入样本的输出结果会影响后续的应用效果。例如,同一疾病在不同的发病阶段所使用的治疗策略是不同的,而启动正确的治疗方案是取得良好治疗结果的关键。为此,构造机器学习分类任务中的类别增量学习方法,可以识别所属的具化类别(例如,疾病的病变程度与发病阶段对应的类别),从而在后续的应用中,可以在为患者提供持续有效、及时准确的健康检测以及疾病预警方面提供极大帮助。增量学习方法中需要解决的主要挑战是灾难性遗忘。直观地说 ...
【技术保护点】
【技术特征摘要】
1.一种分类模型的训练方法,所述分类模型用于眼底图像分类,所述方法包括:获取预训练的分类模型作为教师模型,其包括用于对输入眼底图像提取图像特征的特征提取网络以及用于根据图像特征识别该图像特征对应眼底图像所属的眼底类别的分类器,所述分类器包括全连接层和Softmax层,所述教师模型能识别的眼底类别归为旧类;获取学生模型,其特征提取网络的可训练参数用教师模型中特征提取网络的可训练参数初始化,并且其分类器设置为能对旧类和新类对应的眼底类别进行识别,所述新类是所述旧类之外的眼底类别;针对所述预训练中用到的每个旧类,获取该旧类对应的伪样本,所述伪样本是利用教师模型的特征提取网络对属于该旧类的多个眼底图像提取的图像特征生成的;利用生成的旧类的伪样本和属于新类的眼底图像对所述学生模型进行增量训练,训练时基于预设的总损失函数确定的总损失更新学生模型的参数,得到经增量训练的学生模型,所述总损失根据以下损失加权求和确定:旧类分类损失、新类分类损失、第一特征蒸馏损失和第二特征蒸馏损失;其中,所述第一特征蒸馏损失根据旧类的伪样本在以下两者上的输出之间的差异进行确定:所述教师模型的全连接层的输出、所述学生模型的全连接层在旧类上的输出;所述第二特征蒸馏损失根据教师模型中特征提取网络的提取到的所有教师特征和经增量训练的学生模型中特征提取网络的提取到的所有学生特征之间的总的差异进行确定,其中,每个教师特征为一个伪样本经教师模型中特征提取网络提取得到的图像特征,每个学生特征为伪样本和属于新类的眼底图像分别经学生模型中特征提取网络提取得到的图像特征。2.根据权利要求1所述的方法,其特征在于,通过如下步骤计算所述总的差异:基于注意力机制,确定每个教师特征对各个学生特征的注意力值,以及利用该教师特征对各个学生特征的注意力值构成该教师特征对所有学生特征的注意力向量并进行归一化得到归一化后的注意力向量;基于每个教师特征和每个学生特征的确定空间距离;计算空间距离和归一化后的注意力向量中对应元素的乘积,并将得到的所有乘积进行求和得到总的差异。3.根据权利要求2所述的方法,其特征在于,基于注意力机制,每个教师特征对各个学生特征的注意力值通过如下步骤计算:将学生特征进行数据转换,得到该学生特征在注意力机制中的一个key;将教师特征进行数据转换,得到该教师特征在注意力机制中的一个query;计算每个query对各个key的注意力值。4.根据权利要求3所述的方法,其特征在于,通过如下规则进行数据转换:4.根据权利要求3所述的方法,其特征在于,通过如下规则进行数据转换:其中,q
t
表示在注意力机制中的query,表示第t个教师特征,P
HW
(
·
)表示全局平
均池化,表示的线性变换参数,表示的线性变换参数空间矩阵,f
Q
(
·
)表示第一激活函数,k
s
表示在注意力机制中的key,表示第s个学生特征,表示的线性变换参数,表示的线性变换参数空间矩阵,表示的线性变换参数的空间矩阵,f
K
(
·
)表示第二激活函数,d表示线性变换参数空间矩阵的维度。5.根据权利要求4所述的方法,其特征在于,通过以下规则计算每个query对所有key的注意力向量并进行归一化:其中,softmax(.)表示归一化函数,表示q
t
的转置,表示双线性权值,k
t,1
表示对对应的key值,表示第t个教师特征的位置编码,表示第s个学生特征的位置编码,k
t,S
表示对对应的key值,表示和的乘积,表示的转置。6.根据权利要求5所述的方法,其特征在于,通过以下方法计算第二特征蒸馏损失:其中,α
t,s
表示第t个教师特征对第s个学生特征的归一化后的注意力值,表示空间距离,||.||2表示求L2范数,表示通道平均池化层与L2归一化的组合函数v/||v||2,v表示对进行平均池化得到的向量,表示对使用上采样或下采样得到的特征。7.根据权利要求1所述的方法,其特征在于,按照如下步骤获得旧类的伪样本:T1、基于预训练中用到的旧类对应的多个图像特征计算该旧类对应的类均值向...
【专利技术属性】
技术研发人员:谷洋,郭帅,文世杰,马媛,杨昭华,翁伟宁,陈益强,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。