模型训练方法技术

技术编号：39491688 阅读：12 留言：0更新日期：2023-11-24 11:14

本申请实施例提供了一种模型训练方法

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、分类方法及相关装置

[0001]本申请属于图像识别
，具体涉及一种模型训练方法
、
分类方法及相关装置
。

技术介绍

[0002]目前，已有很多基于深度学习方法的提取脑部核磁共振图像的特征来构建阿兹海默诊断模型
。
还有一部分工作使用核磁共振图像和临床表格数据，分别使用卷积神经网络和多层感知机来提取图像特征和表格特征
。
[0003]但是，现有的模型在轻度认知障碍的任务上达不到很好的效果
。
一方面是因为有限的数据，另一方面是两种轻度认知障碍在核磁共振图像上和临床属性数据上没有明显的差距，导致分类难度加大
。
基于此，有些工作将在阿兹海默疾病的诊断模型训练得到的权重迁移到轻度认知障碍模型上进行初始化操作，并在轻度认知障碍患者的训练数据上进行微调
。
相比于随机初始化，这种迁移方法能够将从阿兹海默疾病分类任务上学习得到的知识用在轻度认知障碍的分类问题上，得到更好的分类性能
。
然而这种全微调的方法存在迁移效率低的特点，需要微调整个模型的参数，容易导致忘记学习过的知识，降低模型的可迁移性
。

技术实现思路

[0004]本申请提供了一种模型训练方法
、
分类方法及相关装置，以期提高模型迁移的效率
。
[0005]第一方面，本申请提供了一种模型训练方法，包括：
[0006]获取第一训练数据集，所述第一训练数据包括第一图像信息...

【技术保护点】

【技术特征摘要】
1.
一种模型训练方法，其特征在于，包括：获取第一训练数据集，所述第一训练数据包括第一图像信息子集和第一属性数据子集，所述第一图像信息子集包括待训练的第一核磁共振图像，所述第一属性数据子集包括所述第一核磁共振图像所对应的第一临床数据；将所述第一训练数据集输入第一模型进行训练，得到阿兹海默分类模型，所述第一模型是指待训练阿兹海默分类模型；根据所述阿兹海默分类模型的第一模型参数对第二模型进行初始化，所述第二模型是指待训练进行性轻度认知障碍分类模型；冻结初始化后的第二模型中的第一模型参数；确定全局提示学习向量；将第二训练集输入所述第二模型对所述全局提示学习向量进行提示微调，得到进行性轻度认知障碍分类模型，所述提示微调是指训练过程中只调整第二模型中的所述全局提示学习向量对应的参数
。2.
根据权利要求1所述的方法，其特征在于，将第二训练集输入所述第二模型对所述全局提示学习向量进行提示微调，得到进行性轻度认知障碍分类模型，包括：获取第二训练数据集，所述第二训练数据集包括第二图像信息子集和第二属性数据子集，所述第二图像信息子集包括待训练的第二核磁共振图像，所述第二属性数据子集包括所述第二核磁共振图像所对应的第二临床数据；将所述第二训练数据集输入所述第二模型；根据所述第二训练数据集对所述第二模型中的所述全局提示学习向量进行提示微调，得到分类结果；确定所述第二模型的分类结果是否准确；若所述分类结果不准确，则计算分类损失函数，并通过随机梯度下降算法调整得到新的全局提示学习向量；将所述第三训练数据集输入所述第二模型对所述新的全局提示学习向量进行提示微调，得到新的分类结果，所述第三训练数据集包括第三图像信息子集和第三属性数据子集，所述第三图像信息子集包括待训练的第三核磁共振图像，所述第三属性数据子集包括所述第三核磁共振图像所对应的第三临床数据；若所述新的分类结果不准确，则重复上述训练操作直至得到准确的分类结果；冻结所述第二模型上所述准确的分类结果所对应的模型参数，得到所述进行性轻度认知障碍分类模型
。3.
根据权利要求2所述的方法，其特征在于，根据所述第二训练数据集对所述第二模型中的所述全局提示学习向量进行提示微调，得到分类结果，包括：将所述第二属性数据子集输入所述第二模型中的临床数据处理模块；所述临床数据处理模块从所述第二属性数据子集中提取第一全局特征序列；将所述全局提示学习向量和所述第二图像信息子集输入所述图像信息处理模块；所述图像信息处理模块从所述全局提示学习向量和第二图像信息子集中提取第二全局特征序列；将所述第一全局特征序列和所述第二全局特征序列输入模态融合模块；
所述模态融合模块将所述第一特征序列和所述第二特征序列进行模态融合，得到多模态特征序列；将所述多模态特征序列输入所述分类模块；所述分类模块根据所述多模态特征预测所述分类结果
。4.
根据权利要求3所述的方法，其特征在于，所述图像信息处理模块包括空间维度注意力单元和通道维度注意力单元；所述图像信息处理模块从所述第二图像信息子集中提取第二全局特征序列，包括：由所述第二嵌入层获取所述目标图像信息，并从所述目标图像信息中提取第二特征序列；由所述空间维度注意力单元对所述第二特征序列和所述全局提示学习向量进行权重平均处理，得到第三特征序列；由所述通道维度注意力单元对所述第二特征序列进行权重平均处理，得到第四特征序列；将所述第三特征序列和所述第四特征序列进行相加处理，得到第五特征序列；将所述第五特征序列与所述全局提示学习向量进行点积处理，得到第六特征序列；将所述第六特征序列与...

【专利技术属性】
技术研发人员：李灏峰，康洛耀，龚海帆，万翔，
申请(专利权)人：深圳市大数据研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人