一种基于大模型的医疗图像全自动语义分割方法技术

技术编号：41225827 阅读：15 留言：0更新日期：2024-05-09 23:43

本发明专利技术公开一种基于大模型的医疗图像全自动语义分割方法，基于MedSAM的结构以及预训练权重，使用LoRA模块对模型的编码器权重进行高效更新，将预训练权重中包含的大量医疗图像领域知识迁移到具体的医疗图像分割任务中。对解码器模块进行针对性的全自动分割设计，仅包含图像特征序列与掩膜令牌的双向注意力运算，并通过对输出模块进行相应预测头数量的设置，保证预测结果包含明确的类别语义信息。已有大模型需要人工输入提示，因此只能实现半自动语义分割。本发明专利技术设计了能实现全自动语义分割的大模型，不需要人工输入提示信息。可以有效提升医疗图像语义分割的准确率，不受疾病和病灶种类的限制，具有很好的普适性和通用性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于大模型的医疗图像全自动语义分割方法，属于医疗图像分割。

技术介绍

1、语义分割在医疗图像分析领域具有至关重要的作用。通过精准地识别和分割图像中的不同组织、器官或病变区域，语义分割技术为医生提供了更为详细和准确的内部结构和病变信息。这不仅提高了医生诊断的准确性和效率，还使得医生能够在早期发现潜在的健康问题，从而制定更为有效的治疗方案。同时，随着深度学习技术的发展，语义分割算法不断优化，其在医疗图像分析领域的应用也日趋广泛，为医学研究和临床实践带来了便利和进步。

2、目前在医疗图像语义分割领域的主流方法是基于编码器-解码器的unet系列模型，它们通常基于随机初始化的网络权重，在目标任务上进行训练。这类方法模型规模通常较小，并且没有利用到其它任务上的通用医疗领域知识。

3、近期出现了一系列视觉大模型，它们通过在海量的图像数据上进行训练，使得模型具有较通用的视觉理解能力。medsam(“分割医疗图像中的一切”大模型)是医疗图像大视觉模型的典型方法，其通过在多种图像模态的海量医疗图像上进行训练，对多种...

【技术保护点】

1.一种基于大模型的医疗图像全自动语义分割方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于大模型的医疗图像全自动语义分割方法，其特征在于，所述全自动语义分割网络以MedSAM大模型的结构和预训练权重为训练起点，网络编码器部分与MedSAM具有相同的结构。

3.根据权利要求1所述的基于大模型的医疗图像全自动语义分割方法，其特征在于，医疗图像全自动语义分割网络模型的编码器中预训练权重参数在训练时被冻结，使用LoRA模块作为模型编码器的Transformer模块中查询和值的变换矩阵的旁路分支，设置LoRA模块的参数为可更新的。

<...

【技术特征摘要】

1.一种基于大模型的医疗图像全自动语义分割方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于大模型的医疗图像全自动语义分割方法，其特征在于，所述全自动语义分割网络以medsam大模型的结构和预训练权重为训练起点，网络编码器部分与medsam具有相同的结构。

3.根据权利要求1所述的基于大模型的医疗图像全自动语义分割方法，其特征在于，医疗图像全自动语义分割网络模型的编码器中预训练权重参数在训练时被冻结，使用lora模块作为模型编码器的transformer模块中查询和值的变换矩阵的旁路分支，设置lora模块的参数为可更新的。

4.根据权利要求1所述的基于大模型的医疗图像全自动语义分割方法，其特征在于，模型的解码器部分是全自动分割的设计，其仅包含对图像特征序列和masktoken的双向注意力模块，以及包含k个输出类别的分割结果输出模块。

5.根据权利要求1所述的基于大模型的医疗图像全自动语义分割方法，其特征在于，对输入数据进行预处理及数据增广，所述预处理包括将输入图像归一化到区间[0,1]以及将输入图像和标签进行随机裁剪、随机亮度及对比度变换。

<...

【专利技术属性】
技术研发人员：李武军，陈善梁，
申请(专利权)人：南京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人