System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于半监督学习的全切片病理图像分类方法技术_技高网

一种基于半监督学习的全切片病理图像分类方法技术

技术编号:40402561 阅读:7 留言:0更新日期:2024-02-20 22:27
本发明专利技术涉及图像处理与医学技术领域,具体涉及一种基于半监督学习的全切片病理图像分类方法,首先,将病理切片扫描成WSI,对WSI内的癌症区域进行标注并对图像块进行预处理,构建病理分类数据集;将切割后的图像块划分为训练集和测试集,其中训练集分为有标记样本和未标记样本;其次,对未标记图像进行弱增强和强增强操作,依据多分辨率一致性计算强增强图像的预测概率与伪标签之间的交叉熵,作为无监督损失函数;最后,将训练好的分类模型对测试集进行预测,生成概率热力图并拼成整张病理切片的结果,用于切片分类效果可视化。本发明专利技术的全切片病理图像分类方法有利于减少模型对大量标签的依赖性,同时提供较好的分类结果。

【技术实现步骤摘要】

本专利技术属于图像处理与医学,特别涉及一种基于半监督学习的全切片病理图像分类方法


技术介绍

1、组织病理图像包含丰富的癌症组织形态特征和表型信息,是癌症临床诊断的金标准,为患者的术前诊断、术后预后、靶向治疗提供了重要参考依据。病理学家通过人眼观察病理切片来评估癌症类型及其分期,这种人工分析需要丰富的临床经验,且评估具有一定的主观性。计算机辅助病理分析技术有望减少病理医师的工作量,提高诊断的效率和可靠性。全切片(whole slide image, wsi),它以金字塔形式存储了不同放大倍率的图像,为病理图像自动分析任务奠定了基础。近年来,深度学习因具有强大的特征提取能力,在病理图像分析任务中取得了诸多成果,如癌症分类、病灶分割、肿瘤检测、癌症转移预测等等。大多数深度学习模型都需要大量的标签信息,然而病理图像具有很高的类内变异性和类间相似性。wsi的标注费时费力,即使有专业知识的病理医生标注一张全切片图像也需要几个小时以上,因此大量的标签需求和标注复杂度限制了基于深度学习的方法在病理图像分析中的应用。

2、例如现有技术使用一种局部增强技术来提高病理图像的多样性,同时提出了两个双向一致性损失,分别对弱增强和强增强两条支路的中间特征和预测结果进行一致性约束,以提高分类网络的特征表示的稳健性以及预测的准确性。再例如现有技术一个半监督像素对比学习框架,实现了组织病理图像分割,该框架通过引入一种相互双重一致性方法,旨在从未标记数据中提取有效的语义信息,同时提出了一种基于不确定性策略过滤伪标签中的错误信息,有助于提高模型学习的稳健性。以上工作主要聚焦于特定分辨率下的病理图像分析,这与临床实践并不完全相符。在临床实践中,病理专家通常需要在不同的显微镜倍率下观察组织样本,结合癌症病变的局部特征和全局特性判断癌症亚型。

3、由于病理图像呈现出高度的异质性,可能包含多种类型的细胞、组织以及病变。同时,受取样、染色与成像过程影响,病理图像存在各种噪声与干扰使得分析难度加大。


技术实现思路

1、为了解决上述问题,本专利技术提出了一种基于半监督学习的全切片病理图像分类方法,为达此目的,本专利技术采用以下技术方案:

2、一种基于半监督学习的全切片病理图像分类方法,所述图像分类方法包括如下步骤:

3、s1:通过数字扫描仪将病理切片扫描成wsi,在asap软件内对wsi内的癌症区域进行标注;

4、s2:在10x倍率下对wsi进行切图,将wsi切成若干256x256像素大小的图像块,对图像块进行预处理,构建病理图像分类数据集;

5、s3:将切割后的图像块划分成独立的训练集和测试集,其中训练集划分为有标记样本和未标记样本;

6、s4:利用resnet-50模型作为骨干网络,建立病理图像分类模型;

7、s5:将有标记集中的图像经过弱增强操作输入到分类模型中,所述分类模型输出其预测概率,计算有标记图像的预测概率与其标签之间的交叉熵,作为有监督的损失函数;

8、s6:将未标记集中的图像进行弱增强操作后输入到分类模型中,所述分类模型输出其预测概率,若其最大的预测概率值超过置信度阈值,则模型对该图像赋予伪标签;

9、s7:将未标记集中的图像进行强增强操作后缩放到个不同的分辨率形成张不同分辨率的图像,将所述张不同分辨率的图像输入到分类模型中,所述分类模型输出其预测概率,计算其预测概率与步骤6中所述伪标签之间的交叉熵,作为无监督的损失函数;

10、s8:计算强增强的不同分辨率图像的预测概率之间的正则化,作为一致性损失函数;

11、s9:将有监督损失、无监督损失以及正则化进行加权求和,作为模型的总损失函数,用于训练网络模型;

12、s10:利用训练好的分类模型对测试集进行测试,生成每个小图的概率热力图并拼成整张切片的结果,用于切片分类效果可视化。

13、进一步的,所述s2中,对图像进行预处理的步骤包括:

14、s21:舍去白色背景区域超过50%的图像块;

15、s22:保留癌症区域超过75%以上的图像块并标记为癌症;

16、s23:保留癌症区域为0%的图像块并标记为非癌症。

17、进一步的,所述s3中,依据不同的wsi切片名将切割后的图像块划分成训练集和测试集,以保证训练集和测试集之间的独立性;

18、进一步的,将训练集划分为30%有标记数据集和70%未标记数据集,其中和为样本数量,为有标记样本,对应的标签为,为未标记样本。

19、进一步的,所述s4中,所述resnet-50模型包括49个卷积层以及1个全连接层,将最后一层全连接层的样本类别数目设置为病理分类数据集样本类别数目2。

20、进一步的,所述s5中,计算有标记图像的预测概率与其标签之间的交叉熵,作为有监督的损失函数,其表达式为:

21、;

22、其中,表示训练时一个批次内有标记样本的数量,为有标记样本,为标签,为弱增强操作,为模型对输入图像的预测概率输出,表示交叉熵损失函数。

23、进一步的,所述s6中,针对肺鳞癌类和非癌症类,所述置信度阈值的获取过程如下:

24、s61:设置原始置信度阈值;

25、s62:计算每个类别中预测概率超过原始置信度阈值的样本数量,其公式为:

26、;

27、其中表示未标记样本数量,表示模型对输入图像的预测概率输出,表示原始预先设定的置信度阈值,表示第类。

28、s63:根据所有类别的学习状态,将归一化到之间:

29、;

30、其中为第类中预测概率超过原始置信度的样本数量经过归一化后的结果。

31、s64:利用式归一化的结果来缩放原始置信度阈值,得到每个类别最终的置信度阈值,其公式如下:

32、;

33、进一步的,所述s7中,无监督损失函数计算步骤如下:

34、s71:将未标记图像进行强增强操作,并且强增强图像缩放到个不同分辨率图像,其中设为3,缩放比例为;

35、s72:将强增强的不同分辨率图像输入到分类模型中,分类模型输出其预测概率,对于弱增强和强增强两种不同的扰动,分类模型保持一致性的预测,依据多分辨率一致性计算不同分辨率图像的预测概率与弱增强支路的伪标签之间的交叉熵,作为无监督损失函数,其公式如下:

36、;

37、其中为一个批次中未标记样本的数量,为模型对强增强的不同分辨率图像的预测概率,的计算方式如上述公式(2)(3)(4)所述。

38、进一步的,所述s8中,计算强增强的不同分辨率图像的预测概率之间的正则化,其公式如下:

39、;

40、其中为一个批次中未标记样本的数量,和为模型对强增强的不同分辨率图像的预测概率。

41、进一步的,所述s9中,将有监督损失、无监督损失以及正则化进本文档来自技高网...

【技术保护点】

1.一种基于半监督学习的全切片病理图像分类方法,其特征在于,所述图像分类方法包括如下步骤:

2.根据权利要求1所述的基于半监督学习的全切片病理图像分类方法,其特征在于,所述S2中,对图像进行预处理的步骤包括:

3.根据权利要求2所述的基于半监督学习的全切片病理图像分类方法,其特征在于,所述S3中,依据不同的WSI切片名将切割后的图像块划分成训练集和测试集,以保证训练集和测试集之间的独立性;

4.根据权利要求3所述的基于半监督学习的全切片病理图像分类方法,其特征在于,所述S4中,所述ResNet-50模型包括49个卷积层以及1个全连接层,将最后一层全连接层的样本类别数目设置为病理分类数据集样本类别数目2。

5.根据权利要求4所述的基于半监督学习的全切片病理图像分类方法,其特征在于,所述S5中,计算有标记图像的预测概率与其标签之间的交叉熵,作为有监督的损失函数,其表达式为:

6.根据权利要求5中所述的基于半监督学习的全切片病理图像分类方法,其特征在于,所述S6中,针对肺鳞癌类和非癌症类所述置信度阈值的获取过程如下:

<p>7.根据权利要求6中所述的基于半监督学习的全切片病理图像分类方法,其特征在于,所述S7中,无监督损失函数计算步骤如下:

8.根据权利要求7中所述的基于半监督学习的全切片病理图像分类方法,其特征在于,所述S8中,计算强增强的不同分辨率图像的预测概率之间的正则化,其公式如下:

9.根据权利要求8中所述的基于半监督学习的全切片病理图像分类方法,其特征在于,所述S9中,将有监督损失、无监督损失以及正则化进行加权求和,作为模型的总损失函数,用于训练网络模型,总损失函数的公式如下:

10.根据权利要求9中所述的基于半监督学习的全切片病理图像分类方法,其特征在于,所述S10中,利用训练好的分类模型对测试集进行测试,生成每个小图的概率热力图,其中癌症类别颜色为红色,非癌症类别颜色为蓝色,颜色的深浅表示属于该类别的概率大小,将小图的概率热力图拼成整张切片的结果,用于切片分类效果可视化。

...

【技术特征摘要】

1.一种基于半监督学习的全切片病理图像分类方法,其特征在于,所述图像分类方法包括如下步骤:

2.根据权利要求1所述的基于半监督学习的全切片病理图像分类方法,其特征在于,所述s2中,对图像进行预处理的步骤包括:

3.根据权利要求2所述的基于半监督学习的全切片病理图像分类方法,其特征在于,所述s3中,依据不同的wsi切片名将切割后的图像块划分成训练集和测试集,以保证训练集和测试集之间的独立性;

4.根据权利要求3所述的基于半监督学习的全切片病理图像分类方法,其特征在于,所述s4中,所述resnet-50模型包括49个卷积层以及1个全连接层,将最后一层全连接层的样本类别数目设置为病理分类数据集样本类别数目2。

5.根据权利要求4所述的基于半监督学习的全切片病理图像分类方法,其特征在于,所述s5中,计算有标记图像的预测概率与其标签之间的交叉熵,作为有监督的损失函数,其表达式为:

6.根据权利要求5中所述的基于半监督学习的全切片病理图像分类方法...

【专利技术属性】
技术研发人员:张伟锋汤红忠顾江谢明健洪良利易润坤耿义群张宏生
申请(专利权)人:汕头大学医学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1