基于组织病理图像深度域适应的TMB分类方法及系统技术方案

技术编号:32627821 阅读:22 留言:0更新日期:2022-03-12 18:01
本发明专利技术提出一种基于组织病理图像深度域适应的TMB分类方法,包括:从TCGA数据和已知临床数据中选取已标注病理图像,划分入第一图像集和第二图像集;对该第一图像集的病理图像进行切分,得到多个具有感兴趣区域特征的第一图像块,构建为第一训练数据集,训练深度学习识别网络获得感兴趣区域识别模型;以该感兴趣区域识别模型获取该第二图像集的病理图像的感兴趣区域,并切分得到多个带有TMB类型标签的第二图像块,构建为第二训练数据集,训练深度学习分类网络获得TMB分类模型;获取目标病理图像的感兴趣区域,以该TMB分类模型对该感兴趣区域进行分类,得到该目标病理图像的TMB类别。本发明专利技术还提出一种基于域适应的TMB图像分类系统,以及一种数据处理装置。以及一种数据处理装置。以及一种数据处理装置。

【技术实现步骤摘要】
基于组织病理图像深度域适应的TMB分类方法及系统


[0001]本专利技术涉及计算机视觉中的图像分类
和医学病理图像领域,并且特别涉及一种基于组织病理图像深度域适应的TMB分类方法及系统。

技术介绍

[0002]TMB值表示定量的基因组突变的数目,目前已经成为免疫治疗研究和靶向药药性测量的一个重要指标,是研究人员进行癌症病理研究和靶向药研发的重要参考依据。
[0003]目前TMB定量分析方法主要还是采取测量癌细胞的基因组的方法,这种方法虽然能准确地计算出TMB的数值,但在实际应用中,时间、经济成本总体较为昂贵。通过计算机建模,采用深度学习等方法对病理图像中的生物标记物进行预测可有效解决这一现实困境。但由于样本数据的缺乏及不同医院所使用的制片手法不同等因素,如何提高模型的泛化能力,使用有限的数据达到适宜于研发使用的效果,仍然是一个亟待解决的问题。

技术实现思路

[0004]针对以上问题,本专利技术提供一种基于组织病理图像深度域适应的TMB分类方法,包括:从TCGA数据和已知临床数据中选取已标注病理图像,划分入第一图像集和第二图像集;对该第一图像集的病理图像进行切分,得到多个具有感兴趣区域特征的第一图像块,构建为第一训练数据集,训练深度学习识别网络获得感兴趣区域识别模型;以该感兴趣区域识别模型获取该第二图像集的病理图像的感兴趣区域,并切分得到多个带有TMB类型标签的第二图像块,构建为第二训练数据集,训练深度学习分类网络获得TMB分类模型;获取目标病理图像的感兴趣区域,以该TMB分类模型对该感兴趣区域进行分类,得到该目标病理图像的TMB类别。
[0005]本专利技术所述的TMB分类方法,其中该深度学习分类网络具有域适应结构,并采用domain loss损失函数作为域间损失函数;以该第二图像集中TCGA数据集病理图像切分得到的第二图像块为训练该深度学习分类网络的源域数据;以该第二图像集中已知临床病理图像切分得到的第二图像块为训练该深度学习分类网络的目标域数据。
[0006]本专利技术所述的TMB分类方法,其中通过该感兴趣区域识别模型对该目标病理图像进行识别,以获取该感兴趣区域。
[0007]本专利技术所述的TMB分类方法,其中对该已标注病理图像进行切分的过程包括:获取该已标注病理图像的组织掩码及癌灶区概率热图,获取该已标注病理图像的癌灶区掩码;使用滑窗根据该癌灶区掩码在该已标注病理图像进行滑动切分,并去除背景,得到该第一图像块。
[0008]本专利技术还提出一种基于组织病理图像深度域适应的TMB分类系统,包括:第一模型训练模块,用于训练感兴趣区域识别模型;其中,对已标注病理图像进行切分,得到多个具有感兴趣区域特征的图像块,构建为第一训练数据集,训练深度学习网络获得该感兴趣区域识别模型;第二模型训练模块,用于训练 TMB分类模型;其中,以该感兴趣区域识别模型
对未标记病理图像进行切分,得到多个带有TMB类型标签的图像块,构建为第二训练数据集,训练具有域适应结构的深度学习分类网络获得该TMB分类模型;图像分类模块,用于获取目标病理图像的感兴趣区域,并以该TMB分类模型对该感兴趣区域进行分类,得到该目标病理图像的TMB类别。
[0009]本专利技术所述的TMB分类系统,其中该具有域适应结构的深度学习分类网络采用domain loss损失函数作为域间损失函数。
[0010]本专利技术所述的TMB分类系统,其中该图像分类模块包括目标图像预处理模块,用于通过该感兴趣区域识别模型对该目标病理图像进行识别,以获取该感兴趣区域。
[0011]本专利技术所述的TMB分类系统,其中该第一模型构建模块包括:图像切分模块,用于切分该已标注病理图像以获取该具有感兴趣区域特征的图像块;其中获得该已标注病理图像的组织掩码及癌灶区概率热图,获取该病理图像的癌灶区掩码;使用滑窗根据该癌灶区掩码在该已标注病理图像进行滑动切分,并去除背景,得到该具有感兴趣区域特征的图像块。
[0012]本专利技术还提出一种计算机可读存储介质,存储有计算机可执行指令,当该计算机可执行指令被执行时,实现如前所述的基于域适应的TMB图像分类方法。
[0013]本专利技术还提出一种数据处理装置,包括如前所述的计算机可读存储介质,当该数据处理装置的处理器调取并执行该计算机可读存储介质中的计算机可执行指令时,对目标病理图像进行基于深度域适应的TMB分类。
附图说明
[0014]图1是本专利技术的深度学习分类模型架构图。
[0015]图2是本专利技术的基于组织病理图像深度域适应的TMB分类方法流程图。
[0016]图3是癌灶区识别的切片图像。
[0017]图4是本专利技术的域适应模块结构图。
[0018]图5A是本专利技术的TCGA数据集的AUC实验结果图。
[0019]图5B是本专利技术的临床数据集的AUC实验结果图。
[0020]图6是本专利技术的数据处理装置示意图。
具体实施方式
[0021]为让本专利技术能更明显易懂,下文特举实施例,并配合所附图式作详细说明如下。
[0022]目前,进行TMB图像分类模型训练的样本数据来源较为困难,获取到大量的临床数据进行建模并不容易,因此,目前绝大多数的TMB预测手段所使用的数据集均来源于TCGA官方数据集,但是,由于人种不同而带来的潜在基因学表达上的差异以及各大医院对病例学切片所使用的制片手段的不同,这些潜在的差异使得现有的研究工作出现一种域偏移(domain shift)的问题,导致使用TCGA的数据训练得到的模型,应用到临床数据上会出现效果不佳的问题。对于这一问题本专利技术提出了一种基于域适应算法的TMB图像分类方法及系统,主要研究了从TCGA到LC上的域适应网络,基于两组数据集在标签空间具有相似性,在这种情况下,本专利技术使用的源域为TCGA数据,而目标域为临床数据。如果对于所有以分布而形成的样本空间为输入的函数f,而两个分布生成的足够多的样本在f上的对应的像的均值
都相等,那么可以认为这两个分布是同一个分布,但是对于两个域来说,它们具有相同的标签空间,但是却又存在数据空间分布的差异,可以通过降低域间的差异来提高分类效果的准确性。如图1所示,通过使用TCGA数据集及临床少量数据集进行训练,使得算法模型在临床数据上能够得到一个更好效果,辅助医生进行病理诊断,为临床医生进行下一步的免疫治疗措施提供辅助决策。
[0023]具体来说,如图2所示,本专利技术的基于组织病理图像深度域适应的TMB 分类方法具体包括:
[0024]步骤S1、获取训练样本,训练样本从TCGA官方数据集和医院收集到的临床患者切片(已标注)中选取,将获得的训练样本(已标注病理图像)分为两个图像集,例如是识别训练图像集和分类训练图像集,以分别用于训练识别病理图像癌灶区(感兴趣区域)的识别模型,和训练对目标病理图像进行TMB 分类的分类模型;
[0025]步骤S2、对识别训练图像集中的病理图像进行切分,得到多个具有感兴趣区域特征(癌灶区特征)的图像块,构建为用于感兴趣区域识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于组织病理图像深度域适应的TMB分类方法,其特征在于,包括:从TCGA数据和已知临床数据中选取已标注病理图像,划分入第一图像集和第二图像集;对该第一图像集的病理图像进行切分,得到多个具有感兴趣区域特征的第一图像块,构建为第一训练数据集,训练深度学习识别网络获得感兴趣区域识别模型;以该感兴趣区域识别模型获取该第二图像集的病理图像的感兴趣区域,并切分得到多个带有TMB类型标签的第二图像块,构建为第二训练数据集,训练深度学习分类网络获得TMB分类模型;获取目标病理图像的感兴趣区域,以该TMB分类模型对该感兴趣区域进行分类,得到该目标病理图像的TMB类别。2.权利要求1所述的TMB分类方法,其特征在于,该深度学习分类网络具有域适应结构,并采用domainloss损失函数作为域间损失函数;以该第二图像集中TCGA数据集病理图像切分得到的第二图像块为训练该深度学习分类网络的源域数据;以该第二图像集中已知临床病理图像切分得到的第二图像块为训练该深度学习分类网络的目标域数据。3.如权利要求1所述的TMB分类方法,其特征在于,通过该感兴趣区域识别模型对该目标病理图像进行识别,以获取该感兴趣区域。4.权利要求1所述的TMB分类方法,其特征在于,对该已标注病理图像进行切分的过程包括:获取该已标注病理图像的组织掩码及癌灶区概率热图,获取该已标注病理图像的癌灶区掩码;使用滑窗根据该癌灶区掩码在该已标注病理图像进行滑动切分,并去除背景,得到该第一图像块。5.一种基于组织病理图像深度域适应的TMB分类系统,其特征在于,包括:第一模型训练模块,用于训练感兴趣区域识别模型;其中,对已标注病理图像进行切分,得到多个具有感兴趣区...

【专利技术属性】
技术研发人员:张百川沈益君张雪媛徐佩行
申请(专利权)人:重庆知见生命科技有限公司叶定伟
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1