System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于病理图像特征预测乳腺癌免疫亚型分类的方法技术_技高网

一种基于病理图像特征预测乳腺癌免疫亚型分类的方法技术

技术编号:40490113 阅读:6 留言:0更新日期:2024-02-26 19:20
一种基于病理图像特征预测乳腺癌免疫亚型分类的方法,包括步骤:1)病理图像预处理:选用癌症和肿瘤基因组图谱TCGA数据库中的病理组织切片;2)基于对比学习进行预训练:使用ResNet50模型网络模型作为编码器,利用对比学习的方式对编码器进行预训练,使用注意力池化对特征进行聚合;3)免疫亚型预测:采用一个全连接层加一个softmax层作为预测模型,以图像特征为输入,使用交叉熵损失函数训练模型以预测乳腺癌免疫亚型。本发明专利技术构建的机器学习模型,与现有研究相比,将千兆像素图像的分割若干较小的图块,解决了内存不足造成GPU计算困难难以训练的问题,同时组织学亚型分类模型取代人工标记,实现高效化。

【技术实现步骤摘要】

本专利技术涉及深度学习,是一种深度技术在病理学的诊断中的应用,尤其涉及一种基于对比学习的病理图像特征预测乳腺癌免疫亚型分类的方法。


技术介绍

1、乳腺癌是女性常见的恶性肿瘤之一,也是一个高度异质性的疾病,在乳腺癌中,疾病进展和预后与形态学上不同的肿瘤区域的出现有关,称为组织学模式。然而,分子和组织学特征之间的联系仍然难以捉摸。在病理学领域,病理学家分析揭示了被称为组织学模式的异质肿瘤组织形态,分别为浸润型、排斥型和沙漠型。

2、现有技术中,有研究者对肿瘤免疫亚型分类方法,例如公开号为cn112435714a的中国专利申请一种肿瘤免疫亚型分类方法及系统,其记载的方法包括:获取包括多个肿瘤组织的rna-seq测序数据和基因表达谱数据的样本数据集;计算样本数据集中的每一样本所对应的肿瘤组织中的微生物丰度数据、免疫细胞比例数据和与免疫相关的基因表达数据;以微生物丰度数据、免疫细胞比例数据和与免疫相关的基因表达数据为分类特征,构建训练样本数据集,并采用smote算法对少数类进行扩充,对随机森林模型进行训练,并通过加权的形式,对随机森林模型进行改进:增加少数类的权重,使决策树分类器偏重于少数类,提高少数类的分类准确率。该方法可提高肿瘤免疫亚型分类预测的准确性,为肿瘤免疫治疗提供新的靶标。

3、机器学习作为新时代人工智能领域的必然产物,其算法拥有强大的学习能力,结合机器学习学习组织学模式特征,能准确分类组织学亚型,大大提高标注效率。目前已有不少的研究关注于使用深度学习模型提取病理图像特征。

4、现有技术中,深度学习模型在解决相应问题上已经有了不错的表现,但是尚无相关技术完善应用在预测乳腺癌免疫亚型中,并且研究过程中耗费大量人力进行标注。


技术实现思路

1、本专利技术关注于乳腺癌的组织学模式,本专利技术的主要技术贡献包括:一、基于机器学习构建乳腺癌免疫亚型分类模型;二、减少实验验证的成本,为病理图像相关研究提供了免疫亚型预测的一种新思路。

2、本专利技术具体包括:

3、一种揭示病理图像特征预测乳腺癌免疫亚型分类的方法,步骤包括:

4、步骤1)选用癌症和肿瘤基因组图谱tcga数据库中的病理组织切片进行图像预处理;使用ostu算法识别病理组织区域与背景区域;剔除背景区域后把病理组织区域切割成若干图块patch,作为乳腺癌免疫亚型分类模型的输入;

5、步骤2)使用resnet50作为编码器,利用对比学习的方式对编码器进行预训练,并在计算后对patch-level特征进行聚合,以获得slide-level的特征;正样本采用随机图像增强的方式生成,负样本从预先生成的memory bank中提取;

6、步骤3)在得到特征向量之后,即进行相应的下游任务,将提取的特征作为输入,用一个全连接层加一个softmax层作为预测模型,将交叉熵作为分类任务的损失函数。

7、通过实验验证,本方法提出的模型在免疫亚型诊断任务中的acc指标达到了0.75,auc达到了0.82。

8、所述乳腺癌免疫亚型分类模型(组织学模式分类模型)的构建步骤包括:

9、步骤1)操作者使用tcga数据库中乳腺癌组织切片数据作为训练集放入自监督模型中进行图像切割;从原始序列中将第i个slide使用openslide读取并切割成图块patch;

10、步骤2)使用resnet50网络模型作为训练的基模型(backbone),之后将整个memorybank作为对比学习的负样本,训练过程中不断地随机从memory bank中提取1个batch的数据作为负样本,通过最大化图块与正样本的相似度,最小化与负样本的相似度来进行对比训练,并在计算后对patch-level特征采用注意力池化方式进行聚合,来获得slide-level的特征,通过一个神经网络确定权重,权值和是1。将一个slide中所有的patch特征输入注意力池化层,计算出每一个patch的注意力权重,通过加权平均计算得到该slide的slide-level的特征;

11、步骤3)乳腺癌免疫亚型预测。

12、在下游任务中,操作者在得到切片级slide-level特征向量之后,就可以进行相应的下游任务。对于免疫亚型诊断任务,使用有1821个输入纬度和3个输出纬度的线性层和一个softmax层,最后输出的是输入slide为三种不同免疫亚型的概率。

13、模型网络中,数据处理模块包括背景分割模块和slide切割模块。训练模块包括对比学习预训练模块和微调模块。预测模块包括特征整合和深度学习网络预测模块。

14、本专利技术构建的机器学习模型,与现有研究相比,将千兆像素图像的分割若干较小的图块,解决了内存不足造成gpu计算困难难以训练的问题,同时组织学亚型分类模型取代人工标记,实现高效化。该基于对比学习的病理图像特征检测乳腺癌免疫亚型分类算法,在多个数据集上,预测slide是否为肿瘤组织具有极高的准确性,可以用于相关的肿瘤诊断任务中,为实验人员提供一定的参考,用于节省人力物力,减少实验成本。

本文档来自技高网...

【技术保护点】

1.一种基于病理图像特征预测乳腺癌免疫亚型分类的方法,其特征在于包括步骤:

2.根据权利要求1所述的一种基于病理图像特征预测乳腺癌免疫亚型分类的方法,其特征是所述步骤(一)以及步骤2.1)中的病理切片图像处理方法相同,具体为:

3.根据权利要求1所述的一种基于病理图像特征预测乳腺癌免疫亚型分类的方法,其特征是所述步骤2.1)中,不保存图块patch本身,仅保存图块patch在图像视野slide中的坐标值;在切片级slide-level下对数字病理切片WSI进行切割,得到有病理组织的前景区域:使用Python库openslide读取WSI数据,使用Ostu算法识别病理组织区域与背景区域,以剔除背景区域;切割得到图块patch是大小128×128μm,即256×256pixels的正方形小块。

【技术特征摘要】

1.一种基于病理图像特征预测乳腺癌免疫亚型分类的方法,其特征在于包括步骤:

2.根据权利要求1所述的一种基于病理图像特征预测乳腺癌免疫亚型分类的方法,其特征是所述步骤(一)以及步骤2.1)中的病理切片图像处理方法相同,具体为:

3.根据权利要求1所述的一种基于病理图像特征预测乳腺癌免疫亚型分类的方法,其特征是所述步骤2.1)中,不保存图...

【专利技术属性】
技术研发人员:刘辉李媛媛
申请(专利权)人:南京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1