【技术实现步骤摘要】
一种基于病理图像特征检测肿瘤蛋白标记物表达水平算法
[0001]本专利技术涉及深度学习
,是一种深度技术在病理学的诊断中的应用,尤其涉及一种基于对比学习的病理图像特征检测肿瘤蛋白标记物表达水平算法。
技术介绍
[0002]近年来,数字病理学获得快速发展,促进了计算机对肿瘤的自动诊断,减轻了病理学家的劳动强度,降低了观察者的主观偏差。目前已有不少的研究关注于使用深度学习模型提取病理图像特征,用于基因突变预测、细胞核分类及分割,但鲜有研究着眼于肿瘤蛋白标记物的表达。RPPA是一种高通量、高灵敏的功能性蛋白组学技术,通过RPPA技术可以快速和准确的对肿瘤的发生和发展机制进行深入研究。然而RPPA技术依赖于专业的平台,通过RPPA技术检测蛋白质分子谱要求的肿瘤样本较多,同时也受到检测手段与成本的限制,且忽视了肿瘤的形态学特征。基于深度学习的计算机视觉技术已取得了巨大进步,目前深度学习已广泛应用于数字病理切片图像的分析。
[0003]现有技术中,深度学习模型在解决相应问题上已经有了不错的表现,但是尚无相关技术完善应用在肿 ...
【技术保护点】
【技术特征摘要】
1.一种基于对比学习的病理图像特征检测肿瘤蛋白标记物表达水平的算法,其特征在于:包括步骤:1)数据分割:选用癌症和肿瘤基因组图谱TCGA数据库中的数字病理切片;使用Ostu算法识别病理组织区域与背景区域;剔除背景区域后把病理组织区域切割成若干图块patch,作为模型的输入;2)基于对比学习的预训练:使用深度残差网络ResNet50作为图块编码器,使用对比学习框架对编码器进行预训练后对其继续微调,并在计算后对patch
‑
level特征进行聚合,以获得slide
‑
level的特征;正样本采用随机图像增强的方式生成,负样本从预先生成的Memory Bank中提取;3)预测:预测任务使用线性层进行预测,使用均方误差损失函数训练模型来实现肿瘤蛋白标记物表达预测;所述步骤1)中,使用癌症蛋白质组图谱TCPA数据库中的RPPA数据,下载与TCGA中数字病理切片相匹配的RPPA数据,作为样本回归标签;在切片级(slide
‑
level)下对数字病理切片(WSI)进行切割,得到有病理组织的前景区域:使用Python库openslide读取WSI数据,使用Ostu算法识别病理组织区域与背景区域,以剔除背景区域;将病理组织区域切分,得到若干足够小的正方形小块(patch);所述步骤2)中,设步骤1)中的第i张slide有z
i
个patch;编码器f(θ)将一张slide的所有patch转化为一个h维向量H,该H向量又经映射层投影到一个k维向量K;经计算得到每张slide得到大小为z
i
×
k的矩阵;对比学习的正样本采用随机图像增强的方式生成;负样本从预先生成的负样本队列Memory Bank中提取。训练过程中同时以公式(2)更新基模型f(θ);梯度更新过程中,基模型θ沿梯度下...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。