一种基于病理图像特征检测肿瘤蛋白标记物表达水平算法制造技术

技术编号：37607036 阅读：25 留言：0更新日期：2023-05-18 11:59

一种基于病理图像特征检测肿瘤蛋白标记物的算法，包括步骤：1)病理图像的分割与过滤：选用癌症和肿瘤基因组图谱TCGA数据库中的数字病理切片；使用大津阈值法(Ostu)来识别病理组织区域与背景区域；随后把病理切片(slide)分割成能够被模型计算的若干图块(patch)；2)基于对比学习的预训练与微调：使用ResNet50模型作为编码器，利用对比学习的方式对编码器进行预训练，而后根据RPPA数据对模型微调，最终使用注意力池化对patch

全部详细技术资料下载

【技术实现步骤摘要】
一种基于病理图像特征检测肿瘤蛋白标记物表达水平算法

[0001]本专利技术涉及深度学习
，是一种深度技术在病理学的诊断中的应用，尤其涉及一种基于对比学习的病理图像特征检测肿瘤蛋白标记物表达水平算法。

技术介绍

[0002]近年来，数字病理学获得快速发展，促进了计算机对肿瘤的自动诊断，减轻了病理学家的劳动强度，降低了观察者的主观偏差。目前已有不少的研究关注于使用深度学习模型提取病理图像特征，用于基因突变预测、细胞核分类及分割，但鲜有研究着眼于肿瘤蛋白标记物的表达。RPPA是一种高通量、高灵敏的功能性蛋白组学技术，通过RPPA技术可以快速和准确的对肿瘤的发生和发展机制进行深入研究。然而RPPA技术依赖于专业的平台，通过RPPA技术检测蛋白质分子谱要求的肿瘤样本较多，同时也受到检测手段与成本的限制，且忽视了肿瘤的形态学特征。基于深度学习的计算机视觉技术已取得了巨大进步，目前深度学习已广泛应用于数字病理切片图像的分析。
[0003]现有技术中，深度学习模型在解决相应问题上已经有了不错的表现，但是尚无相关技术完善应用在肿...

【技术保护点】

【技术特征摘要】
1.一种基于对比学习的病理图像特征检测肿瘤蛋白标记物表达水平的算法，其特征在于：包括步骤：1)数据分割：选用癌症和肿瘤基因组图谱TCGA数据库中的数字病理切片；使用Ostu算法识别病理组织区域与背景区域；剔除背景区域后把病理组织区域切割成若干图块patch，作为模型的输入；2)基于对比学习的预训练：使用深度残差网络ResNet50作为图块编码器，使用对比学习框架对编码器进行预训练后对其继续微调，并在计算后对patch
‑
level特征进行聚合，以获得slide
‑
level的特征；正样本采用随机图像增强的方式生成，负样本从预先生成的Memory Bank中提取；3)预测：预测任务使用线性层进行预测，使用均方误差损失函数训练模型来实现肿瘤蛋白标记物表达预测；所述步骤1)中，使用癌症蛋白质组图谱TCPA数据库中的RPPA数据，下载与TCGA中数字病理切片相匹配的RPPA数据，作为样本回归标签；在切片级(slide
‑
level)下对数字病理切片(WSI)进行切割，得到有病理组织的前景区域：使用Python库openslide读取WSI数据，使用Ostu算法识别病理组织区域与背景区域，以剔除背景区域；将病理组织区域切分，得到若干足够小的正方形小块(patch)；所述步骤2)中，设步骤1)中的第i张slide有z
i
个patch；编码器f(θ)将一张slide的所有patch转化为一个h维向量H，该H向量又经映射层投影到一个k维向量K；经计算得到每张slide得到大小为z
i
×
k的矩阵；对比学习的正样本采用随机图像增强的方式生成；负样本从预先生成的负样本队列Memory Bank中提取。训练过程中同时以公式(2)更新基模型f(θ)；梯度更新过程中，基模型θ沿梯度下...

【专利技术属性】
技术研发人员：刘辉，解晓东，
申请(专利权)人：南京工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人