基于结直肠癌病理图像的dMMR胚系突变亚型分类方法及系统技术方案

技术编号:39421869 阅读:22 留言:0更新日期:2023-11-19 16:10
本发明专利技术涉及医学病理图像处理技术领域,公开了基于结直肠癌病理图像的dMMR胚系突变亚型分类方法及系统。针对胚系突变分类任务中,混杂因素过多且二分类病例组成存在客观差异以及数据量有偏倚的问题,本发明专利技术建立了dMMR胚系突变亚型分类网络模型,其以多示例学习模型为框架,对数据的数量及配比要求较低,可以极大地减少相似领域人工智能研究所需要的数据量及工作量。与现有的技术模型相比,对于相同特点的同类数据具有突出的效果,可以得出比较理想的稳定性及普适性。本发明专利技术可以直接从dMMR患者的H&E切片中预测Lynch相关胚系突变,并且具有良好的准确性,可以为Lynch综合症这一筛查项目提供更为简便、性价比高的选择。性价比高的选择。

【技术实现步骤摘要】
基于结直肠癌病理图像的dMMR胚系突变亚型分类方法及系统


[0001]本专利技术涉及医学病理图像处理
,具体为基于结直肠癌病理图像的dMMR胚系突变亚型分类方法及系统。

技术介绍

[0002]现已有国内外研究将基于H&E染色病理图像下的dMMR(different Mismatch Repair,错配修复缺陷)与pMMR(proficient Mismatch Repair,错配修复完整)进行人工智能分类。但是,在dMMR基础上的胚系突变分类较少。而且,现有胚系突变情况是通过基因测序获得,与肿瘤区域识别任务不同,无法标注与其任务相关的区域。因此,现有针对胚系突变分类任务中,客观存在混杂因素过多的情况,若赋予单张patch以WSI级标签,是不准确的,无法保证其包含所有胚系突变的亚型特征,并且因发病率问题,所获取的数据不均衡,进而会导致人工智能模型的稳定性及普适性不高。

技术实现思路

[0003]针对胚系突变分类任务中,混杂因素过多且二分类病例组成存在客观差异以及数据量有偏倚的问题,本专利技术提供了基于结直肠癌病理图像的dMMR胚系突变亚型分类方法及系统。
[0004]为了达到上述目的,本专利技术采用了下列技术方案:第一方面,本专利技术提供了一种基于结直肠癌病理图像的dMMR胚系突变亚型分类方法,包括以下步骤:S1 定位肿瘤组织所在区域;S2 构建dMMR胚系突变亚型分类网络模型;S3 将S1中完成肿瘤组织所在区域定位的图像输入S2构建的模型中,提取信息并分类。
[0005]进一步,所述S1中定位肿瘤组织所在区域的具体过程为:S11 将WSI病理图像的原始图像从RGB颜色空间转换为HSV后,使用Otsu阈值分割技术获取组织掩模,WSI中包含一些空白区域,利用该种方式可去除;S12 将WSI图像切分成多个统一尺寸的小图像称其为patch,输入训练好的肿瘤组织所在区域识别模型,完成肿瘤组织所在区域的定位。
[0006]进一步,所述肿瘤组织所在区域识别模型为Resnet18。
[0007]进一步,所述S2中dMMR胚系突变亚型分类网络模型以多示例学习(Multiple Instance Learning,MIL)网络模型为基础框架,将其中的传统监督网络模型替换为自监督模型。
[0008]进一步,所述自监督模型采用的是BYOL网络,BYOL网络采用双分支的网络结构,分别为在线网络和目标网络,通过最小化两个网络输出特征的均方误差训练在线网络,同时利用在线网络更新目标网络的参数。
[0009]进一步,所述S3具体为:S31 将S1中完成肿瘤组织所在区域定位的图像进行颜色归一化处理;S32 将进行颜色归一化处理后的图像输入S2构建模型的BYOL网络中提取特征;S33 提取特征后,通过PCA进行特征的降维,实现对BYOL网络特征的二次筛选,去除冗余或无用信息的干扰;S34 输入S2构建模型的多示例学习网络中,在MIL中,WSI是“包”,patch图像是“示例”,利用注意力机制,将WSI中patch的所有信息融合,从而确定其类别。
[0010]进一步,所述S34具体为:若某张patch中含有胚系突变的重要特征信息,则该张patch的权重较大,反之,则权重较小。
[0011]第二方面,本专利技术提供了一种基于结直肠癌病理图像的dMMR胚系突变亚型分类系统,所述系统用于实现上文所述的基于结直肠癌病理图像的dMMR胚系突变亚型分类方法;包括肿瘤组织所在区域定位模块、预处理模块、特征获取模块和分类模块;其中,肿瘤组织所在区域定位模块用于定位WSI病理图像中的肿瘤组织所在区域;预处理模块用于对完成肿瘤组织所在区域定位的图像进行颜色归一化处理;特征获取模块采用BYOL网络提取颜色归一化处理后图像的特征;分类模块用于融合WSI中patch的所有信息,从而确定dMMR胚系突变亚型分类。
[0012]第三方面,本专利技术提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上文所述的基于结直肠癌病理图像的dMMR胚系突变亚型分类方法。
[0013]第四方面,本专利技术提供了一种非暂态计算机可读存储介质,所述介质上存储有计算机程序,该计算机程序用于被处理器执行时实现上文所述的基于结直肠癌病理图像的dMMR胚系突变亚型分类方法。
[0014]与现有技术相比本专利技术具有以下有点:本专利技术建立了更适宜于混杂因素过多、二分类病例组成存在客观差异的病理图片数据的人工智能模型,对数据的数量及配比要求较低,可以极大地减少相似领域人工智能研究所需要的数据量及工作量。与现有的技术模型相比,对于相同特点的同类数据具有突出的效果,可以得出比较理想的稳定性及普适性。
[0015]针对结直肠癌这种常见肿瘤,其早期筛查对患者的精准治疗及延长患者生存期有至关重要的作用,Lynch综合症的确诊的主要途径是检测成本高且耗时长的胚系突变检测。本专利技术可以直接从dMMR患者的H&E切片中直接预测Lynch相关胚系突变,并且具有良好的准确性,可以为这一筛查项目提供更为简便、性价比高的选择。
附图说明
[0016]图1为肿瘤组织所在区域的识别流程。
[0017]图2为本专利技术分类方法流程图。
[0018]图3为本专利技术系统示意图。
[0019]图4为本专利技术电子设备的示意图。
[0020]图5为本专利技术分类方法及系统的ROC曲线。
具体实施方式
[0021]下面结合本专利技术实施例和附图,对本专利技术的技术方案进行具体、详细的说明。应当指出,以下实施例仅用于说明本专利技术,不用来限制本专利技术的保护范围。若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。
[0022]结直肠癌胚系突变病理图像分类任务,采用的病理切片(WSI)是由结直肠癌患者进行手术后的肿瘤区域组织染色的H&E切片进行扫描得到的,其中含有正常组织与肿瘤组织等,而肿瘤组织特征信息是区分胚系突变的重要依据。因此,对结直肠癌胚系突变病理图像分类时,首先需要定位肿瘤组织所在区域。
[0023]肿瘤组织所在区域识别的流程,如图1所示:1)将WSI原始图像从RGB颜色空间转换为HSV后,使用Otsu阈值分割技术获取组织掩模;2)将一张WSI切分成多个统一尺寸的小图像称其为patch,输入已训练好的肿瘤区域识别模型Resnet18,进行肿瘤组织所在区域的识别;WSI的分辨率最高有150000
×
100000像素,现有的硬件水平,无法直接处理。因此,需将一张WSI切分成多个统一尺寸的小图像称其为patch。肿瘤区域识别模型不限于Resnet18。
[0024]在完成肿瘤组织所在区域识别后,若直接采用patch图像进行突变分类,其涵盖的信息特征较少,分类效果较差。在这种情况下,我们提出使用多示例学习(Multiple Instance Learning)方法,在MIL中,WSI是“包”,p本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于结直肠癌病理图像的dMMR胚系突变亚型分类方法,其特征在于,包括以下步骤:S1 定位肿瘤组织所在区域;S2 构建dMMR胚系突变亚型分类网络模型;S3 将S1中完成肿瘤组织所在区域定位的图像输入S2构建的模型中,提取信息并分类。2.根据权利要求1所述的基于结直肠癌病理图像的dMMR胚系突变亚型分类方法,其特征在于,所述S1中定位肿瘤组织所在区域的具体过程为:S11 将WSI病理图像的原始图像从RGB颜色空间转换为HSV后,使用Otsu阈值分割技术获取组织掩模;S12 将WSI图像切分成多个统一尺寸的小图像称其为patch,输入训练好的肿瘤组织所在区域识别模型,完成肿瘤组织所在区域的定位。3.根据权利要求2所述的基于结直肠癌病理图像的dMMR胚系突变亚型分类方法,其特征在于,所述肿瘤组织所在区域识别模型为Resnet18。4.根据权利要求1所述的基于结直肠癌病理图像的dMMR胚系突变亚型分类方法,其特征在于,所述S2中dMMR胚系突变亚型分类网络模型以多示例学习网络模型为基础框架,将其中的传统监督网络模型替换为自监督模型。5.根据权利要求4所述的基于结直肠癌病理图像的dMMR胚系突变亚型分类方法,其特征在于,所述自监督模型采用的是BYOL网络,BYOL网络采用双分支的网络结构,分别为在线网络和目标网络,通过最小化两个网络输出特征的均方误差训练在线网络,同时利用在线网络更新目标网络的参数。6.根据权利要求1所述的基于结直肠癌病理图像的dMMR胚系突变亚型分类方法,其特征在于,所述S3具体为:S31 将S1中完成肿瘤组织所在区域定位的图像进行颜色归一化处理;S32 将进行颜色归一化处理后的图像输入S2构建模型的BYOL网络中提取特征;S33 ...

【专利技术属性】
技术研发人员:梁智勇汪昊赵娜吴焕文任新瑜
申请(专利权)人:重庆知见生命科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1