当前位置: 首页 > 专利查询>南通大学专利>正文

基于DCAE结构的病理图像染色不变性低维表示方法技术

技术编号:19428174 阅读:22 留言:0更新日期:2018-11-14 11:08
本发明专利技术公开了一种基于DCAE结构的病理图像染色不变性低维表示方法,步骤包括:1)组织样本病理图像粗对准;2)训练样本的选取;3)双通道自动编码器的训练;4)更新特征聚类中心。该基于DCAE结构的病理图像染色不变性低维表示方法,可找到目标集和源数据集之间的归一化特征表示,不依赖任何复杂或耗时的预处理,只需将原始图像用作输入,也不依赖于标记的输入图像,就能够将组织图像分割成其组成成分的低维表示,具有准确、快速、自动化等特点,具有很好的实用性。

【技术实现步骤摘要】
基于DCAE结构的病理图像染色不变性低维表示方法
本专利技术涉及图像信息处理
,特别是一种基于DCAE(DualChannelsAutoEncoder)结构的病理图像染色不变性低维表示方法。
技术介绍
组织病理学和细胞病理学已成为诊断不同癌症类型的黄金准则。数字病理学是一种用于区分和诊断组织成分(如肿瘤,细胞核和细胞)的先进技术。通常在进行人工智能诊断之前,将自然或人造的染色剂应用于组织活检。最常见的是苏木精和伊红。苏木精会与遗传物质结合,将细胞核染成深蓝色或紫色,而细胞质、胶原蛋白和肌纤维会被伊红染成粉红色。由于染色过程的化学性质,许多因素可以改变给定组织切片的视觉外观。扫描仪之间的差异是由所使用的幻灯片数字转换器的类型引起的,这种差异会导致数字化图像的亮度,对比度和分辨率差异很大以及引入某些人为因素。目前染色标准化方法大致可分为三类:1)颜色匹配;2)颜色分离;3)基于学习的技术。Reinhard等人提出的基于颜色匹配的方法需要手动选择目标图像,在应用于较大数据集时效果不佳。另外目标图像的选择也较困难,因为它必须包含大部分染色变异和组织类型才能表现良好。Khan等人提出的方法在许多场合中取得了很好的结果,但基于颜色分离的方法需要从模板图像中学习转移矩阵,然而这个矩阵可能不适用于数据集的其余部分,这意味着需要根据数据集中染色多变性来计算每个图像的矩阵。Bentaieb等人提出使用整个图像集而不是单个参考图像,但是这种方法需要大量注释的训练图像,而获取大量带注释的训练图像是相当困难且工作量极大的。
技术实现思路
专利技术目的:针对现有技术中存在的不足,本专利技术的目的是提供一种基于DCAE结构的病理图像染色不变性低维表示方法,找到目标集和源数据集之间的归一化特征表示,不依赖任何复杂或耗时的预处理,只是将原始图像用作输入,也不依赖于标记的输入图像,就能够将组织图像分割成其组成成分的低维表示,具有准确、快速、自动化等特点。技术方案:为了实现上述专利技术目的,本专利技术采用的技术方案为:一种基于DCAE结构的病理图像染色不变性低维表示方法,步骤如下:1)组织样本病理图像粗对准;2)训练样本的选取;3)双通道自动编码器的训练;4)更新特征聚类中心。步骤1)中,首先将同一组织样本分别用不同病理扫描仪进行扫描得到成对的病理数字化图像,将标准U-Net模型应用于病理图像以分割背景和组织类,形成二进制mask,然后应用像素差分来计算2个mask欧式最小距离,得到初步配准图像对。步骤1)中,块图像为大小为8×8×3,能够充分覆盖在10倍分辨率下拍摄的全尺寸图像中完整细胞核的最优尺寸。步骤2)中,利用ORB特征匹配检测参考图像和目标图像中的匹配点,提取以这些点为中心的块图像,分别形成参考图像数据集和目标图像数据集。步骤2)中,步骤2中,将系列图像块ai∈A定义为一个数据集A,ai的大小为960×960像素;这些图像块是从对齐的参考图像和目标图像中成对提取,利用ORB特征匹配对每个图像对xi,计算参考图像xi,s和目标图像xi,t的ORB特征;然后,使用K最近邻特征匹配方法以及比率测试来找出一系列xi,s和xi,t之间的对齐点pi;对于每个对齐点pi,提取一个大小为a×a×3,以pi为中心的块,其中a是一个实验定义的参数;将每个a×a×3的图像块分成一系列尺寸大小为b×b×3的对齐块图像并附加到数据集A中,以便保留源块图像和目标块图像之间的空间对齐。步骤3)中,双通道编码器每个通道由一个自动编码器和两个完全连接层组成,使用SELU激活函数。步骤3)中,分别从参考图像数据集和目标图像数据集中各提取成对块图像,作为自动编码器AE-S和AE-T的输入,一旦编码器重构其各自输入,就计算综合损失迫使每个网络在整个学习过程中得到相似的特征表示;使用BP算法计算损失函数相对于每个网络参数的梯度,并使用ADAM算法优化权重。步骤3)中,为了加强输入的各个特征向量{xi,s,xi,t}之间的相似性,所用的综合损失包括重构损失(reconstructionloss,Lr)、特征损失(featureloss,Lf)和聚类损失(clusterloss,Lc);在训练初期,首先引入重构损失作用于模型通道,获得有效特征;当重构损失下降到阈值时,特征损失和聚类损失开始作用于训练过程,同时计算特征损失和聚类损失值,取二者大的值和重构损失一起作为综合损失;各损失函数定义如下:系统目标函数定义如下:其中w表示两个自动编码器({WE,s,WD,s,WE,t,WD,t})的权重,ci表示聚类中心,Lr是重构损失,Lf是特征损失,Lc是聚类损失,α是阈值参数,λ为特征损失和聚类损失的权重。步骤3)中,λ=0.25。α=0.1。步骤4)中,在每个训练周期结束前,对输入训练样本X对应的编码表示Z,使用标准的k-means方法,将其分成k个独立的相似数据点聚类,为其定义标签Ci,并将K个聚类中心用于下一次训练中聚类损失的距离度量。本专利技术的方法使用双通道架构,其中每个通道专门用于处理来自特定源(扫描仪)的数据,该方法不需要先进的预处理技术,其双通道自动编码器(DualChannelsAutoEnoder,DCAE)模型由三个主要部分组成:一个源自动编码器(AE-S),一个目标自动编码器(AE-T)和一个聚类机制,通过该双通道自动编码器,训练两个完全连接的自动编码器,重建各自的数据链接,增加一个保留特征的约束,迫使每个网络在整个学习过程中得到相似的特征表示,实现以无监督的方式学习组织病理学图像的低维特征表示。有益效果:现有技术相比,本专利技术具有以下技术效果:1.)本专利技术提出了一种基于自动编码器的新型双通道模型,用于学习来自不同类型扫描仪样本的归一化特征表示,其不需要标记数据或昂贵的预处理技术。2)本专利技术提出了一种新的多重损失函数,它能够增强DCAE网络学习来自不同类型扫描仪图像的归一化特征表示。3)该低维表示方法,可找到目标集和源数据集之间的归一化特征表示,不依赖任何复杂或耗时的预处理,只需将原始图像用作输入,也不依赖于标记的输入图像,就能够将组织图像分割成其组成成分的低维表示,具有准确、快速、自动化等特点,具有很好的实用性。附图说明图1是原始图像初步对准图;图2是图像块的匹配以及建立数据集对图;图3是DCAE模型学习过程概述图;图4是各损失函数作用示意图;图5是综合损失函数对系统的引导过程图;图6是损失函数对训练结果的影响图;图7是匹配块图像及其对应每种方法的学习表示图。具体实施方式下面详细描述本专利技术的实施方式,所述实施方式的示例在附图中示出。下面通过参考附图描述的实施方式是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。实施例1一种基于DCAE结构的病理图像染色不变性低维表示方法,步骤如下:步骤1、组织样本病理图像粗对准首先将组织样本分别用Aperio和Philips扫描仪进行扫描得到成对原始病理图像,将标准U-Net模型应用于病理图像以分割背景和组织类,如图1所示,形成二进制mask,然后应用像素差分来计算2个mask欧式最小距离,得到初步粗对准图像对。步骤2、训练样本的选取将一系列图像块ai∈A定义为一个数据集A,ai的大小为960×960像素。这些图像块是从对齐本文档来自技高网...

【技术保护点】
1.一种基于DCAE结构的病理图像染色不变性低维表示方法,其特征在于,步骤如下:1)组织样本病理图像粗对准;2)训练样本的选取;3)双通道自动编码器的训练;4)更新特征聚类中心。

【技术特征摘要】
1.一种基于DCAE结构的病理图像染色不变性低维表示方法,其特征在于,步骤如下:1)组织样本病理图像粗对准;2)训练样本的选取;3)双通道自动编码器的训练;4)更新特征聚类中心。2.根据权利要求1所述的基于DCAE结构的病理图像染色不变性低维表示方法,其特征在于,步骤1)中,首先将同一组织样本分别用不同病理扫描仪进行扫描得到成对的病理数字化图像,将标准U-Net模型应用于病理图像以分割背景和组织类,形成二进制mask,然后应用像素差分来计算2个mask欧式最小距离,得到初步配准图像对。3.根据权利要求2所述的基于DCAE结构的病理图像染色不变性低维表示方法,其特征在于,步骤1)中,块图像为大小为8×8×3,能够充分覆盖在10倍分辨率下拍摄的全尺寸图像中完整细胞核的最优尺寸。4.根据权利要求1所述的基于DCAE结构的病理图像染色不变性低维表示方法,其特征在于,步骤2)中,利用ORB特征匹配检测参考图像和目标图像中的匹配点,提取以这些点为中心的块图像,分别形成参考图像数据集和目标图像数据集。5.根据权利要求4所述的基于DCAE结构的病理图像染色不变性低维表示方法,其特征在于,步骤2)中,步骤2中,将系列图像块ai∈A定义为一个数据集A,ai的大小为960×960像素;这些图像块是从对齐的参考图像和目标图像中成对提取,利用ORB特征匹配对每个图像对xi,计算参考图像xi,s和目标图像xi,t的ORB特征;然后,使用K最近邻特征匹配方法以及比率测试来找出一系列xi,s和xi,t之间的对齐点pi;对于每个对齐点pi,提取一个大小为a×a×3,以pi为中心的块,其中a是一个实验定义的参数;将每个a×a×3的图像块分成一系列尺寸大小为b×b×3的对齐块图像并附加到数据集A中,以便保留源块图像和目标块图像之间的空间对齐。6.根据权利要求1所述的基于D...

【专利技术属性】
技术研发人员:张堃付君红吴建国张培建
申请(专利权)人:南通大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1