基于点标注数据的病理图像分割方法技术

技术编号:34346380 阅读:41 留言:0更新日期:2022-07-31 04:52
本发明专利技术公开了一种基于点标注数据的病理图像分割方法。主要解决现有训练数据需要的像素级标注成本太高的问题。其方案是:读取病理图像训练集和测试集;建立基于编码器

【技术实现步骤摘要】
基于点标注数据的病理图像分割方法


[0001]本专利技术属于图像处理
,更进一步涉及一种病理图像分割方法,可用于计算机辅助诊断系统。

技术介绍

[0002]癌症的诊断一般需要经过临床诊断、影像诊断、手术诊断、细胞病理学诊断、组织病理学诊断五个步骤,其中组织病理学诊断是最精确的也是最可靠最终诊断。而组织病理学诊断通常是病理学家通过观察组织病理切片来确定癌症的类型、癌症的阶段、癌症的等级和后续治疗方案。这种传统的诊断方法,依赖于病理医生的临床经验,而且往往因为大量阅片导致疲劳,从而影响到诊断结果。
[0003]随着计算机视觉技术的发展和计算硬件的计算能力的巨大提升,使用计算机对病理图像进行自动化分析成为可能。与人工检查相比,使用计算机自动化分析技术来辅助诊断可以极大减少病理医师的劳动强度,提高工作效率。
[0004]近年来,作为病理图像自动化分析技术的关键步骤,医学图像分割技术已经受到了广泛的关注,有很多算法用于医学图像分割分割。传统的分割算法如阈值分割、分水岭、主动轮廓等,这些算法由于对像素值的敏感性以及病理图像的复杂性,使得在提取图像特征时受到较大干扰,因此有很大的提升空间。相比之下基于卷积神经网络的算法在医学图像分割中表现优异。
[0005]卷积神经网络对医学图像分割具有很强的适应性,但分割效果严重依赖于具有高质量像素级标注的训练数据。像素级标注是对目标轮廓进行逐像素的标记,人工地对数据进行像素级标注需要极大地精力投入和时间花费,尤其是在需要相关的领域知识的医学图像分析领域。如果使用点标注的方式,即每个目标只标注一个或多个像素点,虽然可以使用很低的人工成本快速地标注大量的数据。但是相比于像素级标注,点标注提供的目标信息有限,只有目标的位置信息,而没有大小、形状这些关键的外观特征。这种关键训练信息的缺失将导致训练出的分割网络不能分割出目标的全部区域,影响后续的自动化分析结果,很可能造成诊断错误从而发生医疗事故。

技术实现思路

[0006]本专利技术的目的在于针对上述现有技术的不足,提出一种基于点标注数据的细胞核分割方法,以通过分割网络中编码器和解码器分别训练,使得训练后的网络能从病理图像中获取到细胞核的位置、大小及形状这些外观特征,降低数据标注阶段所需要的工作量,实现对细胞核的准确分割。
[0007]为实现上述目的,本专利技术的技术方案是:首先通过点标注数据提供的目标位置信息单独地训练编码器,然后将编码器的权值固定,再迭代地训练解码器,使解码器能根据编码器提供的特征解码出目标的位置、大小和形状等信息。训练结束后将训练好的编码器和解码器可以拼接成一个端到端的分割网络。具体实现包括如下:
[0008](1)读取病理图像训练数据和测试数据,并对训练集图像中的细胞核先使用点标注,再对点标注进行膨胀操作获得细胞核更多部分的标签,得到膨胀后的点标注图像G;对测试集图像中的细胞核使用像素级标注,得到像素级标注图像G
test

[0009](2)将经典分割模型U

Net的编码部分替换为使用大型图像数据库ImageNet上的预训练参数,并去掉全连接层的卷积神经网络VGG

16,得到新建分割模型;
[0010](3)训练新建分割模型的编码器:
[0011]3a)根据二元交叉熵损失函数设置分割模型编码器的损失函数L1:
[0012]L1=L
BCE
(P1,G)
[0013]其中,L
BCE
(
·
)代表二元交叉损失函数,P1代表训练集图像的初步预测结果,G代表点标注图像;
[0014]3b)将训练集图像输入到新建分割模型的编码器中,得到各层图像特征,其中最高层特征经过一个卷积核尺寸为1*1的卷积层,得到单通道图像,再使用双线性上采样恢复到输入图像的尺寸得到训练集图像的初步预测结果P1;
[0015]3c)使用损失函数L1对分割网络的编码部分进行监督训练,直至损失函数L1收敛,得到训练好的编码器;
[0016](4)训练新建分割模型的解码器:
[0017]4a)构建新的损失函数L
n

[0018]L
n
=(G∪P
n
‑1>0.7+G∪P
n
‑1<0.3)
×
L
BCE
[P
n
,(G∪P
n
‑1)][0019]其中,P
n
是本次训练阶段训练集图像的预测结果,n代表当前所处阶段且n>1,G是点标注图像,P
n
‑1是上个阶段的预测结果,L
BCE
(
·
)代表二元交叉损失函数;
[0020]4b)将训练集图像输入到已经训练好的编码器中,得到各层图像特征,再将各层特征输入到解码器中,解码器输出单通道图像,即为训练集图像的当前预测结果P
n

[0021]4c)固定编码器参数,使用损失函数L
n
对分割网络的解码部分进行监督训练,直至损失函数L
n
收敛,得到当前的分割模型M
n

[0022]4d)将测试集图像输入到当前的分割模型M
n
中得到的测试集图像的预测结果P
test
,计算当前阶段P
test
与像素级标注图像G
test
的Dice相似系数d
n
,并将本阶段得到的Dice相似系数d
n
与上个阶段得到的Dice相似系数d
n
‑1进行比较:
[0023]如果d
n
≥d
n
‑1,则保存当前模型参数,返回到步骤4b)开启第n+1个训练阶段;
[0024]否则,训练结束,将第n

1阶段得到的分割模型M
n
‑1作为最终的细胞核分割模型;
[0025](5)将待分割图像输入到细胞核分割模型中,分割模型输出与输入图像相同尺寸的单通道二值图像,在二值图中,所有值为1的像素组成的区域即为分割出来的目标区域,所有值为0的像素组成的区域为分割出来的背景区域。
[0026]本专利技术与现有技术相比,具有以下优点:
[0027]1)本专利技术能够使用点标注数据训练一个完整的分割模型,相比于像素级标注,极大减少了数据标注阶段所需要的工作量;
[0028]2)本专利技术针对分割网络的各部分功能的独特性,先训练编码器的特征提取能力,再迭代地训练解码器的特征解读能力,可使得训练后的网络能从病理图像中获取到细胞核的位置、大小及形状这些外观特征,提高分割网络的分割效果。
附图说明
[0029]图1是本专利技术的实现流程图;
[0030]图2是本专利技术中训练分割模型的示意图;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于点标注数据的病理图像分割方法,其特征在于,包括如下步骤:(1)读取病理图像训练数据和测试数据,并对训练集图像中的细胞核先使用点标注,再对点标注进行膨胀操作获得细胞核更多部分的标签,得到膨胀后的点标注图像G;对测试集图像中的细胞核使用像素级标注,得到像素级标注图像G
test
;(2)将经典分割模型U

Net的编码部分替换为使用大型图像数据库ImageNet上的预训练参数,并去掉全连接层的卷积神经网络VGG

16,得到新建分割模型;(3)训练新建分割模型的编码器:3a)根据二元交叉熵损失函数设置分割模型编码器的损失函数L1:L1=L
BCE
(P1,G)其中,L
BCE
(
·
)代表二元交叉损失函数,P1代表训练集图像的初步预测结果,G代表点标注图像;3b)将训练集图像输入到新建分割模型的编码器中,得到各层图像特征,其中最高层特征经过一个卷积核尺寸为1*1的卷积层,得到单通道图像,再使用双线性上采样恢复到输入图像的尺寸得到训练集图像的初步预测结果P1;3c)使用损失函数L1对分割网络的编码部分进行监督训练,直至损失函数L1收敛,得到训练好的编码器;(4)训练新建分割模型的解码器:4a)构建新的损失函数L
n
:L
n
=(G∪P
n
‑1>0.7+G∪P
n
‑1<0.3)
×
L
BCE
[P
n
,(G∪P
n
‑1)]其中,P
n
是本次训练阶段训练集图像的预测结果,n代表当前所处阶段且n>1,G是点标注图像,P
n
‑1是上个阶段的预测结果,L
BCE
(
·
)代表二元交叉损失函数;4b)将训练集图像输入到已经训练好的编码器中,得到各层图像特征,再将各层特征输入到解码器中,解码器输出单通道图像,即为训练集图像的当前预测结果P
n
;4c)固定编码器参数,使用损失函数L
n
对分割网络的解码部分进行监督训练,直至损失函数L
n
收敛,得到当前的分割模型M
n
;4d)将测试集图像输入到当前的分割模型M
n
中得到的测试集图像的预测结果P
test
,计算当前阶段P
test
与像素级标注图像G
test
的Dice相似系数d
n
,并将本阶段得到的Dice相似系数d
n
与上个阶段得到的Dice相似系数d
n
‑1进行比较:如果d
n
≥d
n
‑1,则保存当前模型参数,返回到步骤4b)开启第n+1个训练阶段;否则,训练结束,将第n

1阶段得到的分割模型M
n
‑1作为最终的细胞核分割模型;(5)将待分割细胞核图像输入到细胞核分割模型中,分割模型输出与输入图像相同尺寸的单通道二值图像,在二值图中,所有值为1的像素组成的区域即为分割出来的目标区域,所有值为0的像素组成的区域为分割出来的背景区域。2.根据权利要求1所述的方法,其中...

【专利技术属性】
技术研发人员:韩冰高路杨铮陈玮铭黄晓悦
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1