当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于自学习神经网络的病理切片中印戒细胞检测方法技术

技术编号:24354845 阅读:94 留言:0更新日期:2020-06-03 02:20
本发明专利技术公开了一种基于自学习神经网络的病理切片中印戒细胞检测方法,包括:(1)建立训练集;(2)构建印戒细胞检测模型:包括分类模块和检测模块;(3)模型训练:训练分类模块时,使用带有阴性样本学习模块的检测网络在原始数据集下进行训练;训练检测模块时,采用自学习训练,将预测的印戒细胞与原始标注的印戒细胞进行融合,得到新的标注数据;(4)印戒细胞检测:首先经过分类模块,判断该病理图片是否属于阴性,如果是阴性,则无需进行检测;如果判断为阳性,则通过检测模块进行印戒细胞检测,输出图中印戒细胞检测框。利用本发明专利技术,可以在训练数据不完全标注的情况下,得到一个具有较高检测精度的模型。

A method of detecting signet ring cells in pathological sections based on self-learning neural network

【技术实现步骤摘要】
一种基于自学习神经网络的病理切片中印戒细胞检测方法
本专利技术属于医疗人工智能领域,尤其是涉及一种基于自学习神经网络的病理切片中印戒细胞检测方法。
技术介绍
对于病理图片的分析检验是诊断筛查消化系统癌症的金标准。数字病理切片由于其能够存储高分辨率的病理图片并且能够随时远程查看的优点,在近些年广泛应用于各大医院。尤其是对于医疗资源匮乏的农村地区来说,影响更为重大,在这些区域由于缺乏有经验的专业病理医师,因此可以将扫描得到的电子切片传输至城市地区,由更为专业的病理医师进行诊断分析。但是人工检验病理切片十分的费时费力,因此也阻碍了大规模的远程数据病理切片检查的应用。因此,使用深度学习中的目标检测模型来对病理切片中的细胞进行自动定位以及分类,那么将有效的减少医生的负担,并且使得远程病理切片检查得以大规模推广,缓解农村区域医疗资源匮乏的问题。近些年深度学习的快速发展,使得深度学习网络能够大规模应用在医疗数据上,特别对于病理切片的快速诊断分析,在深度学习领域,目标检测的主要目的是使用算法自动框选出所要识别的目标所在位置以及对框选的目标进行分类,在病理图像中,使用目标检测网络快速框选细胞位置以及细胞种类,能够大幅度增加诊断速度并减少医生阅片压力。公开号为CN109740626A的中国专利文献公开了一种基于深度学习的乳腺癌病理切片中癌症区域的检测方法,结合乳腺癌病理切片没有固定方向的特点,系统地使用合理的数据增强技术,包括随机裁剪、旋转、左右翻转等几何变换的数据增强技术;同时也使用了随机亮度、锐化等颜色变换的数据增强技术。在训练的时候实时进行数据增强,能够增大数据集的多样性,扩充训练样本集,有效提高分类器的泛化能力;最后用实时过采样方法,来解决数据集的各个类别数据不平衡的问题。印戒细胞癌(SRCC)是一种组织学分型,这种分型最初是源于肿瘤的镜下特征而非其生物学行为,镜下显示肿瘤细胞胞质丰富、充满黏液,核被挤压于胞质一侧呈“印戒”样,因而得名,是一种特殊类型的黏液分泌型腺癌,常发生于胃肠道、乳腺、膀胱及前列腺等部分。由于逐细胞的标注十分费时费力,并且有的区域存在大量的印戒细胞,完整的标注每一个印戒细胞十分困难,因此在很多情况下我们所使用的训练数据是不完全标注的。如何使用不完全标注的训练集训练得到一个接近使用完全标注训练集的算法,仍然是一个较为困难的问题。
技术实现思路
本专利技术提供了一种基于自学习神经网络的病理切片中印戒细胞检测方法,对于印戒细胞检测的召回率和排阴率高。本专利技术的技术方案如下:一种基于自学习神经网络的病理切片中印戒细胞检测方法,其特征在于,包括以下步骤:(1)建立训练集:对病理切片的图片进行归一化预处理后进行标注,将病理切片进行随机切片处理,得到固定大小的小尺寸切片图,并用数据增强方法增加数据集数量,作为训练数据集;(2)构建印戒细胞检测模型:包括分类模块和检测模块,所述的分类模块为带有阴性样本学习模块的检测网络,所述分类模块和检测模块中的检测网络均为以resnet18为骨网络的retinanet;(3)模型训练:训练分类模块时,在训练集下进行训练,遇到阴性样本时,将所有anchor的类别判定为负,使得网络能从阴性图中学习到特征,训练至拟合后停止训练;训练检测模块时,采用自学习训练,第一阶段,使用训练集的原始标注图像对检测网络进行训练直至出现过拟合现象;第二阶段,在训练集上进行预测操作,并且使用数据增强方法,得到更多的未标注印戒细胞,将这些预测到的未标注印戒细胞检测框与原始检测框融合,生成新的训练数据,用于下一阶段检测网络训练;通过使用上述方法进行迭代训练,直到发现召回率不在增加,停止训练;(4)印戒细胞检测:输入未标注的原始病理图片,首先经过分类模块,判断该病理图片是否属于阴性,如果是阴性,则无需进行检测;如果判断为阳性,则通过检测模块进行印戒细胞检测,输出图中印戒细胞检测框。步骤(1)中,所述的归一化预处理为对像素值进行减均值除方差操作。通过这些操作能够提高网络的学习能力,增强鲁棒性。步骤(1)中,所述的随机切片处理为:对于每张原始尺寸2000×2000的图像病理切片,随机裁剪出512×512区域。由于原尺寸太大,无法以原图尺寸放入GPU进行训练,而使用下采样又会破坏印戒细胞的细节信息,因此使用随机切片的方法,该方法能够有效解决上述的显存不够以及信息破坏问题。所述的数据增强方法包括:左右翻转、上下翻转、旋转90°、旋转180°、旋转270°、随机旋转-20°到20°;通过上述数据增强方法的随机组合产生更多的训练数据。数据增强方法能够提升训练数据量,尤其在训练数据量较少的情况下,由于模型强大的学习能力,将会强行拟合训练数据,这样会带来严重的过拟合问题,因此使用数据增强方法提升训练数据量能够极大提升模型的鲁棒性以及准确度,并有效解决过拟合问题。同时,由于阴性样本和阳性样本数量不平衡,阴性样本数量显著多于阳性样本,在数据预处理阶段进行重采样操作,提高阴性样本采样率,使得两类切片数量平衡。步骤(3)中,训练检测模块时,在第一阶段,使用原始训练数据训练检测模块,每个迭代结束后计算在测试集上的指标,监控有效召回率,当有效召回率开始下降时,停止训练。在本专利技术中的所有检测网络均为以resnet18为骨网络的retinanet,resnet18作为骨网络能够缓解标注不完全带来的过拟合现象并且具有一定的学习能力,能够学习印戒细胞以及正常细胞的不同特征。Retinanet作为强大的单阶段网络,能够有效检测印戒细胞,通过回归准确框选印戒细胞位置,通过分类准确区分正常细胞和印戒细胞。所述分类模块和检测模块中的检测网络使用opencv工具在病理图片中框选印戒细胞位置,得到印戒细胞检测框。步骤(4)中,未标注的原始病理图片经过分类模块时,分类模块对病理图片进行预测,统计对整张图预测到的印戒细胞检测框数量,当数量小于5时,判定该病理图片为阴性。在进行印戒细胞检测时,在2000×2000的原始尺寸下,先采用滑动窗口的方法均匀选取9块尺寸为1024×1024的切片,由于会包含重叠预测部分,输入模型后,对每个切片预测的检测框进行记录并将相对坐标转化为绝对坐标,之后使用非最大值抑制算法融合所有预测结果。与现有技术相比,本专利技术具有以下有益效果:1、本专利技术的方法,训练检测模块时,采用自学习的训练方式,对于印戒细胞标注不完全的情况,可以生成新的标注数据用于训练,能够实现极高的召回率。2、本专利技术的方法,构建的印戒细胞检测模型包括分类模块和检测模块,在利用检测模块进行印戒细胞检测之前,先用分类模块判断是否该病理图片是否属于阴性,能够实现极高的排阴率。附图说明图1为本专利技术中印戒细胞检测模型训练时自学习流程图。具体实施方式下面结合附图和实施例对本专利技术做进一步详细描述,需要指出的是,以下所述实施例旨在便于对本专利技术的理解,而对其不起任何限定作用。1)建立训本文档来自技高网
...

【技术保护点】
1.一种基于自学习神经网络的病理切片中印戒细胞检测方法,其特征在于,包括以下步骤:/n(1)建立训练集:对病理切片的图片进行归一化预处理后进行标注,将病理切片进行随机切片处理,得到固定大小的小尺寸切片图,并用数据增强方法增加数据集数量,作为训练数据集;/n(2)构建印戒细胞检测模型:包括分类模块和检测模块,所述的分类模块为带有阴性样本学习模块的检测网络,所述分类模块和检测模块中的检测网络均为以resnet18为骨网络的retinanet;/n(3)模型训练:训练分类模块时,在训练集下进行训练,遇到阴性样本时,将所有anchor的类别判定为负,使得网络能从阴性图中学习到特征,训练至拟合后停止训练;/n训练检测模块时,采用自学习训练,第一阶段,使用训练集的原始标注图像对检测网络进行训练直至出现过拟合现象;第二阶段,在训练集上进行预测操作,并且使用数据增强方法,得到更多的未标注印戒细胞,将这些预测到的未标注印戒细胞检测框与原始检测框融合,生成新的训练数据,用于下一阶段检测网络训练;通过使用上述方法进行迭代训练,直到发现召回率不在增加,停止训练;/n(4)印戒细胞检测:输入未标注的原始病理图片,首先经过分类模块,判断该病理图片是否属于阴性,如果是阴性,则无需进行检测;如果判断为阳性,则通过检测模块进行印戒细胞检测,输出图中印戒细胞检测框。/n...

【技术特征摘要】
1.一种基于自学习神经网络的病理切片中印戒细胞检测方法,其特征在于,包括以下步骤:
(1)建立训练集:对病理切片的图片进行归一化预处理后进行标注,将病理切片进行随机切片处理,得到固定大小的小尺寸切片图,并用数据增强方法增加数据集数量,作为训练数据集;
(2)构建印戒细胞检测模型:包括分类模块和检测模块,所述的分类模块为带有阴性样本学习模块的检测网络,所述分类模块和检测模块中的检测网络均为以resnet18为骨网络的retinanet;
(3)模型训练:训练分类模块时,在训练集下进行训练,遇到阴性样本时,将所有anchor的类别判定为负,使得网络能从阴性图中学习到特征,训练至拟合后停止训练;
训练检测模块时,采用自学习训练,第一阶段,使用训练集的原始标注图像对检测网络进行训练直至出现过拟合现象;第二阶段,在训练集上进行预测操作,并且使用数据增强方法,得到更多的未标注印戒细胞,将这些预测到的未标注印戒细胞检测框与原始检测框融合,生成新的训练数据,用于下一阶段检测网络训练;通过使用上述方法进行迭代训练,直到发现召回率不在增加,停止训练;
(4)印戒细胞检测:输入未标注的原始病理图片,首先经过分类模块,判断该病理图片是否属于阴性,如果是阴性,则无需进行检测;如果判断为阳性,则通过检测模块进行印戒细胞检测,输出图中印戒细胞检测框。


2.根据权利要求1所述的基于自学习神经网络的病理切片中印戒细胞检测方法,其特征在于,步骤(1)中,所述的归一化预处理为对像素值进行减均值除方差操作。


3.根据权利要求1所述的基于自学习神经网络的病理切片中印戒细胞检测方法,其特征...

【专利技术属性】
技术研发人员:应豪超宋庆宇吴健
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1