基于深度学习的乳腺癌病理切片中癌症区域的检测方法技术

技术编号:21090974 阅读:21 留言:0更新日期:2019-05-11 10:28
本发明专利技术公开了一种基于深度学习的乳腺癌病理切片中癌症区域的检测方法;本发明专利技术结合乳腺癌病理切片没有固定方向的特点,系统地使用合理的数据增强技术,包括随机裁剪、旋转、左右翻转等几何变换的数据增强技术。同时也使用了随机亮度、锐化等颜色变换的数据增强技术。在训练的时候实时进行数据增强,能够增大数据集的多样性,扩充训练样本集,有效提高分类器的泛化能力。最后用实时过采样方法,来解决数据集的各个类别数据不平衡的问题;本发明专利技术针对该数据集切片中各个类别乳腺癌区域大小差别大的特点,系统地使用了类别等概率的实时过采样方法和多种在医疗疾病图像上合理的数据增强方法,解决了数据不平衡和良性、原位癌类别数据量很少的问题。

Detection of Cancer Areas in Pathological Sections of Breast Cancer Based on Deep Learning

【技术实现步骤摘要】
基于深度学习的乳腺癌病理切片中癌症区域的检测方法
本专利技术属于人工智能领域,涉及一种基于深度学习的乳腺癌病理切片中的癌症区域检测方法。
技术介绍
乳腺癌(breastcancer)是一种从乳房组织发展而来的癌症腺癌是乳腺导管上皮细胞发生异常增生,超过自我修复能力而发生的恶性肿瘤。它是一种严重危害女性身心健康的常见恶性疾病,不但危及患者生命,还能造成女性器官的损毁,已成为50岁以上妇女恶性肿瘤致死的主要原因之一。它在临床上表现为微钙化簇和乳腺肿块,早期无症状,具有发病隐匿,愈后差等特点。前哨淋巴结活检术(sentinellymphnodebiopsy,SLNB)是一种安全、精确的手术方式,已逐渐替代腋窝淋巴结清扫术成为早期乳腺癌治疗的标准术式,是评估癌细胞是否沿淋巴管转移扩散和淋巴结分期的金标准。该技术的创伤小,降低术后患者的上肢水肿发病率,减少并发症发生概率,明显改善患者术后的生活质量。活检过程中收集的组织通常用苏木精和曙红(H&E)染色,然后由专家进行分析。病理学家通过前哨淋巴结活检术来评估组织的微观结构和元素,将其分为正常组织,非恶性(良性)和恶性病变,并进行预后评估。在此过程中,评估整个载玻片组织扫描的相关区域。染色增强细胞核(紫色)和细胞质(粉红色),以及其他感兴趣的结构。在分析染色组织时,病理学家分析整个组织结构,以及细胞核组织,密度和变异性。例如,具有浸润癌的组织显示出结构的变形以及更高的核密度和变异性,而在正常组织中,结构得以维持并且细胞核组织良好。据美国癌症协会(AmericanCancerSociety,ACS)研究表明,早期的乳腺癌在癌细胞未扩散的情况下,5年存活率高达98%。早期发现和诊断是降低乳腺癌发病率和死亡率的最有效途径。早预防、早发现、早诊断、早治疗,是乳腺癌防治的关键。在乳腺癌诊断中,常用的方法有触诊式诊断、组织学诊断、细胞学诊断、影像学诊断等。这些诊断方法比较复杂,实际使用时一般都需要依靠人工手动操作完成,且这些人工提取特征的方法易导致部分特征信息的丢失,使得诊断识别性能不太理想,在准确率、漏检率上都存在不足。为解决现有技术中的缺点和不足,本专利技术提出一种基于深度学习的乳腺癌病理切片中癌症区域的检测方法,将深度学习与病理切片图像识别相结合,辅助医生诊断乳腺癌。本专利技术所采用的癌症区域检测方法包括如下步骤:步骤一、数据预处理,使用灰度阈值方法提取数据集切片中的组织部分,用于后续裁剪合理的目标检测区域;所述的数据集为乳腺癌病理切片;步骤二、将原始的乳腺癌病理切片分为训练样本、验证样本和测试样本,再使用网格裁剪方法,从切片的组织区域中裁剪相同大小的图片样本,并缩小图片的尺寸为原尺寸的1/3;步骤三、将训练样本和验证样本分别放在分类的数据文件中,在训练过程中,针对数据集合中的正负样本不均衡问题,使用等概率采样的实时过采样方法来解决,针对数据集合中的有些类别样本数量少的问题,使用随机裁剪、旋转、翻转和颜色增强方法来解决;步骤四、将采样出来的样本依次放入卷积神经网络中进行训练,卷积神经网络采用使用Inception和Resnet原则设计构造的Inception-Resnet-v2网络;步骤五、通过带标签的数据训练,误差自顶向下传输,对每一层的参数进行微调,将网络的训练结果和在验证集合上的运行准确率进行可视化实时显示,根据验证集合上的准确值和损失值曲线进行网络微调;步骤六、设定运行多个代数后,至验证集的准确率达到最高;保存所有训练过程中的参数和模型,训练过程结束后将测试样本输送到网络中,进行无标签图像预测分类,预测测试图像并计算代表相应分类可能性;最后输出为正常组织、良性、原位癌和浸润癌,把预测样本结果合成一张切片大小的图像就是最后的切片癌症区域检测结果。本专利技术的有益效果:1)本专利技术提出的自动化乳腺癌病理切片癌症区域检测系统可以辅助病理医生诊断乳腺癌,减轻医生压力,减小人工误差,充分发挥了深度学习的自我学习的优势,利用深层网络提取到增强型的高级特征,实验结果表明我们学习到的特征具有更高的区分性;2)该系统还结合乳腺癌诊断的特点,原位癌和浸润癌的区分需要更多关于组织的信息,根据该特点使用了缩放的方法和Inception结构,充分整合组织的信息,提高了分类的准确性;3)针对该数据集切片中各个类别乳腺癌区域大小差别大的特点,系统地使用了类别等概率的实时过采样方法和多种在医疗疾病图像上合理的数据增强方法,解决了数据不平衡和良性、原位癌类别数据量很少的问题。附图说明图1是本专利技术基于深度学习的乳腺癌癌症区域检测方法的基本流程图。图2是部分深度学习网络结构图;图3(A)是原始的病理切片;图3(B)是医生标注的癌症区域;图3(C)是采用本专利技术的癌症区域标注结果。具体实施方式本专利技术采用一个Inception-Resnet深度卷积神经网络来完成该4分类任务。该网络先用小尺寸卷积核进行检测卷积和池化方法来减小计算量。接下来是一个卷积组和多个残差卷积组的串联,用来实现多尺度的特征提取,同时使用残差方法可以减小优化难度,加快训练速度,最重要的作用是能够让网络从深度中得到足够的增益效果。网络的最后是全局平均池化,不仅可以用来减小计算量,还可以起到正则化的效果,提高模型的在实际使用中的准确率。如图1所示,以下举例说明本专利技术整个过程的具体实施方式如下:1、利用国际图像分析和识别会议(ICIAR)数据库2018年对乳腺癌病理切片癌症区域检测挑战公开的10张标记好的训练集乳腺癌病理切片图像和20张作为测试集的切片图像,此数据从国际上领先的医学研究所收集,且由多名病理学家标注。训练方式为带标签的数据进行有监督的学习;2、对病理切片图像通过灰度阈值方法提取其中的组织区域,首先把图像的颜色空间从RGB转换到HSV空间,设置固定的阈值,提取出组织区域;3、在乳腺癌病理切片的组织区域上通过网格裁剪出需要的样本,同时针对样本图像小,不能容纳足够的组织信息的特点,使用缩放方法,把样本图像缩小3倍,包含了足够的信息来进行接下来的网络模型中的分类操作;4、输入层中,针对良性和原位癌样本小的特点,首先结合乳腺癌病理切片没有固定方向的特点,系统地使用合理的数据增强技术,包括随机裁剪、旋转、左右翻转等几何变换的数据增强技术。同时也使用了随机亮度、锐化等颜色变换的数据增强技术。在训练的时候实时进行数据增强,能够增大数据集的多样性,扩充训练样本集,有效提高分类器的泛化能力。最后用类别等概率的实时过采样方法,来解决数据集的各个类别数据不平衡的问题;5、采用动量优化方法进行权重参数和偏移量的调整,模拟物理里动量,积累之前的动量来替代真正的梯度。下降初期时,使用上一次参数更新,下降方向一致,能够进行很好的加速,下降中后期时,在局部最小值来回振荡的时候,使得更新幅度增大,跳出陷阱,在梯度改变方向的时候,能够在相关方向加速梯度下降,抑制振荡,从而加快收敛;6、将训练好的各层中的权重参数矩阵和偏移量,对应地赋值给网络中的各层,则该网络具有乳腺癌的特征提取和识别的功能。最后对测试集的样本进行预测分类,将结果对应合并,最后结果过程如图3(A)~(C)所示。如图2所示,本专利技术在实施过程中构建的神经网络,主要由卷积组、残差模块和分类器三个部分构本文档来自技高网...

【技术保护点】
1.基于深度学习的乳腺癌病理切片中癌症区域的检测方法,其特征在于,该方法具体包括以下步骤:步骤一、数据预处理,使用灰度阈值方法提取数据集切片中的组织部分,用于后续裁剪合理的目标检测区域;所述的数据集为乳腺癌病理切片;步骤二、将原始的乳腺癌病理切片分为训练样本、验证样本和测试样本,再使用网格裁剪方法,从切片的组织区域中裁剪相同大小的图片样本,并缩小图片的尺寸为原尺寸的1/3;步骤三、将训练样本和验证样本分别放在分类的数据文件中,在训练过程中,针对数据集合中的正负样本不均衡问题,使用等概率采样的实时过采样方法来解决,针对数据集合中的有些类别样本数量少的问题,使用随机裁剪、旋转、翻转和颜色增强方法来解决;步骤四、将采样出来的样本依次放入卷积神经网络中进行训练,卷积神经网络采用使用Inception和Resnet原则设计构造的Inception‑Resnet‑v2网络;步骤五、通过带标签的数据训练,误差自顶向下传输,对每一层的参数进行微调,将网络的训练结果和在验证集合上的运行准确率进行可视化实时显示,根据验证集合上的准确值和损失值曲线进行网络微调;步骤六、设定运行多个代数后,至验证集的准确率达到最高;保存所有训练过程中的参数和模型,训练过程结束后将测试样本输送到网络中,进行无标签图像预测分类,预测测试图像并计算代表相应分类可能性;最后输出为正常组织、良性、原位癌和浸润癌,把预测样本结果合成一张切片大小的图像就是最后的切片癌症区域检测结果。...

【技术特征摘要】
1.基于深度学习的乳腺癌病理切片中癌症区域的检测方法,其特征在于,该方法具体包括以下步骤:步骤一、数据预处理,使用灰度阈值方法提取数据集切片中的组织部分,用于后续裁剪合理的目标检测区域;所述的数据集为乳腺癌病理切片;步骤二、将原始的乳腺癌病理切片分为训练样本、验证样本和测试样本,再使用网格裁剪方法,从切片的组织区域中裁剪相同大小的图片样本,并缩小图片的尺寸为原尺寸的1/3;步骤三、将训练样本和验证样本分别放在分类的数据文件中,在训练过程中,针对数据集合中的正负样本不均衡问题,使用等概率采样的实时过采样方法来解决,针对数据集合中的有些类别样本数量少的问题,使用随机裁剪、旋转、翻转和颜色增强方法来解决;步骤四、将采样出来...

【专利技术属性】
技术研发人员:郑先斐丁隆乾孙玲玲
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1