一种肺部ct影像特殊组织的标记方法技术

技术编号:19825848 阅读:40 留言:0更新日期:2018-12-19 16:11
本发明专利技术公开了一种肺部ct影像特殊组织的标记方法,包括如下步骤:(1)、样本标记:(2)、设计语义分割模型:以像素分割的方式,在原始图像中标记出特定对象的区域,并依此建立一个U‑Net模型;(3)、特殊组织检测模型的训练:采用图像变换方法,对原始图像和掩模图像同时进行变换,以进行数据增强;(4)、计算模型性能的度量指标:模型性能的度量指标就是Dice系数,起计算公式为:

【技术实现步骤摘要】
一种肺部ct影像特殊组织的标记方法
本专利技术涉及肺部ct影像领域;具体涉及一种肺部ct影像特殊组织的标记方法。
技术介绍
癌症,作为一直以来人类难以降服的恶疾,严重威胁着人类的生命健康。其中,肺癌在所有恶性肿瘤发病及死亡中均占首位。据统计,2012年约有160万人因肺癌死亡,另有180万新增病例被确诊。筛查肺癌对于患者的早期诊断和治疗至关重要,可以通过筛查技术来改善患者预后。肺癌筛查容易出现假阳性,由此会增加不必要的治疗成本,并给患者带来额外的压力。利用针对肺癌的计算机辅助诊断方法,能够为早期癌症筛查提供更全面的覆盖,并降低诊断中的假阳性率。虽然发现肺结节可能并不代表确诊早期肺癌,但肺癌筛查的第一步就是检测肺结节。然而,在CT影像中的肺部,除了以结节代表的疑似肺癌外,还可能包含多种肺部疾病,例如:肺气肿、肺结核等。特别是,长期吸烟人群是多种肺部疾病的高发人群,其肺部很有可能同时存在结节和其它特殊病变组织。这就为准确检测结节,增加了额外的难度。为此,需要专门的模型,对特殊组织进行检测。事实上,当能检测出肺部有很多“奇怪的组织”时,患者罹患癌症的机会会很高。而此时,若结节检测器没有发现任何结节,就会给出阴性的判定,这对医疗诊断有较为负面的影响。
技术实现思路
本专利技术目的在于:为了解决上述
技术介绍
中的现有技术存在的问题,提供一种肺部ct影像特殊组织的标记方法,可以提升肺结节检查准确率。本专利技术解决其技术问题所采用的技术方案是:一种肺部ct影像特殊组织的标记方法,包括如下步骤:(1)、样本标记:LIDC-IDRI肺结节公开数据集和LUNA16肺结节检测竞赛数据集中,用传统方法,标记出肺部ct影像特殊组织样本;(2)、设计语义分割模型:以像素分割的方式,在原始图像中标记出特定对象的区域,并依此建立一个U-Net模型;(3)、特殊组织检测模型的训练:采用图像变换方法,对原始图像和掩模图像同时进行变换,以进行数据增强;其中训练的batchsize为4,优化方法为带动量的SGD,学习率固定为0.001。(4)、计算模型性能的度量指标:模型性能的度量指标就是Dice系数,起计算公式为:优选地:步骤(3)中采用的图像变换方法为随机弹性变换、随机旋转、随机翻转和随机平移。优选地:步骤(3)中对原始图像和掩模图像进行变换时,要使用同样的变换方法和变换参数。与现有技术相比,本专利技术具有以下有益效果:本专利技术首先通过U-Net架构以像素分割的方式,在原始图像中标记出特定对象的区域;其次,通过使用了多种图像变换方法,包括:随机弹性变换、随机旋转、随机翻转和随机平移等对数据进行了增强,避免了用于特殊组织检测的数据集样本较少的问题。最终模型的Dice系数指标能够超过0.8,达到较高的水平。附图说明下面结合附图和实施例对本专利技术进一步说明。图1是非结节特殊组织及其对应标记ct影像图;图2是U-Net模型语义分割模型架构;图3是采用随机旋转变换数据增强后ct影像对比图;图4是特殊组织检测模型训练图。具体实施方式现在结合附图对本专利技术作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本专利技术的基本结构,因此其仅显示与本专利技术有关的构成。一种肺部ct影像特殊组织的标记方法,包括如下步骤:(1)、样本标记:LIDC-IDRI肺结节公开数据集和LUNA16肺结节检测竞赛数据集中,用传统方法,标记出肺部ct影像特殊组织样本;(2)、设计语义分割模型:以像素分割的方式,在原始图像中标记出特定对象的区域,并依此建立一个U-Net模型;(3)、特殊组织检测模型的训练:采用图像变换方法,对原始图像和掩模图像同时进行变换,以进行数据增强;其中训练的batchsize为4,优化方法为带动量的SGD,学习率固定为0.001。(4)、计算模型性能的度量指标:模型性能的度量指标就是Dice系数,起计算公式为:其中:步骤(3)中采用的图像变换方法为随机弹性变换、随机旋转、随机翻转和随机平移。其中:步骤(3)中对原始图像和掩模图像进行变换时,要使用同样的变换方法和变换参数。目前权威性最高,使用最为广泛的数据集及标注方法为LIDC-IDRI肺结节公开数据集(以下简称:LIDC数据)和LUNA16肺结节检测竞赛数据集(以下简称:LUNA16数据)。其中LIDC数据由胸部医学图像文件(如:CT、X光片)和对应的诊断结果病变标注组成。该数据是由美国国家癌症研究所发起收集的,目的是为了研究高危人群早期癌症检测。图像文件为DICOM格式,共收录了1018个研究实例。标注方法分为两个阶段,第一阶段每位医师分别独立诊断并标注病患位置,其中会标注三种类别:1)大于等于3mm的结节,2)小于3mm的结节,3)大于等于3mm的非结节。在随后的第二阶段中,各位医师都分别独立的复审其他三位医师的标注,并给出自己最终的诊断结果。除此以外,标注中还包含检出难度(Subtlety)、分叶特征显著度(Lobulation)、毛刺特征显著度(Spiculation)、结节恶性程度(Malignancy)等多个主观特征。在LUNA16数据集中,大于30mm的结节均未做标记。事实上,该数据集的图像中含有不少肺气肿等特殊组织样本。这些样本面积较大,与周边组织区别较大,很容易分辨。即使自己进行标注,也很容易得到较为准确的结果。而且,针对这一建模需求,已有人标记出了一些非结节特殊组织,并将标记出的子数据集共享了出来。如图1所示,是在LIDC数据和LUNA16数据基础上做出的非结节特殊组织及其对应标记。由于特殊组织也是肺癌检测的重要特征,因此,需要构建特殊组织检测模型,在原始CT切片中,标记出特殊组织区域。我们在此基础上,采用以下方法标注非结节的特殊影像区域。(1)、设计语义分割模型以像素分割的方式,在原始图像中标记出特定对象的区域,是典型的图像语音分割问题。这样的问题广泛存在于医学影像分析中。目前,针对这一问题较好的模型结构是U-Net模型。根据训练数据的特点,这里构建了一个修改版的U-Net,用于完成特殊组织检测任务。具体网络架构如图2所示。(2)特殊组织检测模型的训练由于用于特殊组织检测的数据集样本较少,因此需要做更多的数据增强。这里,使用了多种图像变换方法,包括:随机弹性变换、随机旋转、随机翻转和随机平移。需要注意的是,必须使用同样的变换方法和变换参数,对原始图像和掩模图像同时进行变换,图像和标注才能保持一致。以随机旋转变换为例,如图3所示,是采用随机旋转变换数据增强后ct影像对比图。训练的batchsize为4,优化方法为带动量的SGD,学习率固定为0.001。由于模型需要对每一个像素点进行判断,并与掩模图像比较,这可以视为是两个集合进行比较,并度量两个集合的相似性。Dice系数是一种集合相似度度量函数,通常用于计算两个样本的相似度,其计算公式为:模型性能的度量指标就是Dice系数。训练时的损失函数是负的Dice系数。训练曲线如图4所示,最终,验证集上的Dice系数指标能够超过0.8。设计语义分割模型的U-Net架构的模型也可以通过其他网络实行。但是U-NET具有结构简单,训练时间短,训练参数少等优势。但是与其它网络比,深度略显不足。一般来说,网络深度意味着特征抽象层次的复杂程度。由于这里进行的特殊组本文档来自技高网...

【技术保护点】
1.一种肺部ct影像特殊组织的标记方法,其特征在于,包括如下步骤:(1)、样本标记:LIDC‑IDRI肺结节公开数据集和LUNA16肺结节检测竞赛数据集中,用传统方法,标记出肺部ct影像特殊组织样本;(2)、设计语义分割模型:以像素分割的方式,在原始图像中标记出特定对象的区域,并依此建立一个U‑Net模型;(3)、特殊组织检测模型的训练:采用图像变换方法,对原始图像和掩模图像同时进行变换,以进行数据增强;其中训练的batch size为4,优化方法为带动量的SGD,学习率固定为0.001。(4)、计算模型性能的度量指标:模型性能的度量指标就是Dice系数,起计算公式为:

【技术特征摘要】
1.一种肺部ct影像特殊组织的标记方法,其特征在于,包括如下步骤:(1)、样本标记:LIDC-IDRI肺结节公开数据集和LUNA16肺结节检测竞赛数据集中,用传统方法,标记出肺部ct影像特殊组织样本;(2)、设计语义分割模型:以像素分割的方式,在原始图像中标记出特定对象的区域,并依此建立一个U-Net模型;(3)、特殊组织检测模型的训练:采用图像变换方法,对原始图像和掩模图像同时进行变换,以进行数据增强;其中训练的batchsi...

【专利技术属性】
技术研发人员:邹昊卢树强马鹏程谢苏
申请(专利权)人:清影医疗科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1