快速构建心脏冠脉血管识别数据集的方法技术

技术编号:19858701 阅读:39 留言:0更新日期:2018-12-22 11:57
本发明专利技术提供了一种快速构建心脏冠脉血管识别数据集的方法,包括:获取原始图片;在原始图片中标注血管形成粗标注图片;根据粗标图对极少量的原始图片进行像素级标注以形成精标注图片;将精标注图片由三通道图像变成单通道图像;将单通道图像二值化处理并存储为二值化图片;将二值化图片以及其对应的原始图片作为训练数据,对初始网络进行训练,得到第一网络;将所有的原始图片输入到上述第一网络中,得到二值化结果图;基于所述二值化结果图及其对应的粗标注图片生成伪精标注图片;基于原始图片、精标注图片及伪精标注图片建立数据集,以对网络进行训练。该方法在大量减少人工标注成本的同时保证了数据集的质量,且训练速度可以得到明显提升。

【技术实现步骤摘要】
快速构建心脏冠脉血管识别数据集的方法
本专利技术涉及一种构建心脏血管分割数据集的方法,特别是一种能够在较短的时间内、在尽可能的减少人力成本前提下快速构建心脏冠脉血管识别数据集的方法。
技术介绍
人工神经网络是人工智能领域提出的一种运算模型,它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络,以此来解决人工智能领域(如图像识别)中的某些问题。卷积神经网络(ConvolutionalNeuralNetwork,CNN)是人工神经网络的一种,是一种前馈神经网络,人工神经元可以响应周围单元,可以进行大型图像处理,即输入一张图片,卷积神经网络对此图片进行一定的变换,输出得到的结果。网络的输出若要尽可能的接近预测的值,就需要训练网络。训练网络就是卷积神经网络进行自身权重迭代调整的过程。我们给出一个输入和一个期望得到的输出,网络就会比较目前的输出值和期望值,再根据两者的差异情况来更新每一层的参数权重。训练和测试网络需要用到一个拥有大量数据的数据集。数据集应该主要包括原始图片和每张原始图片对应的标签。当一个网络训练完毕时,其中的权重参数会被保存下来,此称为得到一个网络。下一次训练时,可以把得到的网络的权值作为初始化值,直接在这个值上进行调整(如果不设置初始值,一般网络的训练是从随机初始值开始的),此叫做从一个网络训练得到另外一个网络。现有技术中,大多数数据集均为用于通用图像分割训练的数据集,这些数据一般来自于日常生活的照片或者其它具有比较高的可识别度的图片。例如公开号为CN107862695A的专利文献公开了一种基于全卷积神经网络的改进型图像分割训练方法,其首先对训练样本进行数据增强,归一化处理,然后对处理后的样本进行采样切割,并将采样切割后的图像进行分类以实现基于传统卷积神经网络的分类识别训练,然后,将这个分类网络的参数赋值给一种改进型全卷积网络,并将原尺寸的训练样本放入该网络进行训练得到预测概率图,以实现,完对皮肤黑素瘤病变图片的分割。然而,需要被分割和识别血管的心脏冠状动脉的图像和上述可识别度较高的照片具有很大差异,其是用数字减影血管造影技术得到的。数字减影血管造影的基本原理是将注入造影剂前后拍摄的两帧X线图像经数字化输入图像计算机,通过减影、增强和再成像过程来获得纯血管影像,同时实时地显现血管影。这种技术得到的图像分辨率较低、噪声很高。同时,心脏冠状动脉血管的类间差异较小、类内差异很大。这两者决定了造影图像和通用数据集中的图像有非常大的区别。用通用图像数据集训练得到的分割网络不能用于心脏冠脉血管的识别和分割。专利申请号为201810441538.4的专利提供了一种建立训练识别心脏血管类型的卷积神经网络数据集的方法,此方法除了需要具有专业知识的医生对图片中的血管类别和位置进行粗标注以外,还需要掌握标注技术的人对所有图片中的血管类别和位置进行像素级标注,其所耗费的人工成本较高。
技术实现思路
为了克服现有技术的不足,本专利技术提供了一种快速构建心脏冠脉血管识别数据集的方法,该方法在大量减少人工标注成本的同时保证了数据集的质量,基于本专利技术数据集进行训练的人工神经网络效果好于上一个专利(201810441538.4)的数据集,而且训练速度可以得到一个明显的提升。本专利技术解决其技术问题所采用的技术方案是:一种快速构建心脏冠脉血管识别数据集的方法,包括:获取含有心脏冠脉数据的原始图片;按照专业医学的命名规则,在原始图片中使用对应颜色标注当前体位下的血管,存储形成粗标注图片;从原始图片中随机选取一定数量的图片,并根据对应的粗标图对其进行像素级标注以形成精标注图片;识别精标注图片中血管的颜色,将每种颜色存储为对应的唯一标号,使图片由三通道图像变成单通道图像;将单通道图像二值化处理并存储为二值化图片;将二值化图片以及其对应的原始图片作为训练数据,对初始卷积神经网络进行训练,得到一个能够将血管和导丝从背景分离的网络,记为第一网络;将所有的原始图片输入到上述第一网络中,得到二值化结果图;基于所述二值化结果图及其对应的粗标注图片生成伪精标注图片;基于原始图片、精标注图片及伪精标注图片建立训练识别心脏血管的卷积神经网络数据集,以对相应的神经网络进行训练。进一步的,基于所述二值化结果图及其对应的粗标注图片生成伪精标注图片,包括如下步骤:S1:寻找一个二值化结果图上未标记的像素点(记为“此像素点”),判断此像素点在二值化结果图上是否是血管或导丝,若否,则标记此像素点,若是,则进入步骤S2;S2:判断此像素点在相应的粗标注图片上是否是血管,若是,则将粗标注图片上的对应像素值赋予此像素点并标记此像素点,若否则进入步骤S3;S3:获取在粗标注图片上以此像素点所对应的像素点为中心的K*K个像素点,统计这些像素点中属于血管的像素点,若统计结果不存在(所获取的K*K个像素点均不属于血管),则将此像素点在二值化结果图上标注为“不关注血管/漏液”,同时将粗标注图片上的对应像素值赋予此像素点并对此像素点进行标记;若统计结果存在则进入步骤S4;S4:在所获取的K*K个像素点中找出拥有像素点最多的血管类别,并将此血管类别对应的像素值赋给二值化结果图上对应的像素点(即此像素点),同时标记此像素点;S5:重复步骤S1-S4,直至二值化结果图上的像素点均被标记。进一步的,所述原始图片为通过DSA技术提取的静态图片。进一步的,所述体位包括但不限于头位(CRA),足位(CAU),左前斜(LAO),左前斜足位(LAO_CAU),左前斜头位(LAO_CRA),右前斜足位(RAO_CAU),右前斜头位(RAO_CRA)。进一步的,所述从原始图片中随机选取一定数量的图片,根据对应的粗标注图片对其进行像素级标注以形成精标注图片,包括:将粗标注图片中标注的血管,用对应的颜色完全填充,同时单独标出导丝;对于粗标注图片中没有特别标注的血管,以及导丝附近与背景明显不同的阴影,统一标注为不关注血管或漏液,存储后形成精标注图片。进一步的,所述将单通道图像二值化处理并存储为二值化图片,包括:将单通道图像中的血管和导丝显示白色,背景显示黑色,其中,G[i,j]为二值化图片中第i行第j列上像素的值,S[i,j]为单通道图片中第i行第j列上像素值。进一步的,所述基于原始图片、精标注图片及伪精标注图片建立训练识别心脏血管的卷积神经网络数据集,以对相应的神经网络进行训练,包括:将伪精标注图片和对应的原始图片作为训练数据,对所述第一网络进行训练,得到一个能够识别和定位心脏冠脉血管的初始像素级分割网络,记为第二网络,并保存下来;将一定量所述精标注图片和对应的原始图片作为训练数据,输入到所述初始像素级分割网络(即所述第二网络)中进行训练,以对网络进行微调,得到一个精度更高的最终像素级分割网络。本专利技术的积极效果:本专利技术建立了“伪精标注”的获取方法,即基于生成的二值化结果图和标注的带有血管类别和走向的粗标注图生成一个近似精标注图片的伪精标注图片,可以在短时间内大量生产伪精标注图片,从而不需要人工对图片进行精标注。且获得的伪精标注图片和精标注图片类似,所以使用伪精标注图片进行的训练结果不差于使用精标注图片进行训练的结果。与此同时,使用伪精标注图片训练之后再使用极少量真正的精标本文档来自技高网
...

【技术保护点】
1.一种快速构建心脏冠脉血管识别数据集的方法,其特征在于,包括:获取含有心脏冠脉数据的原始图片;按照专业医学的命名规则,在原始图片中使用对应颜色标注当前体位下的血管,存储形成粗标注图片;从原始图片中随机选取一定数量的图片,并根据对应的粗标图对其进行像素级标注以形成精标注图片;识别精标注图片中血管的颜色,将每种颜色存储为对应的唯一标号,使图片由三通道图像变成单通道图像;将单通道图像二值化处理并存储为二值化图片;将二值化图片以及其对应的原始图片作为训练数据,对初始卷积神经网络进行训练,得到一个能够将血管和导丝从背景分离的网络,记为第一网络;将所有的原始图片输入到上述第一网络中,得到二值化结果图;基于所述二值化结果图及其对应的粗标注图片生成伪精标注图片;基于原始图片、精标注图片及伪精标注图片建立训练识别心脏血管的卷积神经网络数据集,以对相应的神经网络进行训练。

【技术特征摘要】
1.一种快速构建心脏冠脉血管识别数据集的方法,其特征在于,包括:获取含有心脏冠脉数据的原始图片;按照专业医学的命名规则,在原始图片中使用对应颜色标注当前体位下的血管,存储形成粗标注图片;从原始图片中随机选取一定数量的图片,并根据对应的粗标图对其进行像素级标注以形成精标注图片;识别精标注图片中血管的颜色,将每种颜色存储为对应的唯一标号,使图片由三通道图像变成单通道图像;将单通道图像二值化处理并存储为二值化图片;将二值化图片以及其对应的原始图片作为训练数据,对初始卷积神经网络进行训练,得到一个能够将血管和导丝从背景分离的网络,记为第一网络;将所有的原始图片输入到上述第一网络中,得到二值化结果图;基于所述二值化结果图及其对应的粗标注图片生成伪精标注图片;基于原始图片、精标注图片及伪精标注图片建立训练识别心脏血管的卷积神经网络数据集,以对相应的神经网络进行训练。2.根据权利要求1所述的一种快速构建心脏冠脉血管识别数据集的方法,其特征在于,所述基于所述二值化结果图及其对应的粗标注图片生成伪精标注图片,包括如下步骤:S1:寻找一个二值化结果图上未标记的像素点,判断此像素点在二值化结果图上是否是血管或导丝,若否,则标记此像素点,若是,则进入步骤S2;S2:判断此像素点在相应的粗标注图片上是否是血管,若是,则将粗标注图片上的对应像素值赋予此像素点并标记此像素点,若否则进入步骤S3;S3:获取在粗标注图片上以此像素点所对应的像素点为中心的K*K个像素点,统计这些像素点中属于血管的像素点,若统计结果不存在(所获取的K*K个像素点均不属于血管),则将此像素点在二值化结果图上标注为“不关注血管/漏液”,同时将粗标注图片上的对应像素值赋予此像素点并对此像素点进行标记;若统计结果存在则进入步骤S4;S4:在所获取的K*K个像素点中找出拥有像素点最多的血管的类别,并将此血管类别对应的像素值赋给二值化结果图上对应的像素点,同...

【专利技术属性】
技术研发人员:徐波翟墨王筱斐陈东浩叶丹
申请(专利权)人:北京红云智胜科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1