一种基于卷积神经网络的图像识别方法技术

技术编号:20918470 阅读:17 留言:0更新日期:2019-04-20 10:06
本发明专利技术提供了一种基于卷积神经网络的图像识别方法,包括以下步骤:S100、标注:为断面图的每个分区赋唯一值Labelj,为断面图中的异物区赋唯一值Labelm,S200,获取训练集:选取同一目标物的M个标注后的断面图依序排列并层叠得到目标物的立体图集,将立体图集作为一个训练样本,收集若干个训练样本组成训练集;S300、构建卷积神经网络;S400、将所述训练集输入所述卷积神经网络中进行训练,得到卷积神经网络分类模型。这种基于卷积神经网络的图像识别方法将标注后的多张断面图按序层叠后作为训练样本对卷积神经网络进行训练,得到能够根据CT图得到异物所处位置的卷积神经网络分类模型,这种卷积神经网络分类模型能够辅助医生高效准确的判断出异物所在位置。

An Image Recognition Method Based on Convolutional Neural Network

The invention provides an image recognition method based on convolution neural network, which includes the following steps: S100, labeling: assigning a unique value Labelj to each section of the cross-sectional map, assigning a unique value Labelm and S200 to the foreign body area in the cross-sectional map, and obtaining a training set: selecting M labeled cross-sectional maps of the same object, arranging and overlapping them in sequence to obtain the stereo set of the object, and then obtaining the stereo set. As a training sample, several training samples are collected to form a training set; S300, convolution neural network is constructed; S400, the training set is input into the convolution neural network for training, and the classification model of convolution neural network is obtained. This method of image recognition based on convolution neural network trains the convolution neural network by stacking the labeled multi-section maps in sequence as training samples, and obtains a convolution neural network classification model which can get the location of foreign bodies according to CT maps. This convolution neural network classification model can assist doctors to judge the location of foreign bodies efficiently and accurately.

【技术实现步骤摘要】
一种基于卷积神经网络的图像识别方法
本专利技术涉及基于深度学习的图片识别方法,尤其涉及一种基于卷积神经网络的图像识别方法。
技术介绍
CT(ComputedTomography),即电子计算机断层扫描,它是利用精确准直的X线束、γ射线、超声波等,与灵敏度极高的探测器一同围绕人体的某一部位作一个接一个的断面扫描,具有扫描时间快,图像清晰等特点,可用于多种疾病的检查;根据所采用的射线不同可分为:X射线CT(X-CT)、超声CT(UCT)以及γ射线CT(γ-CT)等。通过CT扫描获得若干张连续的二维的断面图,医生通过对这些断面图进行观察,从而找到病症所在。由于人的器官是立体的,当器官中出现异物(例如肿瘤、肺结节等),医生可能需要观察较多数量的断面图后才能找到异物的所在部位。有些器官例如肺部,是一种可以分为18段的结构,当肺部产生异物时,目前对于CT图的处理方法只能定位异物的具体坐标,并不能直接得到异物产生在肺部的哪个段中;对于医生来说,异物的具体坐标对于病情的诊断并没有多大意义,医生仍然需要对断面图进行观察才能得知异物产生的位置;而且并不是每张肺部的断面图都包含18个段,除非是经验非常丰富的医生,否则很难又快有准的区分出肺部的每一段,这也给诊断的过程造成了很大的阻碍。
技术实现思路
本专利技术要解决的技术问题是:为了解决现有技术中缺乏高效准确的从CT图中得到异物所处器官部位的方法,本专利技术提供了一种基于卷积神经网络的图像识别方法来解决上述问题。本专利技术解决其技术问题所采用的技术方案是:一种基于卷积神经网络的图像识别方法,包括以下步骤:S100、标注:为断面图的每个分区赋唯一值Labelj,为断面图中的异物区赋唯一值Labelm,其中j为1~n,n为目标物具有的分区数量,所述分区内每个像素的灰度值为Labelj,所述异物区内每个像素的灰度值为Labelm;S200,获取训练集:选取同一目标物的M个标注后的断面图依序排列并层叠得到目标物的立体图集,将立体图集作为一个训练样本,收集若干个训练样本组成训练集;S300、构建卷积神经网络;S400、将所述训练集输入所述卷积神经网络中进行训练,得到卷积神经网络分类模型。作为优选,还包括步骤,DICOM格式的CT断面图转换成维度为512*512*1并且格式为PNG的所述断面图。作为优选,在所述步骤S200中,以某一张断面图为中心上下各取10张断片图层叠得到维度为512*512*21的立体图集,通过reshape函数调整立体图集的维度成128*128*21。作为优选,所述卷积神经网络依次包括输入层、第一卷积层、第一ReLU层、第一池化层、第二卷积层、第二ReLU层、第二池化层、第三卷积层、第三ReLU层、第三池化层、第一全连接层、第二全连接层和输出层;在所述步骤S400中包括以下步骤:S401、在第一卷积层中,维度为128*128*21的立体图集通过64个3*3*21的卷积核进行卷积,步数为1,补零之后得到128*128*64的三维特征图;S402、第一ReLU层中,通过函数ReLU对三维特征图进行非线性映射;S403、重复一次步骤S401和一次步骤S402;S404、在第一池化层中,128*128*64的三维特征图经过2*2的最大池化,步数为2,得到64*64*64的三维特征图;S405、在第二卷积层中,64*64*64的三维特征图通过128个3*3*64的卷积核进行卷积,步数为1,补零之后得到64*64*128的三维特征图;S406、第二ReLU层中,通过函数ReLU对三维特征图进行非线性映射;S407、重复两次步骤S405和两次步骤S406;S408、在第二池化层中,64*64*128的三维特征图经过2*2的最大池化,步数为2,得到32*32*128的三维特征图;S409、第三卷积层中,32*32*128的三维特征图通过256个3*3*128的卷积核进行卷积,步数为1,补零之后得到32*32*256的三维特征图;;S410、第三ReLU层中,通过函数ReLU对三维特征图进行非线性映射;S411、重复两次步骤S409和两次步骤S410;S412、在第三池化层中,32*32*256的三维特征图经过2*2的最大池化,得到16*16*256的三维特征图;S413、在第一全连接层中,将16*16*256的三维特征图转换为1000维的特征向量V1;S414、在第二全连接层中,将1000维的特征向量V1转换为18维的特征向量V2;S415、在输出层,利用Softmax函数归一化所述特征向量V2,得到特征向量S;S416、将特征向量S作为预测值与真实值Y输入交叉熵中计算残差Loss,根据残差Loss反向传播,更新卷积核的权值。本专利技术的有益效果是,这种基于卷积神经网络的图像识别方法将标注后的多张断面图按序层叠后作为训练样本对卷积神经网络进行训练,得到能够根据CT图得到异物所处位置的卷积神经网络分类模型,这种卷积神经网络分类模型能够辅助医生高效准确的判断出异物所在位置。附图说明下面结合附图和实施例对本专利技术进一步说明。图1是一种基于卷积神经网络的图像识别方法的实施例的流程图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本专利技术的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。此外,在本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本专利技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本专利技术的实施例所属
的技术人员所理解。以为了确定肺部中肺结节的位置举例,提供一种基于卷积神经网络的图像识别方法的实施例,如图1所示,包括以下步骤:S01、通过对某位患者进行CT扫描获取一组包含若干张连续CT断面图的原始图集,CT断面图的格式为DICOM,把这些CT断面图转换成维度为512*512*1并且格式为PNG的断面图;S100、标注:为本文档来自技高网
...

【技术保护点】
1.一种基于卷积神经网络的图像识别方法,其特征在于,包括以下步骤:S100、标注:为断面图的每个分区赋唯一值Labelj,为断面图中的异物区赋唯一值Labelm,其中j为1~n,n为目标物具有的分区数量,所述分区内每个像素的灰度值为Labelj,所述异物区内每个像素的灰度值为Labelm;S200,获取训练集:选取同一目标物的M个标注后的断面图依序排列并层叠得到目标物的立体图集,将立体图集作为一个训练样本,收集若干个训练样本组成训练集;S300、构建卷积神经网络;S400、将所述训练集输入所述卷积神经网络中进行训练,得到卷积神经网络分类模型。

【技术特征摘要】
1.一种基于卷积神经网络的图像识别方法,其特征在于,包括以下步骤:S100、标注:为断面图的每个分区赋唯一值Labelj,为断面图中的异物区赋唯一值Labelm,其中j为1~n,n为目标物具有的分区数量,所述分区内每个像素的灰度值为Labelj,所述异物区内每个像素的灰度值为Labelm;S200,获取训练集:选取同一目标物的M个标注后的断面图依序排列并层叠得到目标物的立体图集,将立体图集作为一个训练样本,收集若干个训练样本组成训练集;S300、构建卷积神经网络;S400、将所述训练集输入所述卷积神经网络中进行训练,得到卷积神经网络分类模型。2.如权利要求1所述的一种基于卷积神经网络的图像识别方法,其特征在于,还包括步骤,DICOM格式的CT断面图转换成维度为512*512*1并且格式为PNG的所述断面图。3.如权利要求2所述的一种基于卷积神经网络的图像识别方法,其特征在于:在所述步骤S200中,以某一张断面图为中心上下各取10张断片图层叠得到维度为512*512*21的立体图集,通过reshape函数调整立体图集的维度成128*128*21。4.如权利要求3所述的一种基于卷积神经网络的图像识别方法,其特征在于:所述卷积神经网络依次包括输入层、第一卷积层、第一ReLU层、第一池化层、第二卷积层、第二ReLU层、第二池化层、第三卷积层、第三ReLU层、第三池化层、第一全连接层、第二全连接层和输出层;在所述步骤S400中包括以下步骤:S401、在第一卷积层中,维度为128*128*21的立体图集通过64个3*3*21的卷积核进行卷积,步数为1,补零之后得到128*128*64的三维特征图...

【专利技术属性】
技术研发人员:张恒瑜包勇文耀锋
申请(专利权)人:浙江大学常州工业技术研究院
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1