基于多视野卷积神经网络的影像特征识别方法技术

技术编号:15640467 阅读:100 留言:0更新日期:2017-06-16 06:06
本发明专利技术公开了一种基于多视野卷积神经网络的影像特征识别方法,包括:收集历史数据库中的带有正负标签的CT影像,建立数据集;利用图像分割算法判断数据集中每一CT影像中所标定特征的位置区域,提取不同像素大小的敏感区域;构建多视野卷积神经网络;将提取的不同像素大小的敏感区域作为样本输入至多视野卷积神经网络,并对多视野卷积神经网络进行训练,获得训练好的多视野卷积神经网络;采用对待识别的CT影像进行处理,将提取到的不同像素大小的敏感区域输入到训练好的多视野卷积神经网络中进行特征识别,根据识别结果来确定待识别CT影像的正负标签。上述方案不仅实现了端到端的图像识别,而且还确保了识别精确度。

【技术实现步骤摘要】
基于多视野卷积神经网络的影像特征识别方法
本专利技术涉及CT影像匹配识别
,尤其涉及一种基于多视野卷积神经网络的影像特征识别方法。
技术介绍
目前,用于图像自动分类的大多数方法并不是端到端的,这意味着在匹配识别之前还需要用预定义的滤波器提取特征(如方向梯度直方图,本地二进制模式等)或手动提取图像的特征(如几何、纹理、外观等)。特征学习是直接从训练数据中直接学习的高阶表征。人工神经网络(ANN)从原始的数据中学习到特征,然而,由于传统的人工神经网络的全连接和浅层网络结构,无法提取独立性强的高阶特征,严重限制了实际图像数据的应用。深度卷积神经网络(DNN)是一种快速的,可扩展的,端到端的学习框架,推进计算机视觉的快速发展。基于卷积神经网络(CNN)的车型分类、定位、语义分割和动作识别已达到目前最先进的水平。但是,目前还没有较为完善的用于CT影像识别的CNN技术。
技术实现思路
本专利技术的目的是提供一种基于多视野卷积神经网络的特征识别方法,不仅实现了端到端的影像识别,而且还确保了识别精确度。本专利技术的目的是通过以下技术方案实现的:一种基于多视野卷积神经网络的影像特征识别方法,包括:步骤一、收集历史数据库中的带有正负标签的CT影像,建立数据集;步骤二、利用图像分割算法判断数据集中每一CT影像中所标定特征的位置区域,提取不同像素大小的敏感区域;步骤三、构建多视野卷积神经网络,网络构架包括:相互交替的卷积层与池化层,后接一个全连接层,最后的输出层是Softmax分类器;步骤四、将提取的不同像素大小的敏感区域作为样本输入至多视野卷积神经网络,并对多视野卷积神经网络进行训练,获得训练好的多视野卷积神经网络;步骤五、采用步骤二的方式对待识别的CT影像进行处理,将提取到的不同像素大小的敏感区域输入到训练好的多视野卷积神经网络中进行特征识别,根据识别结果来确定待识别CT影像的正负标签。所述提取不同像素大小的敏感区域包括:判断出CT影像中所标定特征的位置区域,所标定特征即用于特征识别的特征,再从中提取S个像素大小分别为M1,M2,…,MS的敏感区域。所述对多视野卷积神经网络进行训练包括:随机初始化各层参数,包括:卷积层的卷积核,全连接层的权重矩阵与偏置向量以及Softmax分类器的参数,并进行前向传播;权值更新:基于前向传播各层的输出以及训练集的标签进行逐层反向传播,确定各层参数,完成对整个多视角神经网络有监督的训练;微调网络参数:利用Dropout技术对整个网络进行微调;选择模型超参:将步骤二中得到的敏感区域随机均分为N份,利用N折交叉验证技术,选择使得模型泛化性能最好的超参。前向传播包括:第一层为卷积层C1,其表达式为:其中,X为输入的样本,表示卷积层C1的第i个特征向量的输入,表示卷积层C1第i个卷积核,valid表示conv所表示的卷积运算是窄卷积运算,表示连接输入层和卷积层C1的偏置向量,表示卷积层C1第i个特征向量的激活值,f为卷积层的激活函数;第二层是池化层S2,其表达式为:其中,表示池化层S2第i个特征向量的输入,表示池化层S2第i个特征向量的激活值,down表示下采样,表示池化层S2下采样操作的系数,表示连接卷积层C1和池化层S2的偏置向量;第三层是卷积层C3,其表达式为:其中,表示卷积层C3第i个特征向量的输入,表示卷积层C3第i个卷积核,*表示卷积运算,表示卷积层C3第i个特征向量的激活值,表示连接池化层S2和卷积层C3的偏置向量,表示池化层S2的输出;第四层为池化层S4,其表达式为:其中,表示池化层S4第i个特征向量的输入,表示池化层S4池化操作的系数,表示第4层第i个特征向量的激活值表示连接输入层和池化层S4的偏置向量;第五层为全连接层,将顺序展开成向量,并有序连接成一个长向量,作为Softmax分类器的输入;其表达式为:其中,池化层S4的输出,表示全连接层第i个特征向量的激活值;第六层为Softmax分类器,其表达式为:其中,θj表示该层的参数,P(yi=j|xi;θ)表示Softmax分类器输出概率,yi表示Softmax分类器的分类结果,J(θ)表示目标函数,m表示样本个数,k表示类别数,表示该层参数矩阵的转置,θij表示全连接层和Softmax分类器之间的系数矩阵,xi表示所给定的样本i,θc表示连接全连接FC层和第c个类别输出器的参数,是权重衰减项,表示权重衰减项系数。反向传播包括:Softmax分类器的反向传播:θj=θj-α▽θJ(θ)其中,m表示样本个数;δ(6)表示反向传播中根据Softmax层计算的残差项,α表示网络学习率;全连接层的反向传播:将δ(6)依照前向传播的规格进行拆分,其表达式为:δ(5)=inconcatenate(δ(6));卷积层的反向传播:其中,s=1,3,up表示上采样运算,(*)st表示遍历*的所有元素,表示所连接的池化层S2中中相关的元素构成的矩阵。池化层的反向传播:其中,q=2,4,full表示宽卷积运算。利用Dropout技术对整个网络进行微调包括:每m个样本为一个批次做梯度下降,每次梯度下降的时候每个隐藏节点以概率P1随机忽略;每个输入节点以概率P2随机忽略;在测试的时候,输入层与卷积层之间的权重乘以(1-P2),其他层的权重乘以(1-P1)。所述将步骤二中得到的敏感区域随机均分为N份,利用N折交叉验证技术,选择使得模型泛化性能最好的超参包括:首先固定超参,然后把步骤二中得到的敏感区域随机均分为N份,将第1份作为验证集,剩下的N-1份作为训练集,对多视野卷积神经网络进行训练;将验证集数据输入到训练后的多视野卷积神经网络里面,得到多视野卷积神经网络的识别准确率;再将第2份最为验证集,剩下的N-1份作为训练集,对多视野卷积神经网络进行训练,将验证集数据输入到训练后的多视野卷积神经网络里面,得到第二个多视野卷积神经网络的识别准确率;如此重复N次,得到N个识别准确率,对这N个识别准确率进行平均,得到在这组超参下所训练出来的多视野卷积神经网络的识别准确率;然后换一组超参,重复上述步骤,选出使得识别准确率最高的超参组合作为最终对于超参的设定。所述根据识别结果来确定待识别CT影像的正负标签包括:若待识别CT影像中的特征与带有正标签的CT影像中标定特征匹配,则确定待识别CT影像为正标签;若待识别CT影像中的特征与带有负标签的CT影像中标定特征匹配,则确定待识别CT影像为负标签。由上述本专利技术提供的技术方案可以看出,采用端到端的图像处理方式,避免了繁琐的预处理过程;此外,还以深度学习为基础,构建多视野的卷积神经网络,以所标定特征的多个视野为输入,达到更高识别精确度。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。图1为本专利技术实施例提供的一种基于多视野卷积神经网络的影像特征识别方法的流程图。具体实施方式下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术的实施例,本领域普本文档来自技高网...
基于多视野卷积神经网络的影像特征识别方法

【技术保护点】
一种基于多视野卷积神经网络的影像特征识别方法,其特征在于,包括:步骤一、收集历史数据库中的带有正负标签的CT影像,建立数据集;步骤二、利用图像分割算法判断数据集中每一CT影像中所标定特征的位置区域,提取不同像素大小的敏感区域;步骤三、构建多视野卷积神经网络,网络构架包括:相互交替的卷积层与池化层,后接一个全连接层,最后的输出层是Softmax分类器;步骤四、将提取的不同像素大小的敏感区域作为样本输入至多视野卷积神经网络,并对多视野卷积神经网络进行训练,获得训练好的多视野卷积神经网络;步骤五、采用步骤二的方式对待识别的CT影像进行处理,将提取到的不同像素大小的敏感区域输入到训练好的多视野卷积神经网络中进行特征识别,根据识别结果来确定待识别CT影像的正负标签。

【技术特征摘要】
1.一种基于多视野卷积神经网络的影像特征识别方法,其特征在于,包括:步骤一、收集历史数据库中的带有正负标签的CT影像,建立数据集;步骤二、利用图像分割算法判断数据集中每一CT影像中所标定特征的位置区域,提取不同像素大小的敏感区域;步骤三、构建多视野卷积神经网络,网络构架包括:相互交替的卷积层与池化层,后接一个全连接层,最后的输出层是Softmax分类器;步骤四、将提取的不同像素大小的敏感区域作为样本输入至多视野卷积神经网络,并对多视野卷积神经网络进行训练,获得训练好的多视野卷积神经网络;步骤五、采用步骤二的方式对待识别的CT影像进行处理,将提取到的不同像素大小的敏感区域输入到训练好的多视野卷积神经网络中进行特征识别,根据识别结果来确定待识别CT影像的正负标签。2.根据权利要求1所述的一种基于多视野卷积神经网络的影像特征识别方法,其特征在于,所述提取不同像素大小的敏感区域包括:判断出CT影像中所标定特征的位置区域,所标定特征即用于特征识别的特征,再从中提取S个像素大小分别为M1,M2,…,MS的敏感区域。3.根据权利要求1所述的一种基于多视野卷积神经网络的影像特征识别方法,其特征在于,所述对多视野卷积神经网络进行训练包括:随机初始化各层参数,包括:卷积层的卷积核,全连接层的权重矩阵与偏置向量以及Softmax分类器的参数,并进行前向传播;权值更新:基于前向传播各层的输出以及训练集的标签进行逐层反向传播,确定各层参数,完成对整个多视角神经网络有监督的训练;微调网络参数:利用Dropout技术对整个网络进行微调;选择模型超参:将步骤二中得到的敏感区域随机均分为N份,利用N折交叉验证技术,选择使得模型泛化性能最好的超参。4.根据权利要求3所述的一种基于多视野卷积神经网络的影像特征识别方法,其特征在于,前向传播包括:第一层为卷积层C1,其表达式为:其中,X为输入的样本,表示卷积层C1的第i个特征向量的输入,表示卷积层C1第i个卷积核,valid表示conv所表示的卷积运算是窄卷积运算,表示连接输入层和卷积层C1的偏置向量,表示卷积层C1第i个特征向量的激活值,f为卷积层的激活函数;第二层是池化层S2,其表达式为:其中,表示池化层S2第i个特征向量的输入,表示池化层S2第i个特征向量的激活值,down表示下采样,表示池化层S2下采样操作的系数,表示连接卷积层C1和池化层S2的偏置向量;第三层是卷积层C3,其表达式为:其中,表示卷积层C3第i个特征向量的输入,表示卷积层C3第i个卷积核,*表示卷积运算,表示卷积层C3第i个特征向量的激活值,表示连接池化层S2和卷积层C3的偏置向量,表示池化层S2的输出;第四层为池化层S4,其表达式为:其中,表示池化层S4第i个特征向量的输入,表示池化层S4池化操作的系数,表示第4层第i个特征向量的激活值表示连接输入层和池化层S4的偏置向量;第五层为全连接层,将顺序展开成向量,并有序连接成一个长向量,作为Softmax分类器的输入;其表达式为:其中,池化层S4的输出,表示全连接层第i个特征向量的激活值;第六层为Softmax分类器,其表达式为:

【专利技术属性】
技术研发人员:刘达刘奎侯蓓蓓
申请(专利权)人:北京柏惠维康科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1