【技术实现步骤摘要】
一种基于卷积神经网络的图像识别方法
本专利技术涉及一种基于卷积神经网络的图像识别方法,属于计算机视觉和深度学习
技术介绍
人的大脑总是不断地接收信息,且能够记住并在以后接收的同时立刻识别出来,神经网络就是根据人脑的神经结构所提出的,并且在图像识别领域取得了很大的进展。20世纪60年代,Hubel和Wiesel在研究猫脑皮层时,发现用于局部敏感和方向选择的神经元时,可以有效地降低反馈神经网络的复杂性,继而提出了卷积神经网络(ConvolutionalNeuralNetworks,CNN)。后来,卷积神经网络越来越多地被应用在图像识别领域,比如人脸识别和手写数字识别,而且都取得了不错的成绩。直到2012年10月,Hinton教授和他的学生们在著名的ImageNet问题上采用了卷积神经网络模型,象征着卷积神经网络在图像识别领域取得了突破性的研究。现阶段,图像识别主要包括两个阶段,即“特征提取”和“分类识别”。特征提取阶段总是不可避免的丢失一些图像信息,如果图像本身含有大量噪声,那么提取的特征往往不够准确。随着深度学习的发展,如今的图像识别的效率也在不断地提高。 ...
【技术保护点】
一种基于卷积神经网络的图像识别方法,其特征在于,包括以下几个步骤:a、获取原始图像;b、对所述原始图像进行预处理;c、将预处理后的图像输入卷积神经网络中的第一个卷积层,再将结果输入到池化层;d、将上一层的输出结果输入到卷积神经网络中的子网络;e、将上一层的输出结果输入到卷积神经网络中交替分布的卷积层和池化层;f、将上一层的输出结果输入到卷积神经网络中的全连接层;g、将上一层的输出结果输入到卷积神经网络中的最后一层,即Softmax层,得到图像属于各个类别的概率;h、根据图像属于各个类别的概率,得出图像分类结果,最后输出图像分类结果。
【技术特征摘要】
1.一种基于卷积神经网络的图像识别方法,其特征在于,包括以下几个步骤:a、获取原始图像;b、对所述原始图像进行预处理;c、将预处理后的图像输入卷积神经网络中的第一个卷积层,再将结果输入到池化层;d、将上一层的输出结果输入到卷积神经网络中的子网络;e、将上一层的输出结果输入到卷积神经网络中交替分布的卷积层和池化层;f、将上一层的输出结果输入到卷积神经网络中的全连接层;g、将上一层的输出结果输入到卷积神经网络中的最后一层,即Softmax层,得到图像属于各个类别的概率;h、根据图像属于各个类别的概率,得出图像分类结果,最后输出图像分类结果。2.根据权利要求1所述的基于卷积神经网络的图像识别方法,其特征在于,步骤b中,所述预处理的方法即原始图像的每个位置上的像素值减去均值RGB。3.根据权利要求1所述的基于卷积神经网络的图像识别方法,其特征在于,步骤c中,所有卷积层包括一个卷积层以及其后的一个ReLU层,ReLU激活函数的表达式是ReLU(x)=max(0,x),其中x表示卷积层的输出。4.根据权利要求3所述的基于卷积神经网络的图像识别方法,其特征在于,步骤c中,为了减少子网络输入与原始图像输入之间的误差,卷积神经网络结构中的第一个卷积层采用3×3的卷积核,步长为1,卷积层提取出的特征映射的大小为((W-F)/S)+1,其中,W是输入的大小,F是卷积核的大小,S是步长;所述池化层的滑动窗口大小为2×2,步长为2,越界时,以0填充,采用最大值的池化方式。5.根据权利要求4所述的基于卷积神经网络的图像识别方法,其特征在于,步骤c中,为了与ReLU层的激活函数对应,卷积层的节点只与前一层的节点相连,每一条相连的线对应一个权重。6.根据权利要求5所述的基于卷积神经网络的图像识别方法,其特征在于,所述卷积层的权值矩阵的初始化采用xavier方法,其初始化方法如下:定义参数所在层的输入维度为n,输出维度为m,那么参数将以均匀分布的方式在的范围内进行初始化。7.根据权利要...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。