【技术实现步骤摘要】
一种基于卷积神经网络图像识别方法
本专利技术属于涉及深度学习,图像识别技术,具体的来讲为一种基于卷积神经网络图像识别方法。
技术介绍
自1985年Rumelhart和他的同时发展了学习算法以来,在世界范围内掀起了探索和研究神经网络的热潮,人工神经网络的发展已经渗透到个中研究领域,尤其在模式识别的图像分类技术方面应用逐渐增多,国内外研究较多的有字符识别技术、车牌识别技术、脸部识别技术、各种纸币识别技术、印章识别技术以及对一些军事目标的识别等方面。人工神经网络在完成图像识别任务时,主要有以下几个方面的问题:(1)参数数量太多,在CIFAR-10(一个比赛数据集)中,图像只有大小为32x32x3(32宽,32高,3色通道),因此在正常神经网络的第一隐藏层中的单个完全连接的神经元将具有32x32x3=3072个权重。这个数量仍然是可控的,但显然这个完全连接的结构不会扩大到更大的图像。例如,一个更可观的大小的图像,例如200x200x3的图像,则会导致120,000个权重的神经元。此外,我们几乎肯定会有几个这样的神经元,所以参 ...
【技术保护点】
1.一种基于卷积神经网络图像识别方法,其特征在于,该方法包括:/n步骤1,将原始图片采用卷积神经网络进行模型训练;/n步骤2,将待处理图片输入到训练好的模型,进行图片的识别。/n
【技术特征摘要】
1.一种基于卷积神经网络图像识别方法,其特征在于,该方法包括:
步骤1,将原始图片采用卷积神经网络进行模型训练;
步骤2,将待处理图片输入到训练好的模型,进行图片的识别。
2.按照权利要求1所述方法,其特征在于:所述步骤2采用卷积神经网络进行模型训练包括:通过卷积层初步提取图像特征;通过下采样层提取主要特征;通过全连接层将各部分特征汇总;产生分类器,进行预测识别;
具体包括:
步骤11:对卷积神经网络进行权值的初始化;
步骤12:对输入的图片数据经过卷积层、下采样层、全连接层的向前传播得到输出值;每一层输出的特征如下:
其中,y(l)是卷积层的输出,f(x)是非线性的激活函数,m是输入该层的特征图集,是该层卷积核的权值,是卷积运算,是卷积层输入的特征向量,bl是偏置;
步骤13:求出卷积神经网络的输出值与目标值之间的误差;当卷积神经网络输出的结果与期望值不相符时,则进行反向传播过程;求出结果与期望值的误差,再将误差一层一层的返回,计算出每一层的误差,然后进行权值更新;通过训练样本和期望值来调整网络权值;
通过前向传播对样本的预测与卷积神经网络期望值的输出来确定模型内部的参数;定义卷积神经网络的目标函数:
其中,L(x)为损失函数,m为样本数,为期望输出,y为样本输出。应用梯度下降法对神经网络里每一层的参数w和b求偏导,得到更新之后的卷积神经网络参数值,让实际的卷积神经网络输出更加接近期望值;
步骤14:当误差大于期望值时,将误差传回卷积神经网络中,依次求得全连接层,下采样层,卷积层的误差;当误差等于或小于期望值时,结束训练;
步骤15:根据求得误差判断权值是否为最优,如果不是则进行权值更新;
步骤16:判断是否完成epoch次数,如果已...
【专利技术属性】
技术研发人员:刘航,白仞祥,张玉红,菅秀凯,刘鸣泰,
申请(专利权)人:吉林建筑大学,
类型:发明
国别省市:吉林;22
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。