【技术实现步骤摘要】
一种基于CNN的深度学习网络RugbyNet的构建方法
[0001]本专利技术属于计算机领域,主要关注卷积神经网络(CNN)识别效率的改进以及汉字图像识别能力的提高。
技术介绍
[0002]卷积神经网络(CNN)是深度学习中的重要算法,广泛应用于图像识别、语音识别以及计算机视觉等领域。目前提高CNN网络效率主要有两类手段,一类是在CNN网络结构上的改进;另外一类是CNN网络关键处理函数的改进。
[0003]本专利技术将在CNN网络的整体结构和关键处理函数两方面结合进行改造,构建了核心的RugbyNet网络,RugbyNet网络有效地提高图像识别的准确性,特别是手写体汉字的图像识别。
技术实现思路
[0004]本专利技术目的是为了提高CNN深度学习网络的学习效率以及汉字的图像识别率。本专利技术给出基于CNN的深度学习网络RugbyNet的构建方法及基于RugbyNet的汉字图像识别方法。
[0005]基于CNN的深度学习网络RugbyNet构建方法包括:对训练集中图像进行归一化处理;采用包含两个 ...
【技术保护点】
【技术特征摘要】
1.一种基于CNN的深度学习网络RugbyNet的构建方法,其特征在于,所述RugbyNet网络的核心由第一至第五卷积块构成,各卷积块依次分别包含两个卷积、三个卷积、四个卷积、三个卷积和两个卷积,整个网络形状如橄榄球,因此称为“RugbyNet网络”;所述构建方法包括具体步骤如下:第1、准备原始训练图像数据集;第2、对原始训练图像数据集中所有图像进行归一化预处理;第3、读取一张未训练图像为当前图像,并获取当前图像的目标值;第4、针对第3步的当前图像采用包含两个卷积的“第一卷积块”处理并池化来提取出第一特征图;第5、针对第4步输出的第一特征图,进一步采用包含三个卷积的“第二卷积块”处理并池化来提取出第二特征图;第6、针对第5步输出的第二特征图,进一步采用包含四个卷积的“第三卷积块”处理并池化来提取出第三特征图;第7、针对第6步输出的第三特征图,进一步采用包含三个卷积的“第四卷积块”处理并池化来提取出第四特征图;第8、针对第7步输出的第四特征图,进一步采用包含两个卷积的“第五卷积块”处理来提取出第五特征图;第9、针对第8步输出的第五特征图,经过GWAP层处理得到1*1*C大小的特征向量,GWAP()函数的公式为:其中,H、W、C分别表示第五特征图的高、宽和通道数,F表示输入第五特征图,x
ijk
表示输入第五特征图的第k层第i行第j列元素,w
ijk
为三维可训练内核,w
ijk
的形状大小与特征图大小相同;第10、针对第9步输出的特征向量,进一步经过Softmax层处理获得1*K大小的图像分类向量S即称分类向量S为真实值,Softmax层处理函数公式为:其中,Z
i
表示第i个神经元的加权输出值,K表示分类层输出神经元的个数即图像分类的类别个数,S
i
的取值范围在[0,1]之间;第11、通过损失函数J来计算图像分类的目标值与真实值的“偏量”,J()函数的公式为:其中,x表示当前图像,y表示第3步中的目标值,表示第10步计算出来的分类向量S即真实值,N为原始训练图像数据集中图像总数;第12、判断第11步中的“偏量”是否在允许范围内,若不在允许范围内,则执行第13步,
否则,执行第15步;第13、计算并更新RugbyNet网络层中神经元之间的连接参数的新权值,其中,表示第l层中神经元m与第l
‑
1层中第i个神经元连接参数的权值,RugbyNet网络中网络层数量L为RugbyNet网络中所有卷积块中的卷积数量、GWAP层数量和Softmax层数量之和,RugbyNet网络中每一层神经元个数C为其输出特征图三维大小的乘积数,l代表中RugbyNet网络中第l个网络层,l的取值为1到L,m的取值为1到C,i的取值为1到C,RugbyNet网络中的所有统称为“RugbyNet网络模型参数”,即,即,即采用如下公式来更新自己的权值为:其中,α表示(0,1)之间的常数,J为第11步中计算出来的损失函数;第14、判断是否所有图像都训练完成,若否则执行第3步,否则执行第15步;第15、保存第13步中“RugbyNet网络模型参数”,即第16、程序执行结束。2.根据权利要求1所述的构建方法,其特征在于,所述RugbyNet网络的各卷积块中的卷积可采用如下公式:其中,a
d,i,j
表示特征图的第d层第i行第j列像素;x
d,i,j
表示图像的第d层第i行第j列元素;w
d,m,n
表示滤波器的第d层第m行第n列权重;w
b
表示滤波器的偏置项;D表示图像的深度;F
W
、F
H
分别表示滤波器的宽度和高度,两者相同;f
r
()为激活函数,可采用ReLU激活函数,即f
r
(x)=max(0,x);f
e
()为随机扰动函数,f
e
()定义为f
e
(x,T)=x*(RandN(0,T)>0?1,0)其中,RandN()为0到T之间的随机整数,T为用户可设置的最大正整数,从而来调节f
e
()函数取值0和1的概率,T一般小于等于1000。3.根据权利要求1所述的构建方法,其特征在于,第13步所述的“RugbyNet网络层中神经元之间的连接参数的新权值”的公式还可以为:其中,α为0到1之间的常数,函数RandD(0,β)的值为0到β之间的随机小数,β为用户可设置的最大小数,β一般小于等于1。4.根据权利要求1所述的构建方法,其特征在于,在第2步所述的“对原始训练图像数据集中所有图像进行归一化预处理”之后,还可以对图像进行数据增强处理,从而获得更多的训练图像样本。5.一种基于RugbyNet网络的图像分类识别方法,其特征在于,所述RugbyNet网络为权利要求1所述的“RugbyNet网络”、并采用权利要求1所述的构建方法得到的“RubgyNet网络模型参数”,所述方法包括具体步骤如下:
第1、装载权利要求1中第15步所保存的“RubgyNet网络模型参数”,即,即第2、准备测试图像数据集;第3、读取一张待测试图像为当前图像;第4、对第3步中当前图像进行归一化预处理;第5、针对第4步的当前图像采用包含两个卷积的“第一卷积块”处理并池化来提取出第一特征图;第6、针对第5步输出的第一特征图,进一步采用包含三个卷积的“第二卷积块”处理并池化来提取出第二特征图;第7、针对第6步输出的第二特征图,进一步采用包含四个卷积的“第三卷积块”处理并池化来提取出第三特征图;第8、针对第7步输出的第三特征图,进一步采用包含三个卷积的“第四卷积块”处理并池化来提取出第四特征图;第9、针对第8步输出的第四特征图,进一步采用包含两个卷积的“第五卷积块”处理来提取出第五特征图;第10、针对第9步输出的第五特征图,经过GWAP层处理得到1*1*C大小的特征向量,GWAP()函数的公式为:其中,H、W、C分别表示第五特征图的高、宽和通道数,F表示输入第五特征图,x
ijk
表示输入第五特征图的第k层第i行第j列元素,w
ijk
为三维可训练内核,w
ijk
的形状大小与特征图大小相同;第11、针对第10步输出的特征向量,进一步经过Softmax层处理获得1*K大小的图像分类向量S即称分类向量S为真实值,Softmax层处理函数公式为:其中,Zi表示第i个神经元的加权输出值,K表示分类层输出神经元的个数即图像分类的类别个数,Si的取值范围在[0,1]之间;第12、输出当前图像分类的真实值S;第13、判断是否所有图像都测试完成,若否则执行步骤3,否则执行步骤14;第14、程序执行结束。6.一种基于Rugby...
【专利技术属性】
技术研发人员:李旭东,张海洋,黄永科,王静一,黄辉辉,张玉志,
申请(专利权)人:南开大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。